脱氢酶催化的FDCA的产生的制作方法

文档序号:11331750阅读:1097来源:国知局
脱氢酶催化的FDCA的产生的制造方法与工艺

发明领域

本发明涉及酶学、分子遗传学、生物转化和发酵技术领域。特别地,本发明涉及将5-(羟甲基)-2-糠酸氧化为5-甲酰-2-糠酸的脱氢酶,及涉及编码这种脱氢酶的多核苷酸及其在羟甲基糖醛至2,5-呋喃二羧酸的生物转化中的应用。

发明背景

2,5-呋喃二羧酸(fdca)是一种单体化合物,其可以用于产生具有巨大经济影响的聚酯。在该领域中一个非常重要的化合物是聚对苯二甲酸乙二醇酯(pet),其是从对苯二甲酸(pta)和乙二醇产生的。fdca在聚酯pet中可代替pta,在这种情况中产生聚呋喃二甲酸乙二醇酯(pef)。pef具有在聚酯大市场中代替pet的良好潜力。不仅是因为当其与pet相比时具有更优秀的性质,还因为其可以衍生自可再生原料。fdca可以通过化学(dejongetal2012.in:biobasedmonomers,polymers,andmaterials;smith,p.,etal.;acssymposiumseries;americanchemicalsociety:washington,dc)或者组合的化学-生物途径(wiercksetal2011.applmicrobiolbiotechnol92:1095-1105)从糖产生。在后者的情况中,单体糖如葡萄糖或果糖被化学转化为5-(羟甲基)-2-糠醛(hmf),其随后可以由酶氧化为fdca。

从hmf中产生fdca的生物途径已经基于hmf降解株cupriavidusbasilensishmf14的分离(wierckxetal2010.microbialtechnology3:336-343)而开发。鉴别了编码在c.basilensishmf14中参与hmf降解途径的酶的基因簇及在恶臭假单胞菌(pseudomonasputida)菌株中异源表达相关基因(koopmanetal2010.pnas107:4919-4924),由此获得代谢hmf的能力。降解途径的第一个氧化步骤包括形成5-(羟甲基)-2-糠酸(hmfca),其随之被氧化为5-甲酰-2-糠酸(ffa)及进一步氧化为fdca。在随后的研究中(koopmanetal2010.bioresourcetechnology101:6291-6296及wo2011/026913),仅编码hmf氧化还原酶的c.basilensishmf14的hmfli基因被导入恶臭假单胞菌中。所述氧化还原酶主要对于hmfca作为氧化酶,但是其也可以氧化hmf或ffa。仅hmfli基因的异源表达可以使恶臭假单胞菌从hmf产生fdca。在进一步优化的研究中(wierckxetal2011,supra;及wo2012/064195),两个另外的基因在恶臭假单胞菌中表达,其分别编码hmfca转运蛋白和具有未知特异性的醛脱氢酶。

然而,从hmf产生fdca的氧化酶催化途径与脱氢酶催化途径相比具有一些固有的缺点,包括至少产生毒性h2o2、缺少从氧化步骤获得能量和不佳的o2亲和性及相关的系统高需氧量。因此,本发明的目的是通过提供用于从呋喃前体如hmf产生fdca的新的脱氢酶催化途径的手段和方法,以及提供在这种方法中使用新的hmfca转运蛋白的手段和方法,从而解决上述这些缺点。

发明概述

在第一方面,本发明涉及包含表达核苷酸序列的表达构建体的细胞,所述核苷酸序列编码具有与seqidno:1-11任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将5-羟甲基-2-呋喃羧酸(hmfca)氧化为5-甲酰-2-糠酸(ffa)的能力。优选地,所述细胞进一步具有:a)醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸,其中优选所述细胞包含第二表达构建体,表达编码包含与seqidno:24、25、26、27、28、29和30任一氨基酸序列具有至少45%相同性的氨基酸序列的醛脱氢酶的核苷酸序列,其中第二表达构建体可以在细胞中表达,及与没有第二表达构建体的相应野生型细胞相比,所述醛脱氢酶的表达赋予所述细胞或增加所述细胞中如下至少一种能力:i)将5-羟甲基糠醛(hmf)氧化为hmfca,ii)将dff氧化为ffa,及iii)将ffa氧化为fdca;及b)将呋喃化合物转运进/转运出细胞的能力,其中优选所述细胞包含第三表达构建体以表达编码具有将至少fdvifca转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与seqidno:17、31、32、33和34任一氨基酸序列具有至少45%相同性的氨基酸序列,其中第三表达构建体可以在细胞中表达,及与没有第三表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少fdvifca转运进细胞的能力。

另一方面,本发明涉及包含表达编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列的表达构建体的细胞,所述多肽包含与seqidno:17氨基酸序列具有至少86.5%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达至少赋予所述细胞或增加所述细胞中将至少hmfca转运进细胞的能力,及其中所述细胞进一步包含将hmf转变为fdca的酶,其中将hmf转变为fdca的酶优选包括如下至少一种:a)醇脱氢酶,其将hmfca氧化为ffa及醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸;及b)氧化还原酶,其将hmf、2,5-二羟甲基呋喃、hmfca、ffa和2,5-二甲酰呋喃的一或多种氧化为fdca,及任选存在的醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸。

本发明的细胞优选是微生物细胞,如细菌、酵母或丝状真菌细胞。本发明的酵母或丝状真菌细胞优选选自如下属:假丝酵母属(candida)、汉逊酵母属(hansenula)、克鲁维酵母菌属(kluyveromyces)、毕赤酵母属(pichia)、酵母菌属(saccharomyces)、裂殖酵母属(schizosaccharomyces)、耶氏酵母属(yarrowia)、支顶孢属(acremonium)、伞菌属(agaricus)、曲霉属(aspergillus)、短梗霉属(aureobasidium)、毁丝霉属(myceliophthora)、金孢子菌属(chrysosporium)、鬼伞属(coprinus)、隐球菌属(cryptococcus)、filibasidium、镰刀菌属(fusarium)、腐殖霉属(humicola)、稻瘟菌属(magnaporthe)、毛霉菌属(mucor)、毁丝霉属(myceliophthora)、新丽鞭毛菌属(neocallimastix)、脉孢菌属(neurospora)、拟青霉属(paecilomyces)、青霉菌属(penicillium)、梨囊鞭菌属(piromyces)、原毛平革菌属(panerochaete)、侧耳属(pleurotus)、裂褶菌属(schizophyllum)、踝节菌属(talaromyces)、热子囊菌属(thermoascus)、梭孢壳属(thielavia)、弯颈霉属(tolypocladium)和木霉属(trichoderma),最优选酵母或丝状真菌细胞选自如下种:乳酸克鲁维酵母(kluyveromyceslactis)、酿酒酵母(s.cerevisiae)、多形汉逊酵母(hansenulapolymorpha)、解脂耶氏酵母(yarrowialipolytica)、巴斯德毕赤酵母(pichiapastoris)、黑曲霉(aspergillusniger)、泡盛曲霉(aspergillusawamori)、臭曲霉(aspergillusfoetidus)、酱油曲霉(aspergillussojae)、烟曲霉(aspergillusfumigatus)、埃默森踝节菌(talaromycesemersonii)、米曲霉(aspergillusoryzae)、嗜热毁丝霉(myceliophthorathermophila)、里氏木霉(trichodermareesei)和产黄青霉菌(penicilliumchrysogenum)。本发明的细菌细胞优选选自如下菌属:埃希氏菌属(escherichia)、鱼腥藻属(anabaena)、aeribacillus、解硫胺素杆菌属(aneurinibacillus)、伯克霍尔德氏菌属(burkholderia)、慢生根瘤菌属(bradyrhizobium)、柄杆菌属(caulobacter)、贪铜菌属(cupriavidus)、脱硫肠状菌属(desulfotomaculum)、desulfurispora、葡糖杆菌属(gluconobacter)、红杆菌属(rhodobacter)、pelotomaculum、假单胞菌属(pseudomonas)、副球菌属(paracoccus)、芽孢杆菌属(bacillus)、地芽孢杆菌属(geobacillus)、短小芽孢杆菌属(brevibacillus)、短杆菌属(brevibacterium)、棒杆菌属(corynebacterium)、根瘤菌属(rhizobium(中华根瘤菌属(sinorhizobium))、黄杆菌属(flavobacterium)、克雷伯氏菌属(klebsiella)、肠杆菌属(enterobacter)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、甲基杆菌属(methylobacterium)、罗尔斯通氏菌属(ralstonia)、红假单胞菌属(rhodopseudomonas)、葡萄球菌属(staphylococcus)及链霉菌属(streptomyces),更优选细菌细胞选自如下菌种:a.pallidus、a.terranovensis、枯草芽孢杆菌(b.subtilis)、解淀粉芽孢杆菌(b.amyloliquefaciens)、凝结芽孢杆菌(b.coagulans)、克里不所类芽孢杆菌(b.kribbensis)、地衣芽孢杆菌(b.licheniformis)、b.puntis、巨大芽孢杆菌(b.megaterium)、耐盐芽孢杆菌(b.halodurans)、短小芽孢杆菌(b.pumilus)、热红短小芽孢杆菌(b.thermoruber)、b.panacihumi、c.basilensis、库氏脱硫肠状菌(d.kuznetsovii)、d.thermophila、嗜热地芽孢杆菌(g.kaustophilus)、氧化葡糖杆菌(gluconobacteroxydans)、新月柄杆菌(caulobactercrescentus)cb15、扭托甲基杆菌(methylobacteriumextorquens)、类球红细菌(rhodobactersphaeroides)、pelotomaculumthermopropionicum、pseudomonaszeaxanthinifaciens、恶臭假单胞菌、paracoccusdenitrificans、大肠杆菌(e.coli)、谷氨酸棒杆菌(c.glutamicum)、肉葡萄球菌(staphylococcuscarnosus)、变铅青链霉菌(streptomyceslividans)、苜蓿中华根瘤菌(sinorhizobiummelioti)和rhizobiumradiobacter。

再一方面,本发明涉及一种制备具有如以上方面定义的hmfca脱氢酶活性的多肽和/或制备具有如以上方面定义的呋喃化合物转运能力的多肽的方法。所述方法优选包括在有益于一或多种多肽表达的条件下培养如上述方面定义的细胞及任选回收所述一或多种多肽的步骤。

另一方面,本发明涉及将hmfca氧化为ffa的方法,所述方法包括在存在hmfca条件下、优选在有益于细胞氧化hmfca的条件下孵育上述任一方面定义的细胞的步骤。

再一方面,本发明涉及一种产生fdca的方法,所述方法包括在包含fdca的一或多个呋喃前体的培养基中孵育上述任一方面的细胞的步骤,优选在有益于细胞将fdca的呋喃前体氧化为fdca的条件下进行,及任选包括回收fdca,其中优选fdca的至少一个呋喃前体选自hmf、2,5-二羟甲基呋喃(dhf或hmf-oh)、hmfca、ffa和2,5-二甲酰呋喃(dff),最优选fdvif,其中fdca的呋喃前体得自一或多种己糖,优选得自木质纤维素生物质的一或多种己糖,优选通过酸催化的脱水获得,及其中优选通过包括酸或盐沉淀及随后冷却结晶和/或溶剂提取的方法从所述培养基中回收fdca。

再一方面,本发明涉及一种从一或多个fdca单体产生聚合物的方法,所述方法包括如下步骤:a)在根据上述方面的方法中制备fdca单体;及从在a)中获得的fdca单体产生聚合物。

本发明还涉及使用上述任何方面的细胞将fdca的一或多种呋喃前体经生物转化为fdca,其中优选fdca的至少一种呋喃前体选自hmf、dhf、hmfca、ffa和dff,最优选hmf。

另一方面,本发明涉及具有hmfca脱氢酶活性的多肽,所述多肽包含与seqidno:1所示氨基酸序列具有至少81.85%序列相同性的氨基酸序列。在这个方面,本发明还涉及包含如下至少一个序列的核酸分子:a)编码具有hmfca脱氢酶活性的多肽的核苷酸序列,所述多肽包含与seqidno:1所示氨基酸序列具有至少81.85%序列相同性的氨基酸序列;b)seqidno:12或13所示核苷酸序列;c)如(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;d)序列由于遗传密码的简并而与b)或c)的核苷酸序列不同的核苷酸序列;及e)是a)-c)定义的核苷酸序列的反向补体的核苷酸序列,其中优选所述核酸分子是载体。在这个方面,本发明进一步涉及包含本方面的多肽和本方面的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。

在最后一方面,本发明涉及具有将至少hmfca转运进细胞的能力的多肽,所述多肽包含与seqidno:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列。在这个方面,本发明还涉及核酸分子,其包含如下至少一个序列:a)编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与seqidno:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列;b)seqidno:18所示核苷酸序列;c)(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;d)序列由于遗传密码简并而与b)或c)的核苷酸序列不同的核苷酸序列;及e)是a)-d)定义的核苷酸序列的反向补体的核苷酸序列,其中优选所述核酸分子是载体。在这个方面中,本发明进一步涉及包含本方面的多肽和本方面的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。

发明描述

定义

术语“同源性”、“序列相同性”等在本文可互换使用。序列相同性在本文定义为通过序列对比确定的两或更多个氨基酸(多肽或蛋白质)序列或者两或更多个核酸(多核苷酸)序列之间的关系。在本领域中,“相同性”还是指氨基酸或核酸序列之间的序列相关性的程度,可以通过这种序列串之间的匹配确定。两个氨基酸序列之间的“相似性”是通过对比氨基酸序列及一个多肽至另一个多肽序列的保守氨基酸取代而确定的。“相同性”和“相似性”可易于通过已知方法计算。

“序列相同性”和“序列相似性”可以通过根据两个序列的长度使用整体或局部比对算法比对两个多肽或两个核苷酸序列而确定。相似长度的序列优选使用整体比对算法比对(例如needlemanwunsch),这种方法在全长上最佳比对了序列,而显著不同长度的序列优选使用局部比对算法比对(例如smithwaterman)。然后当其(当最佳比对时,例如使用默认参数的gap或bestfit程序)共有至少一定最小百分比的序列相同性时(如下文定义),可以将所述序列称作“基本相同的”或者“基本相似的”。gap使用needleman和wunsch整体比对算法以在完整长度(全长)比对两个序列,使匹配数最大化及缺口数最小化。整体比对适用于确定当两个序列具有相似长度时的序列相同性。通常,使用gap默认参数,缺口产生罚分=50(核苷酸)/8(蛋白质),缺口延伸罚分=3(核苷酸)/2(蛋白质)。对于核苷酸,使用的默认评分矩阵是nwsgapdna,对于蛋白质,默认评分矩阵是blosum62(henikoff&henikoff,1992,pnas89,915-919)。针对序列相同性百分比的序列比对和评分可以使用计算机程序确定,如gcgwisconsinpackage,version10.3,可得自accelrysinc.(9685scrantonroad,sandiego,ca92121-3752usa),或者使用开源软件如embosswinversion2.10.0中的程序“needle”(使用整体needlemanwunsch算法)或者“water”(使用局部smithwaterman算法),使用与上述gap相同的参数或者使用默认设置(对于“needle”和“water”二者及对于蛋白质和dna比对二者,默认缺口开放罚分是10.0及默认缺口延伸罚分是0.5;默认评分矩阵是blossum62(蛋白质)和dnafull(dna))。当序列的整体长度显著不同时,优选局部比对法如使用smithwaterman算法的那些。

或者,相似性或相同性百分比可以通过使用如fasta、blast等算法搜索公共数据库而确定。因此,本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行公共数据库搜索,以例如鉴别其它家族成员或相关序列。这种搜索可以使用altschul,etal.(1990)j.mol.biol.215:403-10所述blastn和blastx程序(2.0版)进行。blast核苷酸搜索可以使用nblast程序,得分=100,字长=12进行以获得与本发明的氧化还原酶核酸分子同源的核苷酸序列。blast蛋白质搜索可以使用blastx程序,得分=50,字长=3进行以获得与本发明的蛋白质分子同源的氨基酸序列。为了获得缺口比对以进行对比,可以使用如altschuletal.,(1997)nucleicacidsres.25(17):3389-3402所述的gappedblast。当使用blast和gappedblast程序时,可以使用各个程序的默认参数(例如blastx和blastn)。见nationalcenterforbiotechnologyinformation主页http://www.ncbi.nlm.nih.gov/。

任选地,在确定氨基酸相似性程度中,技术人员也可以考虑到所谓的“保守”氨基酸取代,这些为技术人员所已知。保守氨基酸取代是指具有相似侧链的残基的可交换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含有酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,及天冬酰胺-谷氨酰胺。本文揭示的氨基酸序列的取代变体是其中在揭示的序列中至少一个残基已经除去且在此位置插入一个不同残基的那些。优选地,所述氨基酸改变是保守的。优选的每个天然发生的氨基酸的保守取代如下所示:ala至ser,arg至lys,asn至gln或his,asp至glu,cys至ser或ala,gln至asn,glu至asp,gly至pro,his至asn或gln,ile至leu或val,leu至ile或val,lys至arg,gln至glu,met至leu或ile,phe至met,leu至tyr,ser至thr,thr至ser,trp至tyr,tyr至trp或phe,及val至ile或leu。

如本文所用,术语“选择性杂交”等相似用语是描述杂交和洗涤条件,在此条件下彼此至少66%、至少70%、至少75%、至少80%、优选至少85%、更优选至少90%、优选至少95%、更优选至少98%或更优选至少99%同源的核苷酸序列典型保持彼此杂交。也就是说,这种杂交序列可共有至少45%、至少50%、至少55%、至少60%、至少65、至少70%、至少75%、至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少98%或更优选至少99%序列相同性。

优选的非限制性的这种杂交条件例如是在6×氯化钠/柠檬酸钠(ssc)中在大约45℃杂交,随后在1×ssc、0.1%sds中在大约50℃、优选大约55℃、优选大约60℃及更优选大约65℃进行一或多次洗涤。

高度严格条件包括例如在5×ssc/5×denhardt's溶液/1.0%sds中在大约68℃杂交及在0.2×ssc/0.1%sds中在室温洗涤。或者,洗涤可以在42℃进行。

技术人员已知哪种条件应用于严格和高度严格杂交条件。关于这种条件的其它指导在本领域可易于获得,例如见于sambrooketal.,1989,molecularcloning,alaboratorymanual,coldspringharborpress,n.y.;及ausubeletal.(eds.),sambrookandrussell(2001)"molecularcloning:alaboratorymanual(3rdedition),coldspringharborlaboratory,coldspringharborlaboratorypress,newyork1995,currentprotocolsinmolecularbiology,(johnwiley&sons,n.y.)。

当然,仅与聚a序列(如mrna的3’末端poly(a))或者t(或u)残基的互补节段序列杂交的多核苷酸不包含在用于特异性杂交本发明核酸一部分的本发明的多核苷酸中,因为这种多核苷酸将与含有poly(a)节段序列或其补体(例如实际上任何双链cdna克隆)的任何核酸分子杂交。

“核酸构建体”或者“核酸载体”在本文应理解为是指使用重组dna技术获得的人工核酸分子。术语“核酸构建体”因此不包括天然发生的核酸分子,尽管核酸构建体可包含(部分)天然发生的核酸分子。术语“表达载体”或者“表达构建体”是指能影响基因在与这种序列相容的宿主细胞或宿主生物体中表达的核苷酸序列。这些表达载体典型包括至少合适的转录调节序列及任选包括3’转录终止信号。也可以存在实现表达必需的或者有益的其它因子,如表达增强子元件。表达载体将被导入合适的宿主细胞中并能在宿主细胞中和体外细胞培养物中实现编码序列的表达。表达载体适于在本发明的宿主细胞或生物体中复制。

如本文所用,术语“启动子”或者“转录调节序列”是指发挥控制一或多个编码序列转录的核酸片段,其位于编码序列的转录起始位点的转录方向上游,通过存在dna依赖性rna聚合酶的结合位点、转录起始位点及任何其它dna序列包括但不限于转录因子结合位点、阻抑物和激活物蛋白质结合位点及本领域技术人员已知的直接或间接调节从启动子的转录量的任何其它核苷酸序列而结构性鉴别。“组成型”启动子是在大多数组织中在大多数生理和发育条件下具有活性的启动子。“可诱导”启动子是受生理或发育调节的启动子,例如通过使用化学诱导剂调节。

术语“可选择标记”是本领域技术人员熟知的术语,在本文用于描述任何遗传实体,当其表达时可用于选择含有该选择标记的细胞。术语“报道子”可与标记互换使用,但是其主要用于描述可见标记,如绿色荧光蛋白(gfp)。可选择标记可以是显性或隐性或者双向的。

如本文所用,术语“可操纵地连接”是指核苷酸元件的功能关系连接。当核酸与另一核酸序列以功能关系放置时,其是“可操纵地连接的”。例如,如果转录调节序列影响编码序列的转录,则其与编码序列是可操纵地连接的。可操纵地连接是指被连接的dna序列典型是连续的,及在需要时连接连续的及符合读框的两个蛋白质编码区。

术语“蛋白质”或“多肽”可互换使用,是指由氨基酸链组成的分子,不提及特定的作用模式、大小、三维结构或者来源。

术语“基因”是指包含一个区域(转录区)的dna片段,其在细胞中被转录为rna分子(例如mrna),与合适的调节区(例如启动子)可操纵地连接。基因通常包含若干可操纵地连接的片段,如启动子、5’前导序列、编码区及包含聚腺苷酸化位点的3’非翻译序列(3’末端)。“基因的表达”是指其中与合适的调节区、特别是启动子可操纵地连接的dna区被转录为rna(其是生物活性的,即其能翻译为生物活性蛋白或肽)的过程。术语“同源”当用于表示指定(重组)核酸或多肽分子与给定宿主生物体或宿主细胞之间的关系时,应理解为是指事实上所述核酸或多肽分子是由相同物种、优选相同品种或株系的宿主细胞或生物体产生。如果与宿主细胞同源,则编码多肽的核酸序列将典型(但非必需地)与其自然环境中的另一(异源)启动子序列及如果可行则与另一(异源)分泌信号序列和/或终止子序列可操纵地连接。应理解调节序列、信号序列、终止子序列等也可以与宿主细胞同源。在这种情况中,仅使用“同源”序列元件可以构建“自克隆的”遗传修饰的生物体(gmo's)(自克隆在此如europeandirective98/81/ecannexii所述定义)。当用于表示两个核酸序列的关系时,术语“同源”是指一个单链核酸序列可以杂交互补的单链核酸序列。杂交程度可依赖于许多因素,包括序列之间相同性的量及杂交条件如后文讨论的温度和盐浓度。

关于核酸(dna或rna)或蛋白质所用术语“异源”和“外源”是指不是作为其存在于之中的生物体、细胞、基因组或者dna或rna序列的一部分天然发生的核酸或蛋白质,或者是在与其天然发现的细胞或者基因组或dna或rna序列中的位置不同的细胞或位置发现的核酸或蛋白质。异源和外源核酸或蛋白质对于将其导入之中的细胞不是内源的,而是得自另一细胞或合成或重组产生的。通常,虽然不是必需的,这种核酸编码在所述dna在之中被转录或表达的细胞中正常不产生的蛋白质,即外源蛋白质。相似地,外源rna编码在所述外源rna存在于之中的细胞中正常不表达的蛋白质。异源/外源核酸和蛋白质也可以称作外来核酸或蛋白质。本领域技术人员认为对于其在之中表达的细胞是外来的任何核酸或蛋白质在本文由术语异源或外源核酸或蛋白质涵盖。术语异源和外源还用于核酸或氨基酸序列的非天然组合,即其中组合序列的至少两个序列彼此是外来的。

在本文中酶的“比活性”应理解为是指特定酶的活性量/宿主细胞蛋白质总量,通常以酶活性单位/mg宿主总蛋白质表示。在本发明中,特定酶的比活性与所述酶在野生型宿主细胞(其它方面相同的)中的比活性相比可以增加或降低。

“呋喃化合物”是本文应理解为是2,5-呋喃-二羧酸(fdca)以及具有呋喃基团的可被氧化为fdca的任何化合物,后者在本文被称作“fdca的前体”或者“fdca的呋喃前体”。fdca的前体至少包括:5-羟甲基糖醛(hmf)、2,5-二羟甲基呋喃(dhf或hmf-oh)或者2,5-二(羟甲基)呋喃(bhf)、5-羟甲基-2-呋喃羧酸或者5-羟甲基-2-糠酸(hmfca)、5-甲酰-2-糠酸(ffa)和2,5-二甲酰呋喃(dff)。应进一步了解的是在“呋喃化合物”中,呋喃环或者任何或其可取代的侧基可以在呋喃环中任何可利用的位置例如用oh、c1-c10烷基、烷基、烯丙基、芳基或者ro-醚组分、包括环形基团取代。

本文中在公共序列数据库中可获得的任何提及的核苷酸或氨基酸序列是指在本文件的提交日期可获得的序列条目的形式。

发明详述

表达hmfca脱氢酶的细胞

第一方面,本发明涉及具有将5-羟甲基-2-呋喃羧酸(hmfca)氧化为5-甲酰糠酸(ffa)的能力的细胞。将hmfca氧化为ffa的能力优选通过用包含编码具有将hmfca氧化为ffa的能力的脱氢酶的核苷酸序列的核酸构建体转化细胞而赋予所述细胞或者在所述细胞中增加。所述脱氢酶优选是醇脱氢酶(即具有ec1.1活性)。因此,所述细胞优选是包含表达编码具有将hmfca氧化为ffa的能力的脱氢酶的核苷酸序列的表达构建体的细胞。在本发明优选的细胞中,所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,所述脱氢酶的表达优选赋予所述细胞或增加所述细胞中将hmfca氧化为ffa的能力。所述酶将hmfca氧化为ffa的比活性在所述细胞中与在没有所述表达构建体的相应细胞中相比优选增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。

具有将hmfca氧化为ffa的能力的脱氢酶因此是具有hmfca脱氢酶活性的醇脱氢酶。多肽是否具有hmfca脱氢酶活性可以通过将所述多肽在不能将hmfca氧化为ffa的合适宿主细胞中表达并检测所述多肽的表达是否赋予细胞将hmfca氧化为ffa的能力而测定。优选地,如本发明实施例iv所述测定hmfca脱氢酶活性,由此编码待测定hmfca脱氢酶活性的多肽的核苷酸序列替代pbt'hmfh-adh中的c.basilensishmfh基因(在wo2012/064195中描述),之后将包含待测定hmfca脱氢酶活性的多肽的编码序列的质粒导入含有pjnnhmft1(t)的恶臭假单胞菌kt2440agcd(在wo2012064195中描述)。将表达待测定hmfca脱氢酶活性的多肽的恶臭假单胞菌转化体与hmp一起孵育,定期取样品进行fdca分析。与没有待测定hmfca脱氢酶活性的多肽(及hmfh基因)的相应恶臭假单胞菌转化体相比,fdca产量增加表示所述多肽具有hmfca脱氢酶活性。

在本发明的细胞中表达的hmfca脱氢酶优选是依赖于辅因子的脱氢酶,所述辅因子选自腺嘌呤二核苷酸,如nadh或nadph,黄素腺嘌呤二核苷酸(fad),黄素单核苷酸(fmn)及吡咯喹啉喹诺酮(pqq)。

在本发明的细胞中表达的fevifca脱氢酶进一步优选是醇脱氢酶,其(也)具有将其它呋喃醇、优选在第2位具有羟基基团的呋喃醇氧化为相应醛的能力。因此,fevifca脱氢酶优选具有将5-羟甲基糠醛(hmf)氧化为2,5-二甲酰呋喃(dff)的能力。

在一个实施方案中,编码具有将fevifca氧化为ffa的能力的脱氢酶的核苷酸序列选自:

(a)编码具有fevifca脱氢酶活性的多肽的核苷酸序列,所述多肽包含与seqidno:1(aeribacilluspallidus)、seqidno:2(克里不所类芽孢杆菌)、seqidno:3(嗜热地芽孢杆菌)、seqidno:4(aneurinibacillusterranovensis)、seqidno:5(热红短小芽孢杆菌(brevibacillusthermoruber))、seqidno:6(brevibacilluspanacihumi)、seqidno:7(芽孢杆菌fjat-14578)、seqidno:8(库氏脱硫肠状菌)、seqidno:9(desulfurisporathermophila)、seqidno:10(芽孢杆菌l1(2012))和seqidno:11(pelotomaculumthermopropionicum)任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列;

(b)互补链与(a)的核苷酸序列杂交的核苷酸序列;及

(c)序列由于遗传密码简并而与(b)的核苷酸序列不同的核苷酸序列。

本发明优选的核苷酸序列因此编码这样的fevifca脱氢酶,所述脱氢酶具有与可得自(或者天然发生于其中)芽孢杆菌目或梭菌目的细菌的fevifca脱氢酶相同的氨基酸序列。在一个优选的实施方案中,所述细菌是芽孢杆菌科,更优选所述细菌是aeribacillus、地芽孢杆菌属和芽孢杆菌属,最优选是aeribacilluspallidus、克里不所类芽孢杆菌、嗜热地芽孢杆菌、aneurinibacillusterranovensis、芽孢杆菌fjat-14578和芽孢杆菌l1(2012)菌种。在另一优选的实施方案中,所述细菌是类芽孢杆菌科细菌,优选解硫胺素杆菌属和短小芽孢杆菌属菌属,最优选aneurinibacillusterranovensis、热红短小芽孢杆菌和brevibacilluspanacihumi菌种。在再一个优选的实施方案中,所述细菌是消化球菌科细菌,优选脱硫肠状菌属、desulfurispora和pelotomaculum菌属,最优选库氏脱硫肠状菌、desulfurisporathermophila和pelotomaculumthermopropionicum菌种。

在一个实施方案中,本发明优选的核苷酸序列编码来自嗜常温菌的hmfca脱氢酶,即在适中温度、典型在20-45℃最佳生长的细菌。优选地,本发明的核苷酸序列编码嗜常温hmfca脱氢酶,其在20-45℃范围具有最佳活性和稳定性。举例的这种嗜常温脱氢酶是例如来自克里不所类芽孢杆菌(30℃)、aneurinibacillusterranovensis(40℃)、热红短小芽孢杆菌(45℃)、brevibacilluspanacihumi(30℃)、芽孢杆菌fjat-14578(30℃)和芽孢杆菌l1(2012)(30-50℃)的脱氢酶及其相关脱氢酶。

在一个实施方案中,本发明的优选核苷酸序列编码来自嗜热细菌的hmfca脱氢酶,即在相对高温、典型在高于45-122℃最佳生长的细菌。优选地,本发明的核苷酸序列因此编码嗜热hmfca脱氢酶,其在高于45℃-122℃具有最佳活性和稳定性。举例的这种嗜热脱氢酶是例如来自aeribacilluspallidus(55℃)、嗜热地芽孢杆菌(55℃)、库氏脱硫肠状菌(60℃)、desulfurisporathermophila(50℃)、pelotomaculumthermopropionicum(55℃)和芽孢杆菌l1(2012)(30-50℃)的脱氢酶及其相关脱氢酶。

在一个实施方案中,所述核苷酸序列编码是天然发生的具有hmfca脱氢酶活性的多肽,例如其可以分离自野生型来源生物体。或者,所述核苷酸序列可以编码工程化形式的上文定义的任何hmfca脱氢酶,其与相应天然发生的hmfca脱氢酶相比包含一或多个氨基酸取代、插入和/或缺失,但是仍在本文定义的相同性或相似性范围内。因此,在一个实施方案中,本发明的核苷酸序列编码hmfca脱氢酶,其氨基酸序列在每个不变位置(在表2中用“*”表示)至少包含在不变位置存在的氨基酸。优选地,氨基酸序列在强保守位置(在表2中用“:”表示)也包含在强保守位置存在的氨基酸之一。更优选地,所述氨基酸序列进一步在低强度保守位置(在表2中用“.”表示)还包含在低强度保守位置存在的氨基酸之一。这些不变和保守位置之外的氨基酸取代不太可能影响hmfca脱氢酶活性。

本发明的编码具有hmfca脱氢酶活性的多肽的核苷酸序列通过使用本领域熟知的分离核苷酸序列的方法可得自真菌、酵母或细菌的基因组和/或cdna,例如与上述来源生物体属于相同的门、纲或者属(见例如sambrookandrussell(2001)"molecularcloning:alaboratorymanual(3rdedition),coldspringharborlaboratory,coldspringharborlaboratorypress,newyork)。本发明的核苷酸序列例如可以在这样的方法中获得,其中a)对合适生物体的基因组和/或cdna使用简并pcr引物(基于保守氨基酸序列设计)以产生包含编码具有hmfca脱氢酶活性的多肽的核苷酸序列的一部分的pcr片段;b)在a)中获得的pcr片段用作探针筛选所述生物体的cdna和/或基因组文库;及c)产生包含编码具有hmfca脱氢酶活性的多肽的核苷酸序列的cdna或基因组dna。

为了增加本发明的hmfca脱氢酶在本发明转化的细胞中以足够水平及活性形式表达的可能性,优选调适编码这些酶以及本发明的其它酶(见下文)的核苷酸序列以将其密码子使用优化为在讨论的宿主细胞中的密码子使用。编码多肽的核苷酸序列对于宿主细胞的密码子使用的适应性可以用密码子适应指数(cai)表示。密码子适应指数在本文定义为测量基因的密码子使用相对于在特定宿主细胞或生物体中高表达基因的密码子使用的相对适应性。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸最丰富的密码子的使用的比率。cai指数定义为这些相对适应性值的几何平均数。除外非同义密码子和终止密码子(根据遗传密码而定)。cai值范围是0-1,较高数值表示较高比例的最丰富密码子(见sharpandli,1987,nucleicacidsresearch15:1281-1295;也见jansenetal.,2003,nucleicacidsres.31(8):2242-51)。经调适的核苷酸序列优选cai为至少0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。最优选是seqidno:13或14所示序列,其已经经过密码子优化以在恶臭假单胞菌细胞中表达。

用核酸构建体转化以表达编码本发明hmfca脱氢酶的核苷酸序列的宿主细胞原则上可以是任何宿主细胞,其中本发明的hmfca脱氢酶可以适当地表达,优选以功能性即以活性形式表达。本发明的宿主细胞优选是能将呋喃化合物主动或者被动转运进细胞以及转运出细胞的宿主。优选的本发明宿主细胞缺乏或者没有可检测的使羧化的呋喃化合物如特别是hmfca、ffa和fdca脱羧的活性。这种宿主细胞优选天然缺乏使羧化的呋喃化合物脱羧的能力。

优选地,所述宿主细胞是培养的细胞,例如可以在发酵方法、优选在深层发酵中培养的细胞。

根据一个实施方案,本发明的宿主细胞是真核宿主细胞。优选地,所述真核细胞是哺乳动物、昆虫、植物、真菌或者藻类细胞。优选的哺乳动物细胞包括例如中国仓鼠卵巢(cho)细胞、cos细胞、293细胞、perc6细胞和杂交瘤。优选的昆虫细胞包括例如sf9和sf21细胞及其衍生物。

然而,优选宿主细胞是微生物细胞。所述细胞可以是真核微生物细胞,优选真菌细胞,如酵母或丝状真菌细胞。优选的酵母宿主细胞包括例如来自如下酵母属的细胞,如假丝酵母属、汉逊酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属及耶氏酵母属。更优选来自如下酵母种的酵母,如乳酸克鲁维酵母、酿酒酵母、多形汉逊酵母、解脂耶氏酵母和巴斯德毕赤酵母。优选的丝状真菌细胞包括例如如下丝状真菌属的细胞:支顶孢属、伞菌属、曲霉属、短梗霉属、毁丝霉属、金孢子菌属、鬼伞属、隐球菌属、filibasidium、镰刀菌属、腐殖霉属、稻瘟菌属、毛霉菌属、毁丝霉属、新丽鞭毛菌属、脉孢菌属、拟青霉属、青霉菌属、梨囊鞭菌属、原毛平革菌属、侧耳属、裂褶菌属、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属和木霉属。优选的丝状真菌细胞属于如下种:曲霉属、毁丝霉属、青霉菌属、毁丝霉属、踝节菌属或者木霉属,最优选选自如下种:黑曲霉、泡盛曲霉、臭曲霉、酱油曲霉、烟曲霉、埃默森踝节菌、米曲霉、嗜热毁丝霉、里氏木霉和产黄青霉菌。

微生物宿主细胞也可以是原核细胞,优选细菌细胞。属于“细菌细胞”包括革兰氏阴性和革兰氏阳性微生物。合适的细菌可选自埃希氏菌属、鱼腥藻属、aeribacillus、解硫胺素杆菌属、伯克霍尔德氏菌属、慢生根瘤菌属、柄杆菌属、贪铜菌属、脱硫肠状菌属、desulfurispora、葡糖杆菌属、红杆菌属、pelotomaculum、假单胞菌属、副球菌属、芽孢杆菌属、地芽孢杆菌属、短小芽孢杆菌属、短杆菌属、棒杆菌属、根瘤菌属(中华根瘤菌属)、黄杆菌属、克雷伯氏菌属、肠杆菌属、乳杆菌属、乳球菌属、甲基杆菌属、罗尔斯通氏菌属、红假单胞菌属、葡萄球菌属和链霉菌属。优选地,细菌细胞选自如下菌种:a.pallidus、a.terranovensis、枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、克里不所类芽孢杆菌、地衣芽孢杆菌、b.puntis、巨大芽孢杆菌、耐盐芽孢杆菌、短小芽孢杆菌、热红短小芽孢杆菌、b.panacihumi、c.basilensis、库氏脱硫肠状菌、d.thermophila、嗜热地芽孢杆菌、氧化葡糖杆菌、新月柄杆菌cb15、扭托甲基杆菌、类球红细菌、pelotomaculumthermopropionicum、pseudomonaszeaxanthinifaciens、恶臭假单胞菌、paracoccusdenitrificans、大肠杆菌、谷氨酸棒杆菌、肉葡萄球菌、变铅青链霉菌、苜蓿中华根瘤菌和rhizobiumradiobacter。在恶臭假单胞菌菌种中,优选恶臭假单胞菌s12和恶臭假单胞菌kt2440菌株。

对于在本发明宿主细胞中产生的化合物的特异性应用,可以根据这种应用选择宿主细胞。在其中例如在本发明的宿主细胞中产生的化合物用于食品应用时,宿主细胞可选自食品级生物体如酿酒酵母。特异性应用包括但不限于食品、(动物)饲料、药物、农业如作物保护,和/或个人护理应用。

表达编码本发明hmfca脱氢酶的核苷酸序列的表达构建体优选是与用所述构建体转化的宿主细胞异源或外源的表达构建体。当构建体包含不是在宿主细胞中天然发生的至少一个序列或序列元件和/或构建体包含不是在宿主细胞中天然发生的组合和/或顺序的至少两个序列元件时,即使所述元件自身在宿主细胞中天然发生,所述构建体在本文应理解为对于包含所述构建体的宿主细胞是异源或外源的。

在适当宿主细胞中表达编码本发明fdvifca脱氢酶的核苷酸序列的载体和表达构建体在下文更详细描述。

表达本发明的fdvifca脱氢酶的转化的细胞进一步优选具有醛脱氢酶活性(即具有ec1.2活性)。优选地,醛脱氢酶活性能转化呋喃醛。更优选地,醛脱氢酶活性能将呋喃醛氧化为相应呋喃羧酸。更特别地,醛脱氢酶活性优选能够进行如下至少之一:i)将hmf氧化为hmfca,ii)将2,5-二甲酰呋喃(dff)氧化为5-甲酰-2-糠酸(ffa),及iii)将ffa变为fdca。这种呋喃醛脱氢酶活性可以是细胞的内源活性,或者可以是赋予细胞的外源活性。优选地,通过用第二表达构建体转化细胞赋予或者增加细胞的呋喃脱氢酶活性。在本发明优选的细胞中,第二表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,呋喃醛脱氢酶的表达优选赋予所述细胞或增加所述细胞中i)将hmf氧化为hmfca、ii)将dff氧化为ffa及iii)将ffa氧化为fdca中至少之一的能力。呋喃醛脱氢酶的比活性在所述细胞中与没有所述表达构建体的相应细胞相比优选增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。第二表达构建体优选包含编码多肽的核苷酸序列,所述多肽:

a)具有i)将hmf氧化为hmfca、ii)将dff氧化为ffa及iii)将ffa氧化为fdca的能力至少之一;及

b)包含与seqidno:24、25、26、27、28、29和30任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列。

多肽将i)hmf氧化为hmfca、ii)将dff氧化为ffa及iii)将ffa氧化为fdca的至少之一的能力可以通过在恶臭假单胞菌宿主细胞、优选恶臭假单胞菌kt2440宿主细胞中将编码所述多肽的核苷酸序列与来自c.basilensishmf14的hmfh和hmft1基因一起共表达而测定,将恶臭假单胞菌细胞在10mmfdvif中孵育并检测与不表达所述多肽的相应恶臭假单胞菌细胞相比fdca累积的增加情况,例如wo2012/064195的实施例iv所述。多肽将hmf氧化为hmfca的能力也可以如koopmanetal2010,pnas(supra)所述测定。表达来自c.basilensishmf14的hmft1基因的菌株在本文应理解为表达具有seqidno:31所示氨基酸序列的基因产物。

表达本发明的hmfca脱氢酶的转化的细胞进一步优选具有将呋喃化合物转运进和/或转运出细胞的能力。优选所述细胞具有将是fdca前体的呋喃化合物转运进细胞的能力及优选将fdca转运出细胞的能力。这种呋喃化合物转运能力可以是细胞的内源能力和/或可以是赋予细胞的外源能力。因此,本发明优选的细胞表达具有呋喃化合物转运能力的多肽。更优选地,所述细胞表达具有hmfca转运能力的多肽。hmfca转运能力应理解为是至少包括将hmfca转运进细胞的能力。具有hmfca转运能力的多肽的表达将增加hmfca转运进细胞,这增加了其在细胞内转化为fdca的可用性。因此可以改良hmfca生物转化。

优选地,将呋喃化合物转运进和/或转运出细胞的能力是通过用第三表达构建体转化细胞而赋予所述细胞或增加的。在本发明优选的细胞中,第三表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,呋喃化合物转运多肽的表达优选赋予所述细胞或增加所述细胞中将至少hmfca转运进细胞的能力。第三表达构建体优选包含编码多肽的核苷酸序列,所述多肽:

a)具有至少hmfca转运能力;及

b)包含与seqidno:17、31、32、33和34任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列。

多肽将呋喃化合物、特别是hmfca转运进细胞的能力可以通过在恶臭假单胞菌宿主细胞、优选恶臭假单胞菌kt2440宿主细胞中将编码所述转运多肽的核苷酸序列与来自c.basilensishmf14的hmfh基因及与来自c.basilensishmf14的hmf-降解操纵子相关的编码呋喃醛脱氢酶的基因(具有wo2012/064195中seqidno:19所示氨基酸序列)一起共表达而测定,将恶臭假单胞菌细胞在10mmhmf中孵育并检测与不表达所述转运多肽的相应恶臭假单胞菌细胞相比fdca累积的增加情况,例如wo2012/064195的实施例iv所述。

在一个实施方案中,所述核苷酸序列编码天然发生的具有hmfca转运能力的多肽,例如其可以分离自野生型来源生物体。或者,所述核苷酸序列可编码工程化形式的具有上文定义的hmfca转运能力及与相应天然发生的具有hmfca转运能力的多肽相比包含一或多个氨基酸取代、插入和/或缺失但是在本文定义的相同性或相似性范围内的任何多肽。因此,在一个实施方案中,本发明的核苷酸序列编码具有hmfca转运能力的多肽,其氨基酸序列在每个不变位置(在表3中以“*”表示)至少包含在不变位置存在的氨基酸。优选地,所述氨基酸序列在强保守位置(在表3中以“:”表示)还包含在强保守位置存在的氨基酸之一。更优选地,所述氨基酸序列进一步在较低强度保守位置(在表3中以“.”表示)还包含在较低强度保守位置存在的氨基酸之一。这些不变和保守位置之外的氨基酸取代不太可能影响hmfca转运能力。

本发明的编码具有hmfca转运能力的多肽的核苷酸序列可得自真菌、酵母或细菌的基因组和/或cdna,例如属于与上述来源生物体相同的门、纲或属,使用本领域技术人员熟知的分离核苷酸序列的方法以与上述用于编码本发明hmfca脱氢酶的核苷酸序列的相似方式获得。

表达呋喃化合物转运蛋白的细胞

第二方面,本发明涉及表达编码具有呋喃化合物转运能力的多肽的核苷酸序列的细胞。优选将所述细胞用表达编码具有呋喃化合物转运能力的多肽的核苷酸序列的表达构建体转化。具有呋喃化合物转运能力的多肽优选是具有hmfca转运能力的多肽,其至少包括将hmfca转运进细胞的能力。优选所述细胞包含表达编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列的表达构建体,所述多肽包含与seqidno:17所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少hmfca转运进细胞的能力。多肽将呋喃化合物、特别是hmfca转运进细胞的能力可以如上述测定。

优选地,本发明这个方面的表达呋喃化合物转运蛋白的转化的细胞进一步包含将hmf转化为fdca的酶活性。其中将hmf转化为fdca的活性优选包括如下至少之一:

a)醇脱氢酶活性,其将hmfca氧化为ffa,及醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸;及

b)氧化还原酶、优选氧化酶活性,其将hmf、2,5-二羟甲基呋喃、hmfca、ffa和2,5-二甲酰呋喃的一或多个氧化为fdca,及任选醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸。

将fdvifca氧化为ffa的醇脱氢酶活性及氧化呋喃醛的醛脱氢酶活性优选如上文定义。将hmf、2,5-二羟甲基呋喃、fdvifca、ffa和2,5-二甲酰呋喃的一或多个氧化为fdca的氧化还原酶是具有ec1.1和ec1.2活性的氧化还原酶,如wo2011/026913所述。

除非特别指出,本发明这方面的表达呋喃化合物转运蛋白的转化的细胞进一步可具有上述本发明第一方面的表达fdvifca脱氢酶的细胞的特性。

表达本发明多肽的载体和构建体和方法

本发明另一方面涉及核酸构建体,如载体,包括克隆和表达载体,其包含本发明的多核苷酸,例如编码hmfca脱氢酶或者本发明的转运蛋白或者其功能等价物的核苷酸序列,及在合适的宿主细胞中生长、转化或转染这种载体的方法,例如在其中发生本发明多肽表达的条件下进行。如本文所用,术语“载体”和“构建体”可互换使用,是指包含及优选能转运本发明的多核苷酸的构建的核酸分子。

本发明的多核苷酸可以掺入重组可复制载体中,例如克隆或表达载体。所述载体可用于在相容的宿主细胞中复制核酸。因此,在进一步的实施方案中,本发明提供了一种产生本发明多核苷酸的方法,通过将本发明的多核苷酸导入可复制载体中,将所述载体导入相容的宿主细胞中,及将所述宿主细胞在使得所述载体复制的条件下生长进行。所述载体可以从宿主细胞中回收。合适的宿主细胞如上文所述。

其中插入本发明的表达盒或多核苷酸的载体可以是可便利地进行重组dna程序的任何载体,所述载体的选择通常依赖于其被导入之中的宿主细胞。

本发明的载体可以是自主复制载体,即以染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒。或者,所述载体可以是当被导入宿主细胞中时整合进宿主细胞基因组中并与其被整合进之中的染色体一起复制的载体。

一种类型的载体是“质粒”,其是指环形双链dna环,其中可以连接另外的dna节段。另一类型载体是病毒载体,其中另外的dna节段可以连接在病毒基因组中。某些载体在其被导入之中的宿主细胞中能自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)在导入宿主细胞中时被整合进宿主细胞基因组中,从而随着宿主基因组一起复制。此外,某些载体能指导其可操纵地连接的基因的表达。这种载体在本文被称作“表达载体”。通常,用于重组dna技术中的表达载体通常是质粒形式。术语“质粒”和“载体”在本文可互换使用,质粒是最常用的载体形式。然而,本发明包括这种其它形式的表达载体,如粘粒、病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺相关病毒)和噬菌体载体,其发挥等价功能。

本发明的载体可在体外用于例如产生rna或者用于转染或转化宿主细胞。

本发明的载体可包含两或更多个、例如3、4或5个本发明的多核苷酸以例如过表达。

本发明的重组表达载体包含以适于在宿主细胞中核酸表达的形式的本发明的核酸,这意味着重组表达载体包含基于用于表达的宿主细胞选择的一或多个调节序列,其与被表达的核酸序列可操纵地连接。与编码序列“可操纵地连接”的调节序列如启动子、增强子或者其它表达调节信号以这样的方式安置,即编码序列的表达在与控制序列相容的条件下实现,或者如此安排序列以便其功能与其指定目的一致,例如转录在启动子起始并经由编码多肽的dna序列继续进行。术语“调节序列”或者“控制序列”包括启动子、增强子及其它表达控制元件(例如聚腺苷酸化信号)。这种调节序列在例如goeddel;geneexpressiontechnology:methodsinenzymology185,academicpress,sandiego,ca(1990)中描述。术语调节或控制序列包括指导核苷酸序列在许多类型宿主细胞中组成型表达的那些序列以及指导核苷酸序列仅在某一宿主细胞中表达的那些序列(例如组织特异性调节序列)。

用于指定宿主细胞的载体或表达构建体因此可以包含从相对于编码本发明多肽的序列的编码链的5’末端至3’末端以连续顺序彼此可操纵地连接的如下元件:(1)启动子序列,其能指导编码多肽的核苷酸序列在指定宿主细胞中转录;(2)翻译起始序列,如真核细胞kozak共有序列或者原核细胞核糖体结合位点/shine-dalgarno序列;(3)任选包括信号序列,其能指导多肽从指定宿主细胞分泌进培养基中;(4)本发明的编码成熟及优选活性形式本发明多肽的dna序列,及优选还包含(5)转录终止区(终止子),其能终止编码多肽的核苷酸序列下游的转录。

本发明核苷酸序列的下游可以是3’非翻译区,其含有一或多个转录终止位点(例如终止子)。终止子的来源不关键。终止子例如对于编码多肽的dna序列可以是天然的。然而,优选酵母终止子用于酵母宿主细胞中,丝状真菌终止子用于丝状真菌宿主细胞中。更优选地,终止子对于宿主细胞(其中编码多肽的核苷酸序列被表达)是内源的。在转录区中,可以存在核糖体结合位点以进行翻译。由构建体表达的成熟转录物的编码部分包括在起始处的翻译起始aug及适当位于被翻译的多肽的末端的终止密码子。

本发明的多核苷酸的增强表达也可以通过选择异源调节区如启动子、分泌前导序列和/或终止区而实现,其可以增加表达,及如果需要时增加感兴趣的蛋白质从表达宿主的分泌水平和/或为本发明多肽的表达提供可诱导的控制。

本领域技术人员应意识到表达载体的设计可以依赖于如转化的宿主细胞的选择、希望的蛋白质表达水平等因素。本发明的载体如表达载体可以被导入宿主细胞中,从而产生由本文所述核酸编码的蛋白质或肽(例如本发明的hmfca脱氢酶或转运蛋白、其突变体形式、片段、变体或者功能等价物、融合蛋白等)。

如上文所述,术语“控制序列”或者“调节序列”在本文定义为包括至少为多肽的表达必需的和/或有利的任何成分。任何控制序列对于本发明编码多肽的核酸序列均可以是天然或外来的。这种控制序列可包括但不限于启动子、前导序列、优化翻译起始序列(如kozak,1991,j.biol.chem.266:19867-19870所述)或者原核细胞shine-delgarno序列、分泌信号序列、前肽序列、聚腺苷酸化序列、转录终止子。控制序列最低限度地典型包括启动子和翻译起始和终止信号。

稳定转化的微生物是具有导入的一或多个dna片段的微生物,由此在生长培养中导入的分子得以维持、复制和隔离。稳定转化可以是由于多个或单一染色体整合或者通过染色体外元件如质粒载体所致。质粒载体能指导由特定dna片段编码的多肽的表达。

表达可以是组成型表达或者由可诱导(可抑制)启动子调节的,使得功能相关的编码特定多肽的dna片段高水平转录。

无论用于表达本发明多肽的实际机制如何,预期这种表达是可以通过使用本领域已知的方法在另一宿主细胞中导入编码这些多肽的基因而转移的。如本文定义的遗传元件包括具有产物如蛋白质、特别是酶的可表达编码序列的核酸(通常为dna或rna),脱辅基蛋白或者反义rna,其表达或调节相关多肽的表达。表达的蛋白质可以发挥酶的功能,抑制或阻抑酶活性或者控制酶的表达或者发挥化合物如代谢物的转运蛋白的功能。编码这些可表达序列的重组dna可以是染色体(通过例如同源重组整合进宿主细胞染色体中)或者染色体外(例如由一或多个质粒、粘粒及能自身复制的其它载体携带)dna。应理解用于转化根据本发明的宿主细胞的重组dna除了结构基因和转录因子之外还可包括表达控制序列,包括启动子、阻抑物和增强子,其控制蛋白质的编码序列、脱辅基蛋白或反义rna的表达或脱阻抑。例如,这种控制序列可以插入野生型宿主细胞中以促进已经在宿主细胞基因组中编码的选择的多肽的过表达,或者另外其可用于控制染色体外编码的多肽的合成。

重组dna可以通过任何方式导入宿主细胞中,包括但不限于质粒、粘粒、噬菌体、酵母人工染色体或者其它载体,其介导遗传元件转移进宿主细胞中。这些载体可包括复制起点,以及顺式作用控制元件,其控制载体及由载体携带的遗传元件的复制。可选择的标记可以存在于载体上以帮助鉴别其中已经导入遗传元件的宿主细胞。

将遗传元件导入宿主细胞的方式(例如克隆)为本领域技术人员熟知。技术人员可利用染色体外多拷贝质粒载体插入根据本发明的遗传元件。遗传元件经质粒导入宿主细胞中包括最初用限制酶裂解质粒载体,随后将质粒与编码根据本发明的靶向酶的遗传元件连接。在连接的重组质粒再环化时,使用感染(例如在噬菌体λ中包装)或其它质粒转移机制(例如电穿孔、显微注射等)将质粒转移进宿主细胞中。适于将遗传元件插入宿主细胞中的质粒为本领域技术人员熟知。

其它基因克隆方法包括但不限于将遗传材料定向整合进染色体中。这可以通过多种方式进行,包括在两侧是宿主染色体的同源dna序列的非复制质粒上克隆本文所述遗传元件;在所述重组质粒转化进宿主中时,遗传元件通过dna重组可以被导入染色体中。如果整合dna片段含有可选择标记如抗生素抗性,则可以回收这种重组菌株。或者,遗传元件可以不使用非复制质粒而直接导入宿主细胞染色体中。这可以通过合成产生也含有宿主染色体的同源dna序列的本发明的遗传元件的dna片段而实现。再次,如果这些合成的dna片段也含有可选择标记,则可以将遗传元件插入宿主染色体中。

本发明进一步涉及制备具有本发明hmfca脱氢酶活性的多肽和/或具有本发明呋喃化合物转运能力的多肽的方法,所述方法包括在有益于所述多肽表达的条件下培养本发明的细胞,及任选回收表达的多肽,本发明还涉及通过这种方法可获得的多肽。

氧化呋喃化合物的方法

再一方面,本发明涉及氧化呋喃化合物的方法。特别地,本发明涉及其中fdca的呋喃前体被氧化的方法。本发明的方法可包括单次氧化反应步骤获得产物(例如hmfca氧化为ffa)。或者,本发明的方法可包括多于一个的氧化反应步骤,每个步骤均获得中间物,其中最后的中间物是终产物。其中hmf在相继的氧化步骤中被氧化为fdca的这种一系列的步骤例如包括:1)首先将hmf氧化为hmfca,后者在第二个步骤中被氧化为ffa,ffa随后最终被氧化为fdca,或者如dijkmanetal.(2014,angew.chem.53(2014)6515-8)所述2)首先将hmf氧化为dff,dff在第二个步骤中被氧化为ffa,ffa随后被最终氧化为fdca。因此,在优选的本发明方法中,fdca的一或多个呋喃前体在一系列步骤中被最终氧化为fdca。

在一个实施方案中,本发明涉及包括至少将hmfca氧化为ffa的方法。优选地,所述方法是将hmfca氧化为ffa的方法,其中所述方法包括将细胞在存在hmfca条件下孵育的步骤,其中所述细胞是表达如上文定义的hmfca脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的hmfca脱氢酶或氧化酶活性的多肽的细胞。优选所述细胞在存在hmfca在有益于细胞氧化hmfca的条件下孵育,如下文详细说明。

在另一个实施方案中,本发明涉及产生fdca的方法。产生fdca的方法优选包括将细胞在包含fdca的一或多种呋喃前体的培养基中孵育的步骤,其中所述细胞是表达如上文定义的hmfca脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的hmfca脱氢酶或氧化酶活性的多肽的细胞。优选将所述细胞在存在hmfca在有益于细胞将fdca的呋喃前体氧化为fdca的条件下孵育,如下文详细说明。

优选在所述方法中,fdca的至少一种呋喃前体选自hmf、dhf、hmfca、ffa和dff,最优选hmf。fdca的呋喃前体优选得自一或多种己糖,优选通过常规方式的酸催化的脱水获得,例如通过在存在酸的条件下加热。从果糖产生hmf的技术已经充分确立及强力(见例如vanputtenetal.,2013,chem.rev.113,1499-1597)。也可以利用葡萄糖富集的源料,但是从果糖更有效地热化学形成hmf。因此,可包括另外的酶促步骤以使用葡萄糖异构酶将葡萄糖转化为果糖。后一方法在食品工业中充分确立,例如从水解淀粉产生高果糖玉米糖浆(hfcs)。葡萄糖也可以通过使用催化剂与溶剂组合经化学异构为果糖,例如vanputtenetal.(2013,supra)所述。

己糖通常得自生物质。术语“生物质”应理解为是指来自农业(包括植物如作物残余物,及动物物质)、林业(如木材资源)及相关工业包括渔业和水产业的生物学来源的可生物降解的产物、废物和残余物级分,以及可生物降解的工业和城市垃圾如市政固体垃圾或废纸的级分。在一个优选的实施方案中,生物质是植物生物质,更优选(可发酵的)己糖/葡萄糖/糖富集的生物质,例如甘蔗,含有淀粉的生物质,例如小麦粒或者玉米秸秆,或者甚至谷粒如玉米、小麦、大麦或者其混合物。优选的是天然富集果聚糖的农作物(例如洋姜或菊苣根)。

己糖可以通过水解这种生物质而获得。水解生物质的方法为本领域已知,包括使用例如蒸气和/或糖酶如葡糖淀粉酶获得。

用于本发明方法中的另一优选类型的生物质是所谓的“第二代”木质纤维素原料,如果以更持续方式生产大体积fdca,则优选这种生物质。木质纤维素原料可以得自专用的能源作物,例如在边缘土地生长,因此与粮食作物不直接竞争。或者木质纤维素原料可以作为副产物获得,例如市政固体垃圾、废纸、木材剩余物(包括锯木和造纸废物),可以考虑作物残余物。举例的作物残余物包括甘蔗渣及一些玉米和小麦废物。在玉米副产物的情况中,三种废物是纤维、玉米棒和秸秆。此外,林业生物质可用作原料。为了将二代原料转化为本发明的发酵产物,纤维素和半纤维素需要释放为单糖。因此,应用热化学方法(通常称作预处理)、酶促方法或者两种方法的组合。预处理可以完全释放糖,或者使得聚合化合物对于随后的酶攻击更易于接近。不同类型的预处理包括液体热水、蒸汽喷发、酸预处理、碱预处理,以及离子液体预处理。各种化合物的相对量依赖于使用的原料和应用的预处理方法。为了从这种木质纤维素原料释放单糖,应用合适的糖酶,包括例如阿拉伯糖酶、木聚糖酶、葡聚糖酶、淀粉酶、纤维素酶、葡聚糖酶等。

本发明的方法进一步优选包括回收在所述方法中产生的氧化产物如fdca或hmfca的步骤。优选地,从孵育进行氧化步骤的细胞的培养基中回收氧化产物。氧化产物如fdca、fdvifca等可以从反应混合物或者培养基中回收,通过例如(酸或盐)沉淀、随后冷却结晶及分离结晶的氧化产物如结晶的fdca。然而,其它回收方法也是适用的,例如本领域已知的酸或盐沉淀及溶剂提取。回收fdca的盐沉淀方法可以例如使用二价(金属)阳离子如mg2+进行。

氧化反应优选在对于细胞及细胞中包含的氧化还原酶最佳的温度进行。因此,在嗜热细胞和酶的情况中,温度优选是45℃或更高,例如45-122℃的范围,例如高于50、55、60或65℃。然而,在含有来自嗜常温微生物的酶的嗜常温细胞的情况中,氧化反应优选在相对中等温度进行,例如10-80℃,更优选20-45℃,最优选大约25-40℃。

氧化反应优选在其中fdca是中性形式或完全解离形式的ph进行,由此可以控制盐形成。鉴于在fdca中存在两个酸部分,因此有两个单独优选的ph范围。在反应期间的ph可以是ph1-6,优选ph1-4,最优选ph1-3。或者,在反应期间的ph可以是ph5-9,优选ph5-8,最优选ph5-7。技术人员理解宿主细胞的要求也影响所述方法的合适ph值的选择。适于特定宿主细胞的ph值的选择在技术人员的技术范围内,可以得自标准教科书。对于恶臭假单胞菌、包括如恶臭假单胞菌s12或kt2440菌株,优选的ph范围是ph5-7。

反应时间可以是6-150小时,更优选6-18小时。优选从氧源为反应培养基中的细胞提供氧,所述氧源如分子氧,例如纯氧或者于空气中氧,或者水,或者根据呋喃氧化酶的要求而不同的氧源。可以便利地使用空气作为分子氧的来源。

反应器可以是任何合适的(充气)生物反应器。反应器可以分批、持续或者优选补料分批操作。

本发明的氧化呋喃化合物的方法可有利地用于从认为其中的呋喃化合物是有害的原料中消除呋喃化合物,如用于发酵产生生物燃料和生化品的原料。更优选地,氧化呋喃化合物的方法用于fdca的生物生产,其作为单体前体以产生聚酯(塑料),其中fdca在聚酯pet中可以代替pta,在这种情况中获得生物基聚呋喃二甲酸乙二醇酯(pef)。fdca也可以用作大量有价值化合物的底物,包括例如用作生产琥珀酸、2,5-二(氨基甲基)-四氢呋喃、2,5-二羟甲基-四氢呋喃、2,5-二羟甲基呋喃和2,5-呋喃二甲醛(2,5-furandicarbaldehyde)的底物。fdca可用于生产涂层,例如在醇酸树脂和热塑涂层中。其也可以在生物燃料中用作二甲苯等价物及作为溶剂。fdca可以被酯化,所述酯可用作增塑剂。fdca可以转化为其二醇,可用于pet样聚酯和聚氨酯中。进一步地,fdca可以转化为其二胺,二胺可以用作扩链剂,及二胺可以转化为二异氰酸酯,其可用于聚氨酯的生产中。

因此,本发明再一方面涉及从一或多个fdca单体生产聚合物的方法,所述方法包括如下步骤:a)在如上述本发明的氧化方法中制备fdca单体;及b)从在a)中获得的fdca单体产生聚合物。优选所述聚合物是聚呋喃二甲酸乙二醇酯(pef)。

再一方面,本发明涉及本发明细胞在将一或多个fdca呋喃前体生物转化为fdca中的应用,其中细胞是表达如上文定义的hmfca脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的hmfca脱氢酶或氧化酶活性的多肽的细胞。优选地,被生物转化为fdca的至少一种fdca呋喃前体选自hmf、dhf、hmfca、ffa和dff,最优选hmf。

hmfca脱氢酶多肽及编码hmfca脱氢酶的核酸

另一方面,本发明涉及具有hmfca脱氢酶活性的多肽。具有hmfca脱氢酶活性的多肽包含或者由与seqidno:1(aeribacilluspallidus)所示氨基酸序列具有至少81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但其它方面如上文定义的氨基酸序列组成。优选所述多肽是分离的多肽。

本发明进一步涉及核酸分子,其包含如下至少之一:

a)编码具有hmfca脱氢酶活性的多肽的核苷酸序列,所述多肽包含或者由与seqidno:1所示氨基酸序列具有至少81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸组成;

b)seqidno:12或13所示核苷酸序列;

c)(a)或(b)所述核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;

d)序列由于遗传密码简并而与b)或c)所述核苷酸序列不同的核苷酸序列;及

e)是a)-d)所述核苷酸序列的反向补体的核苷酸序列。

本发明另一方面涉及载体,包括克隆载体和表达载体,其包含如本章节中上文a)-e)所述核苷酸序列,所述载体其它方面如上文所述。

再一方面,本发明涉及包含i)具有如本章节上文定义的hmfca脱氢酶活性的多肽及ii)本章节上文定义的核酸分子的至少之一的细胞。优选所述细胞是包含本章节上文a)-e)定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选是分离的细胞或培养的细胞,所述细胞优选其它方面如上文定义及优选所述细胞包含如上文所述一或多个遗传修饰。所述细胞可用于如上文所述任何方法、过程和应用中。

呋喃化合物转运多肽及编码这种转运多肽的核酸

再一方面,本发明涉及具有呋喃化合物转运能力的多肽。所述多肽优选至少具有将hmfca转运进细胞的能力。优选所述多肽包含或者由与seqidno:17(aeribacilluspallidus)所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但是其它方面如上文定义的氨基酸序列组成。优选所述多肽是分离的多肽。

本发明进一步涉及核酸分子,其包含如下至少之一:

a)编码具有将至少hmfca转运进细胞的能力的多肽的核苷酸序列,所述多肽包含或者由与seqidno:17所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;

b)seqidno:18所示核苷酸序列;

c)(a)或(b)所述核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;

d)序列由于遗传密码简并而与b)或c)所示核苷酸序列不同的核苷酸序列;及

e)是a)-d)所述核苷酸序列的反向补体的核苷酸序列。

本发明另一方面载体,包括克隆载体和表达载体,其包含如本章节上文a)-e)定义的核苷酸序列,所述载体其它方面如上文所述。

再一方面,本发明涉及包含如下至少之一的细胞:i)如本章节上文定义具有呋喃化合物转运能力的多肽,及ii)如本章节上文定义的核酸分子。优选所述细胞是包含如本章节上文a)-e)定义的核苷酸序列或者用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选是分离的细胞或者培养的细胞,所述细胞优选其它方面如上文所述及优选所述细胞包含上文所述一或多个遗传修饰。所述细胞可用于如上文所述任何方法、过程和应用中。

在本文及其权利要求书中,动词“包含”及其词形变化以非限制性含义使用,意味着包括在该单词后面的项目,但不除外未特别提及的项目。此外,以不定冠词“一个”或“一种”提及某元件时不除外存在超过一个/一种元件的可能性,除非文中明确要求是有一个及仅此一个元件。不定冠词“一个”或“一种”因此通常是指“至少一个/一种”。

本说明书中引用的所有专利及参考文献均以其全部内容并入本文作参考。

如下实施例只是例证本发明,无以任何方式限制本发明范围之意。

附图描述

图1a:恶臭假单胞菌ca2046对hmf的生物转化(恶臭假单胞菌;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。

图1b:恶臭假单胞菌ca2101对hmf的生物转化;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。

图2:恶臭假单胞菌ca2111对hmf的生物转化,共表达yiay与来自c.basilensishmf14的aldh和hmft1;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。图中示出一式两份培养物的平均值。

图3:恶臭假单胞菌ca2112对hmf的生物转化,共表达yiay与来自c.basilensishmf14的aldh和hmft1;空心圆:hmf(5-羟甲基糠醛);空心方形:hmfca(5-羟甲基糠酸);实心菱形:fdca(2,5-呋喃二羧酸);实心灰色圆:od600。图中示出一式两份培养物的平均值。

4:恶臭假单胞菌ca21780对hmf的生物转化,共表达来自克里不所类芽孢杆菌dsm17871的yiay_与来自c.basilensis的aldh和hmft1。hmf-oh是二羟甲基呋喃,在本文也称作“dbf”。

5:恶臭假单胞菌ca21781对hmf的生物转化,共表达来自aneurinibacillusterranovensisdsm18919的yiay_与来自c.basilensis的aldh和hmft1。hmf-oh是二羟甲基呋喃,在本文也称作“dhf”。

6:恶臭假单胞菌ca21783对hmf的生物转化,共表达来自brevibacilluspanacihumiw25的yiay_与来自c.basilensis的aldh和hmft1。hmf-oh是二羟甲基呋喃,在本文也称作“dhf”。

实施例

一般方法

菌株与质粒

恶臭假单胞菌s12agcd或者恶臭假单胞菌kt2440agcd(分别为恶臭假单胞菌s12(atcc700801)和恶臭假单胞菌kt2440(dsm6125)的葡萄糖-脱氢酶缺陷型突变体)或者野生型恶臭假单胞菌s12用作宿主以表达来自aeribacilluspallidus菌株ca1828的yiay基因(见下文)。大肠杆菌菌株tg90用于一般克隆目的。

为了附加型表达a.pallidus基因,使用pbbr1mcs衍生的pbt’mcs(koopmanetal.,2010a,biorestechnol101:6291-6196)。在pbt’mcs中,靶基因的表达由组成型tac启动子驱动。

培养基&培养条件

嗜常温无机盐培养基(mmm)含有如下成分(每升去矿物质水):15.52g的k2hpo4、6.52g的nah2po4、2.0g的(nh4)2so4、0.1g的mgcl2.6h2o、10mg的edta、2mg的znso4.7h2o、1mg的cacl2.2h2o、5mg的feso4.7h2o、0.2mg的na2moo4.2h2o、0.2mg的cuso4.5h2o、0.4mg的cocl2.6h2o及1mg的mncl2·2h2o,按照说明补充碳源。

嗜热矿物质盐培养基(tmm)含有如下成分(每升去矿物质水):10g的bis-tris、10μmfeso4·7h2o、4mm三甲基甘氨酸、1.32mmk2hpo4、9.53mmnh4cl、0.2g酵母提取物、5g的nacl、1.47g的na2so4、0.08g的nahco3、0.25g的kcl、1.87g的mgcl2.6h2o、0.41g的cacl2.2h2o、0.008g的srcl2.6h2o、0.008g的h3bo3、0.90g的nano3和1ml的维生素溶液(硫胺素,0.1g/l;核黄素,0.1g/l;烟酸,0.5g/l;泛酸,0.1g/l;吡哆胺-hcl,0.5g/l;吡哆醛-hcl,0.5g/l;d-生物素,0.1g/l;叶酸,0.1g/l;对氨基苯甲酸,0.1g/l;维生素b12,0.1g/l)。按照说明补充碳源。

作为增殖嗜常温微生物的完全培养基,使用luria-bertani(lb)肉汤:10g/lbacto胰蛋白胨(difco)、5g/l酵母提取物(difco)、10g/lnacl。对于平板培养,将lb用1.5%(w/v)琼脂(difco)固化。为了选择携带pbt’mcs衍生质粒的大肠杆菌、恶臭假单胞菌s12或恶臭假单胞菌kt2440转化株,将50μg/ml卡那霉素(km)加入培养基中。抗生素购自sigma-aldrich。将恶臭假单胞菌在30℃培养,大肠杆菌在37℃培养。

作为增殖嗜热微生物的完全培养基,使用tgp肉汤:17g/l胰蛋白胨、3g/l大豆胨、5g/lnacl、2.5g/lk2hpo4、4g/l甘油和4g/l丙酮酸钠(ph7)。对于平板培养,将tgp用1.5%(w/v)琼脂(difco)固化。将aeribacilluspallidus在60℃培养。

测定&分析方法

细胞干重(cdw)测量

细菌培养物的cdw含量通过使用biowavecelldensitymeter(wpaltd)或者μquantmqx200通用微平板分光光度计(biotek)使用平底96孔微平板(greiner)测量在600nm的光密度(od600)而确定。对于恶臭假单胞菌,1.0的od600相应于0.56gcdw/l(biowave)或者1.4gcdw/l(μquant)。

hplc分析

如koopmanetal.(2010a,biorestechnol101:6291-6196)所述,通过rp-hplc分析呋喃化合物(fdca、hmf、hmf-醇、hmfca和ffa)。

化学品

5-羟甲基糠醛(hmf)购自eurolabsltd(poynton,uk)。fdca和5-羟甲基-糠酸(fdvifca)的分析标准物分别购自immunosourceb.v.(halle-zoersel,belgium)和matrixscientific(columbiasc,usa)。所有其它化学品购自sigma-aldrichchemieb.v.(zwijndrecht,thenetherlands)。

分子和遗传技术:

使用masterpuretm革兰氏阳性dna纯化试剂盒(epicentre)从a.pallidusca1828分离基因组dna。使用jetstarmaxi质粒纯化试剂盒(genomed,itkdiagnostics)分离质粒dna。使用dnaclean&concentratortm(zymoresearch)分离琼脂糖-捕获的dna片段。使用phusionflashpcrmastermix(thermoscientific)根据厂商指导进行pcr反应。寡核苷酸引物(在实施例中详细说明)由sigma-aldrich合成。使用genepulser电穿孔装置(biorad)将质粒dna导入电感受态细胞中。其它标准分子生物学技术如sambrookandrussell(2001,supra)所述进行。

实施例1:代谢hmf的aeribacilluspallidus菌株的分离

将compost(15g)与15ml的0.9%(w/v)nacl溶液混合并在750rpm和80℃孵育40分钟。所得compost浆在于摇瓶中的补加0.65g/l的hmf的tmm中在60℃和180rpm孵育3天。将培养物定期移至新鲜tmm-hmf中并铺板于固体tmm-hmf上。将单一菌落重新在tmm-hmf和tgp平板上划线培养,及重新评定其代谢hmf及fdca的能力。通过16srdna测序将代谢hmf和fdca二者的两个分离株(菌株ca1809和ca1828)鉴别为aeribacilluspallidus,选择用于进一步研究。

实施例ii:在降解hmf的a.pallidus分离株中新的脱氢酶催化的hmf分解代谢途径的鉴别

通过pacbio测序方法对a.pallidus菌株ca1809和ca1828的基因组进行测序并进行自动orf调用与注释(callingandannotation)。在注释的基因组中,鉴别了cupriavidusbasilensishmf14的hmfabcde基因的同系物,其组成糠酸降解簇(koopmanetal.,2010,procnatacadsciusa107:4919-4924)。

考虑到菌株ca1809和ca1828除了代谢hmf之外还代谢fdca的能力,强烈提示hmf是如在c.basilensishmf14中通过fdca代谢的。然而,意外地未发现组成通过fdca从hmf至糠酸降解途径的c.basilensishmf14的hmffgh簇的同系物。这个结果提示在a.pallidus分离株中存在的将hmf氧化为fdca及可能随后脱羧为糠酸的另一途径。挖掘(mining)包含编码氧化和脱羧活性二者的基因的基因簇的基因组可以鉴别推定的hmf降解簇,包含编码醇脱氢酶、醛脱氢酶和两种脱羧酶的基因(表1a和b)。总之,这些基因编码如在c.basilensishmf14中推定的通过羟甲基糠酸(hmfca)将hmf氧化为fdca的途径,但是包含醇脱氢酶活性而不是氧化酶活性以将hmfca氧化为甲酰糠酸(ffa)。

表1a:推定的a.pallidusca1809的hmf降解簇

表1b:推定的a.pallidusca1828的hmf降解簇

实施例iii:在恶臭假单胞菌s12中表达a.pallidus的yiay赋予将hmf氧化为fdca的能力

将yiay基因在pbt'mcs产生质粒pkw007中克隆为1988-bp的合成的xbai-sali片段(seqidno:15),包括来自凝结芽孢杆菌dsm1的pldhl1启动子区。将质粒pkw007导入恶臭假单胞菌kt2440agcd(ca1877)中,产生恶臭假单胞菌ca2101。携带pbt'mcs的恶臭假单胞菌kt2440agcd(菌株ca2046)作为空载体对照进行检测。

将恶臭假单胞菌菌株ca2101和ca2046在含有10ml的mm+80mm甘油和2mm葡萄糖及补加50mg/l卡那霉素的100-ml摇瓶中生长。在对数生长期(od600≈4)结束时收获细胞,洗涤并重悬浮于补加19.4g/l的k2hpo4、8.15g/l的nah2po4、80mm甘油和50mg/l卡那霉素的mm中。将等份的(10ml)洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样以分析fdca。图1a示出在空载体对照中hmf被迅速氧化为羟甲基糠酸(fdvifca),然而完全不存在fdca形成。当yiay表达时(图1b),积累的fdvifca缓慢氧化为fdca,这表明yiay作为hmfca氧化脱氢酶的功能性。

实施例iv:通过共表达a.pallidus的yiay与c.basilensishmf14的aldh和hmft1优化hmf至fdca的氧化

合成a.pallidusca1828的yiay基因,其包含核糖体结合位点taggaaaggaagattaaccc(seqidno:21)。将yiay片段(seqidno:16)用kpni和xbai消化以置换pbt'hmfh-adh中hmfh基因(wo2012064195),产生质粒pkw010。将质粒pkw010导入携带pjnnhmft1(t)(wo2012064195)的恶臭假单胞菌s12agcd中产生恶臭假单胞菌ca2111,及导入恶臭假单胞菌kt2440agcd(也携带pjnnhmft1(t))中产生恶臭假单胞菌ca2112。因此,可以将yiay编码的氧化hmfca的醇脱氢酶与hmf脱氢酶和c.basilensishmf14的hmfca转运蛋白共表达,以消除hmf氧化为hmfca及hmfca摄取的瓶颈问题。

将恶臭假单胞菌ca2111和ca2112在含有10ml的mm+80mm甘油和2mm葡萄糖补加50mg/l卡那霉素、30mg/l庆大霉素和100μm水杨酸的100-ml摇瓶中生长。在对数生长期末(od600≈4)收获细胞,洗涤并重悬浮于具有50mg/l卡那霉素、30mg/l庆大霉素和10μm水杨酸的mm中。将等份(10ml)洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样品分析fdca。图2和3示出hmf被迅速氧化为hmfca,hmfca被进一步氧化为fdca。显然yiay与aldh和hmft1的共表达显著加速了hmf氧化为fdca。

实施例v:通过共表达嗜常温hmfca醇脱氢酶与c.basilensishmf14的aldh和hmft1构建将hmf氧化为fdca的优化菌株

合成克里不所类芽孢杆菌dsm17871、热红短小芽孢杆菌423、芽孢杆菌fjat-14578和芽孢杆菌l1(2012)的yiay同系物,其包含含有间隔区taggaaaggaagattaaccc(seqidno:21)的核糖体结合位点以及限制酶(kpni、nhei;与xbai相容)识别位点以进行克隆(seqidno:19、36、38和39)。

合成aneurinibacillusterranovensisdsm18919和brevibacilluspanacihumiw25的yiay同系物,包括含有间隔区gaattccacatgacaaggggagaccgc(seqidno:40)的核糖体结合位点以及限制酶(kpni、xbai)的识别位点以进行克隆(seqidno:35和37)。克里不所类芽孢杆菌酶(seqidno:19)、热红短小芽孢杆菌酶(seqidno:36)和两种芽孢杆菌酶(seqidno:38和39)的编码核苷酸序列通过使用http://www.kazusa.or.jp/codon/的恶臭假单胞菌密码子使用表经氨基酸序列逆向翻译(http://www.bioinformatics.org/sms2/rev_trans.html)而获得。a.terranova和b.panacihumi酶的编码序列通过使用大肠杆菌序列优化工具geneart(https://www.thermofisher.com/nl/en/home/life-science/cloning/gene-synthesis/geneart-gene-synthesis/geneoptimizer.html)经氨基酸序列逆向翻译而获得。

将克里不所类芽孢杆菌、热红短小芽孢杆菌、芽孢杆菌fjat-14578和芽孢杆菌l1(2012)的yiay-同系物片段用kpni和nhei(与pbt'hmfh-adh中xbai相容)消化以置换pbt'hmfh-adh(wo2012064195)中hmfh基因,产生质粒pkw2210、pkw2212、pkw2214和pkw2215。将a.terranovensis和b.panacihumi的yiay同系物片段用kpni和xbai消化以置换pbt'hmfh-adh(wo2012064195)中的hmfh基因,产生质粒pkw2211和pkw2213。

将质粒pkw2210、pkw2211、pkw2212、pkw2213、pkw2214和pkw2215导入恶臭假单胞菌kt2440agcd_pjnnhmft1(ca1965)中,分别产生恶臭假单胞菌ca21780、ca21781、ca21782、ca21783、ca21784和ca21785以在包含aldh和hmft1的优化宿主背景中表达yiay同系物。对于性能评估,将恶臭假单胞菌菌株ca21780,ca21781,ca21782,ca21783,ca21784和ca21785在含有10ml的mm+80mm甘油和2mm葡萄糖及补加50mg/l卡那霉素、30mg/l庆大霉素和100μm水杨酸的100-ml摇瓶中生长。在对数生长期末(od600≈4)收获细胞,洗涤并重悬浮于具有50mg/l卡那霉素、30mg/l庆大霉素和10μm水杨酸的mm中。将等份(10ml)的洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样分析fdca。恶臭假单胞菌ca21780、ca21781和ca21783的结果分别在图4、5和6中示出。所有这三种转化的菌株均从fdvif产生fdca。然而,不同菌株示出hmfca的瞬时积累显著不同,部分hmf还原为二羟甲基呋喃(hmf-oh或dhf)。还发现菌株恶臭假单胞菌ca21782、ca21784和ca21785从fdvif产生fdca,表明所有这六种醇脱氢酶酶作为氧化hmfca的酶的功能性。

实施例vi:构建表达aeribacilluspallidusprop编码的hmfca转运蛋白的恶臭假单胞菌菌株

通过pcr使用引物prop(f)(gccgaattcatgaagaatatcgctaatacg;seqidno:22)和prop(r)(gccgctagcttatttgaggtttccttttgtttcc;seqidno:23)从aeribacilluspallidusca1828的基因组dna扩增prop基因(seqidno:18)。将pcr产物作为1350-bpecori-nhei片段(seqidno:20)导入pjnnmcs(t)中,产生pjnnprop(t)。将质粒pbt’hmfh_aldh和pjnnprop(t)相继导入恶臭假单胞菌kt2440agcd(ca1877)中,产生恶臭假单胞菌ca21783。将恶臭假单胞菌ca21783在含有10ml的mm+80mm甘油和2mm葡萄糖及补加50mg/l卡那霉素、30mg/l庆大霉素和100μm水杨酸的100-ml摇瓶中培养。在对数生长期末(od600≈4)收获细胞,洗涤并重悬浮于含有50mg/l卡那霉素、30mg/l庆大霉素和10μm水杨酸的mm中。将等份(10ml)洗涤的细胞悬浮液(od600为1-2)与hmf在100-mlerlenmeyer培养瓶中孵育,定期取样以分析fdca。显然,表达prop编码的hmfca转运蛋白与不表达prop的相应对照菌株相比显著加速hmf氧化为fdca。

表2:yiay氨基酸序列比对

adh_bp=seqidno:6(brevibacilluspanacihumi);adh_bk=seqidno:2(克里不所类芽孢杆菌);adh_bt=seqidno:5(热红短小芽孢杆菌);adh_at=seqidno:4(aneurinibacillusterranovensis);yiay=seqidno:1(aeribacilluspallidus);adh_gk=seqidno:3(嗜热地芽孢杆菌);adh_bsp=seqidno:7(芽孢杆菌fjat-14578);adh_bspl1=seqidno:10(芽孢杆菌l1(2012));adh_pt=seqidno:11(pelotomaculumthermopropionicum);adh_dk=seqidno:8(库氏脱硫肠状菌);adh_dt=seqidno:9(desulfurisporathermophila)。比对下面的符号表示:*=不变位置;:=强保守位置;.=低强度保守位置;无符号表示非保守位置。

序列表

<110>普拉克生化公司

<120>脱氢酶催化的fdca的产生

<130>p6054479pct

<150>ep15155401

<151>2015-02-17

<160>40

<170>patentinversion3.3

<210>1

<211>392

<212>prt

<213>aeribacilluspallidus

<400>1

metileglyasntyralalyslysalaileaspphegluphethrphe

151015

tyrleuprothrleuileglupheglytyrglylysalaserargmet

202530

glyglumetleugluglnmetglyilelysasnvalpheleuvalthr

354045

asplysglyvalglualaalaglyleuleualaglyilevalglnser

505560

leugluserserasnileargtyrvaliletyrseraspvalglupro

65707580

aspproserleugluthrileaspargglyalaservalphelysglu

859095

glnserpheaspcysileleualavalglyglyglyserproileasp

100105110

thralalysglyileargvalvalvalthrasnglyglyasnilegly

115120125

asptyralaglyvalasnargvalalalyslyssergluileproleu

130135140

valalavalprothrthrserglythrglysergluvalthrilephe

145150155160

glyvaltyrserasptrpgluasnglnvallysvalthrvalthrser

165170175

protyrmetalaprogluilealaleuvalaspprogluleuthrmet

180185190

serleuproglnlysmetthralaalaserglyileaspalaleuala

195200205

hisglyilegluthrphepheserleuargserargproalaserasp

210215220

alaleualavalglualametalathrvalseralatyrleuargarg

225230235240

alavalgluaspglythrasplysglualaargileglymetsergln

245250255

glyserleuleualaglymetalapheasnasnglypheleuglyleu

260265270

alahisalaileglyseralaleuserglyhiscyshisvalserhis

275280285

glyvalalaileglyleuleuleuprolysvalvalglupheasnala

290295300

argvalargproglulysalaalalysilealagluleuleuglyval

305310315320

lysglyaspargglugluvalleualagluglnalaalaproalaval

325330335

alaserleuvallysgluileglyleuprothrargleuargaspval

340345350

aspvalsergluglulysleuproaspilealaargaspalaphelys

355360365

serglymetmetlyspheasnproargglnproserleusergluval

370375380

leuthrleuleuglnglniletyr

385390

<210>2

<211>383

<212>prt

<213>bacilluskribbensis

<400>2

metaspvalglupheserphehisleuprothrleuilegluphegly

151015

pheglylysalaserleuleuglygluargleuleulysleuglyval

202530

glyasnvalpheleuvalserasplysglyvalalaseralaglyleu

354045

leuglnlysleugluglnserleuglnthrseraspilehisphelys

505560

thrtyrleugluvalgluproaspproserleugluthrileaspleu

65707580

glyalaglualapheasnserglylystyraspcysilevalalaval

859095

glyglyglyseralaileaspthralalysglyileargvalvalala

100105110

glyasnglyglyserileglyaspphealaglyvalasplysilegly

115120125

lysalaproglnileproleuilealavalprothrthrserglythr

130135140

glysergluvalthrilepheglyvaltyrserasptrpvallysasn

145150155160

vallysvalthrvalthrserglntyrmetalaprothrilealaleu

165170175

valaspprogluleuthrmetargleuproarglysmetthralaala

180185190

serglyileaspalaleualahisglyileglusertyrpheserleu

195200205

argserthrseralaserargalaleuserleuglualaileasnile

210215220

valglyasnhisleuargglnservalalaasnglygluasplysglu

225230235240

alaargcysglymetserhisglyserleuleualaglymetalaphe

245250255

asnasnglypheleuglyleualahisalaileglyseralaleuser

260265270

glyhiscyshisvalprohisglyvalalaileglyleuleuleupro

275280285

hisvalvalglupheasnserserglucysproaspglnalaalaglu

290295300

ilealalysileleuglyvallysalagluaspgluargglnleuala

305310315320

gluglnalaserhisalavalglyaspleuvallysaspileglyleu

325330335

prothrargleuargaspmetasnvalprogluglulysleualaasp

340345350

ilealaargaspserpheglnserglymetmetlyspheasnproarg

355360365

argalaserglusergluvalleugluleuleuhisargvaltyr

370375380

<210>3

<211>391

<212>prt

<213>geobacilluskaustophilus

<400>3

metvalglyhistyrileglnlysgluvalglupheglupheserphe

151015

hisleuprothrserileglnpheglytyrglylysalaserglnleu

202530

glyasnglnleuvalaspmetglyilelysseralapheleuvalthr

354045

aspargglyvalglualathrglyleuleualaglyileileglnser

505560

leugluserserasnileglntyrcysvaltyralaaspvalglupro

65707580

aspproserleugluthrileaspglnglyalaalaalaphelysglu

859095

glnpropheaspcysilevalalaileglyglyglyserproileasp

100105110

thralalysglyileargvalvalalathrasnglyglyserilegly

115120125

asptyralaglyvalasnargilelyslyslyssergluileproleu

130135140

ilealaleuprothrthrserglythrglysergluvalthrilephe

145150155160

glyvaltyrserasptrplysasnasnvallysvalthrvalthrser

165170175

protyrmetalaprogluilealaleuvalaspprolysleuthrmet

180185190

serleuprolyslysilethralaalaserglyileaspalaleuala

195200205

hisglyilegluthrphepheserleuargserglnproileserasp

210215220

valleualaileglualametthrthrvalasnargtyrleuargarg

225230235240

alavalgluaspglythrasnlysglualaargileglymetsertyr

245250255

glyserleuleualaglymetalapheasnasnglypheleuglyleu

260265270

alahisalaileglyseralaleuserglyhiscyshisvalserhis

275280285

glyvalalaileglyleuleuleuprolysvalvalglupheasnser

290295300

valvalglnproglulysalaalalysilealagluleuleuglyarg

305310315320

lysglyasnglnasnthrleuvalglnglnalaalaleualavalala

325330335

serleuvallysgluileglyleuprothrargleuargaspvalasp

340345350

valprolysglulysleuproaspilealalysaspserphelysser

355360365

glymetmetargpheasnproargglnproserglualagluvalmet

370375380

thrleuleuglnglniletyr

385390

<210>4

<211>390

<212>prt

<213>aneurinibacillusterranovensis

<400>4

metserproalavallysalaileasnpheglupheserpheasnleu

151015

prothrleuileglupheglytyrglylysmetglulyspheglygln

202530

glnleuileserileglyvallysargilephemetvalthrasplys

354045

glyvalgluseralaglyleuleualaalaleuthraspserleugln

505560

alaalaalaileglnpheaspiletyrthraspvalgluserasppro

65707580

serleugluthrileaspargglyvalgluvalpheglnglnlyspro

859095

tyraspcysilevalalavalglyglyglyserproileaspthrala

100105110

lysglyileargvalvalalaalaasnglyglyasnileglyhistyr

115120125

alaglyvalasnglnileprovalalaprothrileproleuleuala

130135140

ileprothrthrserglythrglysergluvalthrasnpheglyval

145150155160

tyrserasptrpglnasnasnvallysvalthrvalthrserglntyr

165170175

metalaprothrilealatrpvalaspproalaleuthrmetserleu

180185190

proalalysmetthralaalaserglyileaspalaleualahisgly

195200205

ilegluthrphepheserleuglyserserproalaseraspalaleu

210215220

alaileglualailehisthrvalasnargtyrleuserargalaval

225230235240

hisasnglyseraspmetglualaargileglymetserhisglyser

245250255

leuleualaglymetalapheasnasnglypheleuglyleualahis

260265270

alaileglyseralaleuserglyhiscyshisvalprohisglyval

275280285

alaileglyleuleuleuprolysvalvalglupheasnalathrval

290295300

argproasplysalaalalysilealaglyleumetglymetlysgly

305310315320

gluhisserglugluleualaleuglnalaserproalavalalaarg

325330335

leuvalgluaspileglyleuprothrargleuarggluvalaspval

340345350

thrglulyslysleuphegluilealalysaspserphelyssergly

355360365

metmetlyspheasnproargglnproserglusergluvalleugln

370375380

leuleulysgluilephe

385390

<210>5

<211>390

<212>prt

<213>brevibacillusthermoruber

<400>5

metserglnthrvalglnglythraspphealapheserphehisleu

151015

prothrleuileglupheglytyrglyargalaserargleuglyglu

202530

argleuglnhisleuglyvalthrasnvalphevalvalthrasplys

354045

glyvalglualaalaglyleuleuasnglyleuvalglyserleugln

505560

seralaglyilealapheaspleutyrthrgluvalgluproasppro

65707580

glyleugluthrileaspargglyalaalavalpheargalalyspro

859095

tyraspcysleuvalalavalglyglyglyserproileaspalaala

100105110

lysglymetargvalvalthrsercysglyglyserilealaasptyr

115120125

alaglyvalasnargvalprometalaproalavalproleuvalala

130135140

valprothrthrserglythrglysergluvalthrmetpheglyval

145150155160

tyrserasptrphisasnhisvallysvalthrvalthrserprohis

165170175

metalaprothrilealaleuvalaspproalaleuthrvalserleu

180185190

proalalysmetthralaalaserglyileaspalaleualahisgly

195200205

ilegluthrphepheservalargserargproalaseraspalaleu

210215220

alametglualailealaalavalasnalahisleuargargalaval

225230235240

hisaspglyseraspvalglualaargileglymetserhisglyser

245250255

leuleualaglymetalaphethrasnglypheleuglyleualahis

260265270

alaileglyseralaleuserglyhiscyshisvalprohisglyile

275280285

alaileglyleuleuleuprohisvalvalalapheasnalaproala

290295300

argproasplysalaalaglnleualaargleuleuglyvalgluala

305310315320

asnproargglugluargglyglugluthrseralaalavalalaarg

325330335

metvalalaaspileglyleuprothrargleuargaspvalglyval

340345350

progluglulysleuproalailealalysaspalaphelyssergly

355360365

metmetthrcysasnproargglnprothrgluglngluvalargglu

370375380

leuleuargargalaphe

385390

<210>6

<211>379

<212>prt

<213>brevibacilluspanacihumi

<400>6

metgluserpropheserphehisleuprothrasnvalglnphegly

151015

valglyseralaserargleuglyglumetleuleusermetglyval

202530

argargvalpheleuvalthraspglnglyvalargglnalaglyleu

354045

leuaspgluvalilehisserleugluglulysglyleuhisphegln

505560

iletyralaaspvalgluproaspproserleugluthrileglnala

65707580

glyalaalametpheglnglnglnserpheaspcysmetvalalaile

859095

glyglyglyserproileaspthralalysglyileargvalleuala

100105110

alaasnglyglyglyileglyglntyralaglyvalasnargvalpro

115120125

alaalaseralaileproleuilealaileprothrthrserglythr

130135140

glysergluvalthrilepheglyvaltyrserasptrpgluasnhis

145150155160

vallysilethrvalthrserprohismetalaproserthralaleu

165170175

ileaspproalaleuthrleuserleuproalalysmetthralaala

180185190

thrglyileaspalaleualahisglyilegluthrphepheserleu

195200205

argserserproalaseraspalaleualailehisalametlysmet

210215220

ilealaprohisleuargargalavalargaspglyalaaspmetglu

225230235240

alaargileglymetserglnglyservalleualaglymetalaphe

245250255

asnasnglypheleuglyleualahisalaileglyseralaleuser

260265270

glyhiscyshisvalprohisglyvalalaileglyleuleuleupro

275280285

hisvalvalalapheasnthrprovalargproglulysalagluleu

290295300

ilealaaspvalleuglyservalglnlysgluthrglythralaala

305310315320

gluleuvalglyglnleuvalglnaspileglyleuproglnargleu

325330335

glngluvalglyvalproglualalysleuvalaspilealalysasp

340345350

serphelysserglymetmetlystrpasnproargleuprothrglu

355360365

glngluvalleugluleuleuglnlysalaphe

370375

<210>7

<211>383

<212>prt

<213>bacillussp.fjat-14578

<400>7

mettyrproserphegluphehisleuprothrlysilehisphegly

151015

tyrasnthrilelysglnleuasphisleuprophegluilelysarg

202530

alapheilevalthraspglnglyvalleuasnserglyleuvalglu

354045

asnvalthrasnileleulysasphisglnilesertyrvaliletyr

505560

sergluvalgluproaspproservalgluthrvalasplysalaala

65707580

glnmetpheglnarggluglualaaspalaleuilealaileglygly

859095

glyserproileaspthralalysglyvalargvalilealaglyasn

100105110

glyglyserileargasptyralaglyvalasnleuilelysglnlys

115120125

serasnileproleuilealaileprothrthrserglythrglyser

130135140

gluvalthrilephealavalpheserasptrpglugluasnarglys

145150155160

valthrvalthrserpropheleualaproaspileserilevalasp

165170175

prolysmetthrmetthralaproproalailethralaalasergly

180185190

pheaspalaphealahisglyalagluthrphevalserargalaser

195200205

glnproalaseraspvalleualapheseralametserthrvalser

210215220

lystyrleuargargalavaltyrasnglygluaspvalglualaarg

225230235240

ilelysmetalaglualaserleuleualaglymetalapheasngln

245250255

sertyrleuglyleuthrhisalaileglyseralaleuserglyhis

260265270

alahisvalserhisglyvalalaileglyleuleuleuproglyval

275280285

ileargtyrasnserileserargmetasplyshisileglumetala

290295300

glyalaphearggluileaspargserleuserasptrpgluileile

305310315320

aspglnleuilegluaspvalserargleuargaspaspileglyleu

325330335

proglnargleuglnglnvalglyvallysgluaspglnleulysmet

340345350

ilealaalaaspservallysserglymettrplyspheasnproarg

355360365

glnalasergluglugluileleugluleuleulysgluleutyr

370375380

<210>8

<211>384

<212>prt

<213>desulfotomaculumkuznetsovii

<400>8

metglualaphethrpheglnleulysthrthrvalcyspheglyala

151015

asnvalvalserglyilevalasptrpcysargasntyrasnalalys

202530

argvalleuilevalthraspglnglyvalarglysalaglyileleu

354045

glulysvalglulysileleuseraspalaglyilegluasnvalval

505560

pheaspaspvalgluproaspproglyleugluthrilehisargcys

65707580

alasercysphearggluasnlyscysaspleuileleualavalgly

859095

glyglyserproileaspthralalysglyalaargvalilevalglu

100105110

asnglyglyhisileargasptyralaglyvalasnlysvalproarg

115120125

alaprovalthrproleuilealaileprothrthrserglythrgly

130135140

sergluvalthrthrphealavalleuserasptrpgluasnargmet

145150155160

lysilethrileserserpropheleualaprogluvalalavalval

165170175

aspproleuleuthrmetthralaproproservalthralaalaser

180185190

glyileaspalaleuserhisalailegluthrtyrvalserleulys

195200205

alaglnproproalaglualaleualaleulysalailegluleuile

210215220

glygluserleuargthralavalalaaspglyserasplysgluala

225230235240

argthrargmetserleuglyserleuleualaglymetalapheasn

245250255

asnserleuleuglyleuthrhisserileglyalaalaleusergly

260265270

hisalahisvalserhisglymetalaileglyleuleuleuprotyr

275280285

valmetglupheasnalametalaargmetglulyspheserlysile

290295300

alavalalaleuglygluaspvallysglyleuserleuarggluala

305310315320

alaleuargservallysalavalarggluleuvalgluaspileser

325330335

leuproargargleuglyaspvalglyvalthrglyaspmetileglu

340345350

glymetalalysaspalametglyhisglymetleulyspheasnpro

355360365

argalavalthrglulysaspileilealaileleuarglysalaleu

370375380

<210>9

<211>377

<212>prt

<213>desulfurisporathermophila

<400>9

metlysthrthrvalcyspheglyalaasnilevalserserileasp

151015

aspargcysargasptyrasnalaarghisvalleuilevalthrasp

202530

glnglyvalglulysalaglyileleuglulysvalglulysvalleu

354045

seraspalaglyilegluasnvalvalpheaspaspvalgluproasp

505560

proglyleugluthrilehisargcysalasercysphearggluasn

65707580

lyscysaspleupheleualaileglyglyglyserproileaspthr

859095

alalysglyalaargileilevalaspasnglyglyhisileargasp

100105110

tyralaglyvalasnlysvalproargalaproargthrproleuleu

115120125

alaileprothrthrserglythrglysergluvalthrthrpheala

130135140

valleuserasptrpgluasnargmetlysilethrileserserpro

145150155160

pheleualaprogluvalalavalvalaspproileleuthrleuthr

165170175

alaproproservalthralaalaserglyileaspalaleuserhis

180185190

alailegluthrtyrvalserleulysalaglnproproalagluala

195200205

leualaleulysalailegluleuileglygluserleuargalaala

210215220

valalaaspglyserasnlysglualaargthrlysmetserleugly

225230235240

serleuleualaglymetalapheasnasnserleuleuglyleuthr

245250255

hisserileglyalaalaleuserglyhisalahisvalserhisgly

260265270

metalavalglyleuleuleuprotyrvalmetglupheasnalamet

275280285

alaargleuglulystyrglylysilealailealaleuglygluasp

290295300

vallysglyleuserleuargglualaalaleuargservallysala

305310315320

valarggluleuvalgluaspileserleuproargargleuglyglu

325330335

valglyvalthrglyaspmetilegluglymetalalysaspalamet

340345350

glyhisglymetleulyspheasnproargvalvalthrglulysasp

355360365

ilemetalaileleuglnlysalaleu

370375

<210>10

<211>383

<212>prt

<213>bacillussp.l1(2012)

<400>10

mettyrthrserpheasnphehisleuprothrargileglnphegly

151015

tyrglulysvallysgluleulysasnleupropheglnalaasnarg

202530

alapheilevalthrasplysglyvalglulysalaglyleuleuasn

354045

aspvalileaspalailelysglnalaasnmetthrtyrlysiletyr

505560

argaspvalgluproaspproservalgluthrvalasplysalaala

65707580

lysalaphealaglualaglucysaspleuleuilealavalglygly

859095

glyserproileaspthralalysglyvalargvalvalalaserasn

100105110

glyglyserileargasntyrserglyvalasnleuvallysgluala

115120125

proservalproleuvalalaileprothrthralaglythrglyser

130135140

gluvalthrilephealavalpheseraspasplysgluasnarglys

145150155160

valthrvalthrserserhisleuserproaspvalserileileasp

165170175

prolysleuthrleuthralaproproserilethralaalaalagly

180185190

pheaspalaphealahisalaalaglualaphevalserargileser

195200205

glnproproseraspalaleualaleuseralametlysthrvalhis

210215220

thrtyrleuargargalavaltyrasnglyaspaspileglualaarg

225230235240

metlysmetalaglualaserleuleualaglymetalapheasngln

245250255

sertyrleuglyleualahisalaileglyseralaileservalhis

260265270

alahisvalserhisglyvalvalileglyleuleuleuprolysval

275280285

ileglutyrasnleuvalalalysileasplystyralaglualagly

290295300

lystyrilegluglnserserhisglyleuserasntyrglualaala

305310315320

alaleuphesergluthrvalthrglnleuargasnaspileglyleu

325330335

prolysglnleuarggluvalasnvallysglualaglnleugluala

340345350

ileserlysaspserilelysserglymettrpglnpheasnproarg

355360365

argalasergluglnaspvaltyrglnmetleuargglumetleu

370375380

<210>11

<211>387

<212>prt

<213>pelotomaculumthermopropionicum

<400>11

metalaasptyrasnpheserphealavalargthrlysvalphephe

151015

glyargglyvalvalphegluglnleuproglyalavalargglumet

202530

glycyslyslysalavalleuvalseraspproglyilevalglythr

354045

glyleualaaspargvallysaspleuleualaglyglyglyvalala

505560

valgluvalphesergluvalgluproaspproglyleugluthrval

65707580

hislysalaalaalapheleuglyargthrargproaspcysleuval

859095

alaleuglyglyglyserserileaspvalalalysglyalaargval

100105110

iletyraspasnglyglylysileserasptyralaglyvalasnlys

115120125

vallysvallysproserleuproleumetalavalprothrthrala

130135140

glythrglysergluvalthrvalphealavalleuserasptrpglu

145150155160

glnasnilelysilethrvalthrserglutyrleualaprogluala

165170175

alaphevalaspproleualametvalseralaproproglyilethr

180185190

alaalaserglyileaspalaleuserhisalavalglualatyrval

195200205

serargalaalaserprovalseraspasnleualaleuglyalaval

210215220

gluleuileglyglyhisleuargglnalavalalaasnglyglyasp

225230235240

leualaalaargthrglyalaalaleuglyserleuleualaglymet

245250255

alapheasnasnalapheleuglyleuthrhisserileglyalaala

260265270

leuserglyhisvalhisvalserhisglyvalalavalglyleuleu

275280285

leuprotyrvalmetglutyrasnleumetalalysproasplysphe

290295300

alaargleualaargalametglygluvalthrgluglylysserleu

305310315320

tyrargalaalaserleualaproargalavallysalametvallys

325330335

serileglyleuprovalargleulysgluileglyvalproglugly

340345350

alaleualaalailealagluthralaleulyshisglymetilelys

355360365

pheasnproargvalproserarggluaspileleuaspilevallys

370375380

lysalatyr

385

<210>12

<211>1176

<212>dna

<213>aeribacilluspallidus

<400>12

atgatcggaaattacgcaaaaaaggcgattgatttcgagttcactttttatcttcctaca60

ttgatcgaattcggatacggcaaggcttcccgaatgggagagatgcttgaacagatgggt120

ataaagaacgtttttttggttaccgacaaaggagtggaagctgcgggtctgttggcagga180

atcgttcagtctctggaatcatccaatatccgatatgttatttattcagacgtagaacct240

gacccgagcttagagacgattgatcgtggtgcgtccgtttttaaggagcagtcttttgac300

tgtatcttagctgtgggtggaggaagtccgattgatacagctaaggggatccgtgtcgta360

gtgacgaacggaggaaacatcggtgactatgccggtgttaaccgtgttgcgaaaaaatct420

gaaattcctttggtggctgtgccgactacatccggcacgggcagtgaagtaaccattttc480

ggagtctactccgattgggaaaatcaagtaaaggtgacggtaacaagcccatatatggcg540

ccggagatcgctttggtagaccccgaacttaccatgagtctaccgcaaaaaatgacagca600

gcatcgggaattgatgctctagctcatgggattgaaactttcttctccttgcgttctcga660

cctgcatccgatgccctagcggtcgaagcgatggcgacggtgagtgcttatttgcgccgt720

gcggtggaagatggtacggataaagaagcgaggatcggcatgtcccagggcagtttgttg780

gcagggatggcattcaacaatggcttcttaggtttggcccatgcgatcggtagtgctttg840

tctggccattgtcatgtgtcccatggtgtcgcaatcggtttgttgctaccgaaagtggtg900

gaatttaatgctagggtgcgcccggaaaaagctgcaaaaatcgcagaattgttgggagta960

aaaggggatcgagaggaggttcttgcggagcaggcagctcctgcagtcgcctcgttagtc1020

aaagagattggtcttcccactcgtttgcgtgatgttgatgtttctgaagaaaagctccca1080

gatatcgcaagagatgcatttaaaagcggtatgatgaagtttaacccacgccaaccaagt1140

ttgtcagaagtgcttacacttttgcagcagatttat1176

<210>13

<211>1179

<212>dna

<213>artificial

<220>

<223>syntheticcodonoptimisedforexpressioninp.putida

<400>13

atgatcggcaactacgccaagaaggccatcgacttcgagttcaccttctacctgccgacc60

ctgatcgagttcggctacggcaaggccagccgcatgggcgagatgctggaacaaatgggt120

atcaagaacgtgttcctggtgaccgacaagggcgtggaagccgccggtctgctggccggc180

atcgtgcagagcctggaaagcagcaacatccgctacgtgatctacagcgacgtggaaccg240

gacccgagcctggaaaccatcgaccgcggcgccagcgtgttcaaagaacagagcttcgac300

tgcatcctggccgtgggcggcggcagcccgatcgacaccgccaagggcatccgcgtggtg360

gtgaccaacggcggcaacatcggcgactacgccggcgtgaaccgcgtggccaagaagtcg420

gagatcccgctggtcgccgtgccaaccacctcgggcaccggcagcgaagtgaccatcttc480

ggcgtgtacagcgactgggagaaccaggtgaaggtgaccgtgaccagcccgtacatggcc540

ccggaaatcgccctggtggacccggaactgaccatgagcctgccgcagaagatgaccgcc600

gccagcggcatcgacgccctggcccacggcatcgaaaccttcttcagcctgcgcagccgc660

ccagcctcggatgccctggcggtggaagccatggccaccgtgagcgcctacctgcgccgc720

gccgtcgaggacggcaccgacaaagaagcccgcatcggcatgagccagggcagcctgctg780

gcgggcatggccttcaacaacggcttcctgggcctggcccatgccatcggcagcgccctg840

agcggccattgccatgtgagccacggcgtggccatcggcctgctgctgccgaaggtggtg900

gaattcaacgcccgcgtgcgcccggaaaaggccgccaagatcgccgaactgctgggcgtg960

aagggcgaccgcgaagaggtgctggccgaacaggccgccccagccgtggccagcctggtg1020

aaagaaatcggcctgccgacccgcctgcgcgacgtggacgtgagcgaagagaagctgccg1080

gacatcgcccgcgacgccttcaagagcggcatgatgaagttcaacccgcgccagccgagc1140

ctgagcgaggtgctgaccctgctgcagcagatctactga1179

<210>14

<211>1152

<212>dna

<213>artificial

<220>

<223>syntheticcodonoptimisedforexpressioninp.putida

<400>14

atggacgtggaattcagcttccatctgccgaccctgatcgagttcggcttcggcaaggcc60

agcctgctgggcgagcgcctgctgaagctgggcgtgggcaacgtgttcctggtgagcgac120

aagggcgtggccagcgcaggcctgctgcagaagctggaacagagcctgcagaccagcgac180

atccacttcaagacctacctggaagtggaaccggacccgagcctggaaaccatcgacctg240

ggtgccgaggccttcaacagcggcaagtacgactgcatcgtggccgtgggtggtggcagc300

gccatcgacaccgccaagggcatccgcgtggtggcaggcaacggtggcagcatcggcgac360

ttcgcaggcgtggacaagatcggcaaggcaccgcagatcccgctgatcgccgtgccgacc420

acctcgggcaccggcagcgaagtgaccatcttcggcgtgtacagcgactgggtgaagaac480

gtgaaggtgaccgtgaccagccagtacatggcaccgaccattgccctggtggacccggaa540

ctgaccatgcgcctgccacgcaagatgaccgcagccagcggcatcgacgccctggcccac600

ggcatcgagagctacttcagcctgcgcagcaccagcgccagccgtgccctgtcgctggaa660

gccatcaacatcgtgggcaaccatctgcgccagagcgtggcgaacggcgaggacaaggaa720

gcacgctgcggcatgagccacggcagcctgctggcaggcatggcgttcaacaacggcttc780

ctgggcctggcccatgccatcggcagcgcactgagcggtcactgccacgtgccgcacggc840

gtggccatcggcctgctgctgccgcacgtggtggaattcaacagcagcgagtgcccagac900

caggcagccgagatcgccaagatcctgggcgtgaaggccgaggacgaacgccagctggcc960

gaacaggccagccacgccgtgggcgacctggtgaaggacatcggcctgccgacccgtctg1020

cgcgacatgaacgtgccggaagagaagctggccgacattgcacgcgacagcttccagagc1080

ggcatgatgaagttcaacccacgtcgtgccagcgagagcgaggtgctggaactgctgcac1140

cgcgtgtactga1152

<210>15

<211>1994

<212>dna

<213>artificial

<220>

<223>syntheticxbai-salifragment

<400>15

tctagatcttctttgataataaatgaaagcagccggtatggagagaaaaaagtgcactta60

tatgaagttgattttatggtcggctttattttgcccgtcgtactggctgtccacacgatg120

ttcatttttgatgcacaattgaatggctgtacagttgcgtttttgtcgatgtctggcggg180

cacgcctccatgcatgtgaagcagattcttttaagcgggcagcacccgcttttttggagg240

gcaggcattcaggagcaaaaatggcagagatcagttgggcgggatcagccatttattcct300

ccatccggggcactttgtgaaaatcagcacaagaatgaataacgctttcatatctggctt360

tttcaaataaaaccatttgtgaaaaatgtaaacggatgattttgaaaaaccgtcattttc420

ctttaaaaccgggcatttgggcagataaattttcaaattttcgccataaaatatgtgaat480

ctaatcacaaaaatagtggtatacttacccatgtggaatgaaggaaaatgaacggaacga540

tccatttcagccataaaagggcatgccgtccatctatttcacaaaccgcacggcagcatt600

tgctgcaaaagtttaatcgtcctgctttaaaggaaaagcagtatggaatccattaggagt660

tggcacaatatccatagactggataggggcccgccatgccgggcttgcaaaactgctttc720

atacagtggaaatattttttacttttgatggggaggaagattatatatgatcggaaatta780

cgcaaaaaaggcgattgatttcgagttcactttttatcttcctacattgatcgaattcgg840

atacggcaaggcttcccgaatgggagagatgcttgaacagatgggtataaagaacgtttt900

tttggttaccgacaaaggagtggaagctgcgggtctgttggcaggaatcgttcagtctct960

ggaatcatccaatatccgatatgttatttattcagacgtagaacctgacccgagcttaga1020

gacgattgatcgtggtgcgtccgtttttaaggagcagtcttttgactgtatcttagctgt1080

gggtggaggaagtccgattgatacagctaaggggatccgtgtcgtagtgacgaacggagg1140

aaacatcggtgactatgccggtgttaaccgtgttgcgaaaaaatctgaaattcctttggt1200

ggctgtgccgactacatccggcacgggcagtgaagtaaccattttcggagtctactccga1260

ttgggaaaatcaagtaaaggtgacggtaacaagcccatatatggcgccggagatcgcttt1320

ggtagaccccgaacttaccatgagtctaccgcaaaaaatgacagcagcatcgggaattga1380

tgctctagctcatgggattgaaactttcttctccttgcgttctcgacctgcatccgatgc1440

cctagcggtcgaagcgatggcgacggtgagtgcttatttgcgccgtgcggtggaagatgg1500

tacggataaagaagcgaggatcggcatgtcccagggcagtttgttggcagggatggcatt1560

caacaatggcttcttaggtttggcccatgcgatcggtagtgctttgtctggccattgtca1620

tgtgtcccatggtgtcgcaatcggtttgttgctaccgaaagtggtggaatttaatgctag1680

ggtgcgcccggaaaaagctgcaaaaatcgcagaattgttgggagtaaaaggggatcgaga1740

ggaggttcttgcggagcaggcagctcctgcagtcgcctcgttagtcaaagagattggtct1800

tcccactcgtttgcgtgatgttgatgtttctgaagaaaagctcccagatatcgcaagaga1860

tgcatttaaaagcggtatgatgaagtttaacccacgccaaccaagtttgtcagaagtgct1920

tacacttttgcagcagatttattaattgttcgggtttcagtgttccattttcaaatattc1980

cgttaagggtcgac1994

<210>16

<211>1258

<212>dna

<213>artificial

<220>

<223>synthetickpni-xbaifragment

<400>16

ggtaccttcacacaggaaacaggaggtacaatgatcggaaattacgcaaaaaaggcgatt60

gatttcgagttcactttttatcttcctacattgatcgaattcggatacggcaaggcttcc120

cgaatgggagagatgcttgaacagatgggtataaagaacgtttttttggttaccgacaaa180

ggagtggaagctgcgggtctgttggcaggaatcgttcagtctctggaatcatccaatatc240

cgatatgttatttattcagacgtagaacctgacccgagcttagagacgattgatcgtggt300

gcgtccgtttttaaggagcagtcttttgactgtatcttagctgtgggtggaggaagtccg360

attgatacagctaaggggatccgtgtcgtagtgacgaacggaggaaacatcggtgactat420

gccggtgttaaccgtgttgcgaaaaaatctgaaattcctttggtggctgtgccgactaca480

tccggcacgggcagtgaagtaaccattttcggagtctactccgattgggaaaatcaagta540

aaggtgacggtaacaagcccatatatggcgccggagatcgctttggtagaccccgaactt600

accatgagtctaccgcaaaaaatgacagcagcatcgggaattgatgctctagctcatggg660

attgaaactttcttctccttgcgttctcgacctgcatccgatgccctagcggtcgaagcg720

atggcgacggtgagtgcttatttgcgccgtgcggtggaagatggtacggataaagaagcg780

aggatcggcatgtcccagggcagtttgttggcagggatggcattcaacaatggcttctta840

ggtttggcccatgcgatcggtagtgctttgtctggccattgtcatgtgtcccatggtgtc900

gcaatcggtttgttgctaccgaaagtggtggaatttaatgctagggtgcgcccggaaaaa960

gctgcaaaaatcgcagaattgttgggagtaaaaggggatcgagaggaggttcttgcggag1020

caggcagctcctgcagtcgcctcgttagtcaaagagattggtcttcccactcgtttgcgt1080

gatgttgatgtttctgaagaaaagctcccagatatcgcaagagatgcatttaaaagcggt1140

atgatgaagtttaacccacgccaaccaagtttgtcagaagtgcttacacttttgcagcag1200

atttattaattgttcgggtttcagtgttccattttcaaatattccgttaaggtctaga1258

<210>17

<211>446

<212>prt

<213>aeribacilluspallidus

<400>17

metlysasnilealaasnthrserthrgluargprovalasnaspala

151015

servallysasnargglnmetvalargalathrilealaserleuile

202530

glytrpserleuaspleutyraspleupheleuleuleuphevalala

354045

thrthrileglyasnleuphepheproalaserasnglnthrleuser

505560

leualaalavaltyralaserphealavalthrleuleumetargpro

65707580

leuglyseralailepheglyiletyralaasplysasnglyarglys

859095

lysalametthrvalalaileileglyalaglyleucysthralaala

100105110

pheglyleuleuprothrilehisglnvalglyvalvalalaalaile

115120125

alapheleuileleuargleuvalglnglyvalphevalglyglyval

130135140

valalaserthrhisthrileglythrgluseralaserprolystyr

145150155160

argglyphemetserglyleuileglyglyglyglyalaglyleugly

165170175

alaleuphealaserilesertyrservalvalthralailephepro

180185190

glyglualapheaspvaltrpglytrpargvalmetphephethrgly

195200205

ileileglyserleupheglyleupheilepheargserleugluglu

210215220

serproleutrplysglnleulysglugluasnserlysglygluval

225230235240

serglupheglnlysalaproleulysthrphephethrlystyrtyr

245250255

lysvalleuleuvalasnleumetilevalileglyglyglysergly

260265270

tyrtyrleuthrserglypheileprothrpheleulysvalvalasn

275280285

lysvalseralaservalserserglyvalleuilealathrserile

290295300

metthrilevalalaalavalleuvalglyhisleusergluvalile

305310315320

glyarglyslysthrpheleuleuileglyileleucysleuvalgly

325330335

leuprotyrphetyrleuserleualaasnserthrthrthrthrgly

340345350

iletyrleuasnalaleuglyleuilepheleuglyasnalaalatyr

355360365

alaprovalleuilepheleuasngluargpheprothrserilearg

370375380

serthrglythrglyleusertrpasnmetglyphealaileglygly

385390395400

metmetprothrphevalasnleualaserglythrvalgluhisile

405410415

protyrthrleumettyrphethrileglyiletyrleuvaltyrile

420425430

leuglyserleuileileprogluthrlysglyasnleulys

435440445

<210>18

<211>1338

<212>dna

<213>aeribacilluspallidus

<400>18

gtgaagaatatcgctaatacgagtaccgaacgacctgtaaatgatgcttcagttaagaat60

cgtcaaatggtgcgagctacgattgcctcgctcatagggtggtcactcgatctttacgat120

ttatttctgctgctttttgttgcgacgaccatagggaatttgttttttcccgccagcaat180

caaacactttctttggctgccgtgtatgcttcctttgccgttacgcttttgatgcggcct240

ttgggttccgccattttcggcatttatgcggataaaaacgggagaaagaaagcgatgact300

gtggcaatcattggagcaggcttgtgcacggcggctttcggtctgttacctacgatccac360

caagttggagtggtcgctgcgatcgccttcttgattttacgtttagttcaaggagtgttt420

gtcggcggagtggttgcttccacccatacgataggaacggaatccgcatcgccaaaatat480

cgggggtttatgtcgggattgatcggtggtggcggagcaggattgggagcactgtttgct540

tctatttcttattcggttgtgacggcaatttttccgggagaggcttttgatgtttgggga600

tggcgtgtcatgtttttcacaggcattatcggttccctcttcggccttttcatattccgg660

tcccttgaggaatctcctctctggaaacaattgaaagaagaaaatagtaaaggcgaagtg720

tccgagtttcagaaagcaccgctgaagacgtttttcactaaatattacaaggtattgctc780

gtcaaccttatgatcgtcatcggtggtggctccggttattatctgactagtggatttatt840

cctacatttttaaaggtagttaacaaagtatcagcctctgtttcgtcgggggtactcatt900

gcgacaagtattatgaccattgtagccgccgttctcgtgggacacctgagcgaggtcatc960

ggcagaaagaaaacatttctgttaatcggtattctttgtcttgtcggacttccgtatttt1020

tatctgtcattggcaaactcaactacgacaacgggcatctacttaaatgctcttggactc1080

atattcttggggaatgctgcatatgcaccggtactcatcttcttgaacgaacgttttccc1140

acatcgatccgttcaacaggtaccggattatcatggaacatgggtttcgccattggcggg1200

atgatgccgacgtttgtgaacttagccagtggtacggtggaacatattccttacacgctg1260

atgtattttactatcggaatttacttggtttatatccttggcagcctgattattccggaa1320

acaaaaggaaacctcaaa1338

<210>19

<211>1184

<212>dna

<213>artificial

<220>

<223>synthetickpni-nheifragmentwithcodonoptimizedb.kribbensis

yiay

<400>19

ggtacctaggaaaggaagattaacccatggacgtggaattcagcttccatctgccgaccc60

tgatcgagttcggcttcggcaaggccagcctgctgggcgagcgcctgctgaagctgggcg120

tgggcaacgtgttcctggtgagcgacaagggcgtggccagcgcaggcctgctgcagaagc180

tggaacagagcctgcagaccagcgacatccacttcaagacctacctggaagtggaaccgg240

acccgagcctggaaaccatcgacctgggtgccgaggccttcaacagcggcaagtacgact300

gcatcgtggccgtgggtggtggcagcgccatcgacaccgccaagggcatccgcgtggtgg360

caggcaacggtggcagcatcggcgacttcgcaggcgtggacaagatcggcaaggcaccgc420

agatcccgctgatcgccgtgccgaccacctcgggcaccggcagcgaagtgaccatcttcg480

gcgtgtacagcgactgggtgaagaacgtgaaggtgaccgtgaccagccagtacatggcac540

cgaccattgccctggtggacccggaactgaccatgcgcctgccacgcaagatgaccgcag600

ccagcggcatcgacgccctggcccacggcatcgagagctacttcagcctgcgcagcacca660

gcgccagccgtgccctgtcgctggaagccatcaacatcgtgggcaaccatctgcgccaga720

gcgtggcgaacggcgaggacaaggaagcacgctgcggcatgagccacggcagcctgctgg780

caggcatggcgttcaacaacggcttcctgggcctggcccatgccatcggcagcgcactga840

gcggtcactgccacgtgccgcacggcgtggccatcggcctgctgctgccgcacgtggtgg900

aattcaacagcagcgagtgcccagaccaggcagccgagatcgccaagatcctgggcgtga960

aggccgaggacgaacgccagctggccgaacaggccagccacgccgtgggcgacctggtga1020

aggacatcggcctgccgacccgtctgcgcgacatgaacgtgccggaagagaagctggccg1080

acattgcacgcgacagcttccagagcggcatgatgaagttcaacccacgtcgtgccagcg1140

agagcgaggtgctggaactgctgcaccgcgtgtactgagctagc1184

<210>20

<211>1359

<212>dna

<213>artificial

<220>

<223>ecori-nheipcrfragmentwitha.palliduspropcodingsequence

<400>20

gccgaattcatgaagaatatcgctaatacgagtaccgaacgacctgtaaatgatgcttca60

gttaagaatcgtcaaatggtgcgagctacgattgcctcgctcatagggtggtcactcgat120

ctttacgatttatttctgctgctttttgttgcgacgaccatagggaatttgttttttccc180

gccagcaatcaaacactttctttggctgccgtgtatgcttcctttgccgttacgcttttg240

atgcggcctttgggttccgccattttcggcatttatgcggataaaaacgggagaaagaaa300

gcgatgactgtggcaatcattggagcaggcttgtgcacggcggctttcggtctgttacct360

acgatccaccaagttggagtggtcgctgcgatcgccttcttgattttacgtttagttcaa420

ggagtgtttgtcggcggagtggttgcttccacccatacgataggaacggaatccgcatcg480

ccaaaatatcgggggtttatgtcgggattgatcggtggtggcggagcaggattgggagca540

ctgtttgcttctatttcttattcggttgtgacggcaatttttccgggagaggcttttgat600

gtttggggatggcgtgtcatgtttttcacaggcattatcggttccctcttcggccttttc660

atattccggtcccttgaggaatctcctctctggaaacaattgaaagaagaaaatagtaaa720

ggcgaagtgtccgagtttcagaaagcaccgctgaagacgtttttcactaaatattacaag780

gtattgctcgtcaaccttatgatcgtcatcggtggtggctccggttattatctgactagt840

ggatttattcctacatttttaaaggtagttaacaaagtatcagcctctgtttcgtcgggg900

gtactcattgcgacaagtattatgaccattgtagccgccgttctcgtgggacacctgagc960

gaggtcatcggcagaaagaaaacatttctgttaatcggtattctttgtcttgtcggactt1020

ccgtatttttatctgtcattggcaaactcaactacgacaacgggcatctacttaaatgct1080

cttggactcatattcttggggaatgctgcatatgcaccggtactcatcttcttgaacgaa1140

cgttttcccacatcgatccgttcaacaggtaccggattatcatggaacatgggtttcgcc1200

attggcgggatgatgccgacgtttgtgaacttagccagtggtacggtggaacatattcct1260

tacacgctgatgtattttactatcggaatttacttggtttatatccttggcagcctgatt1320

attccggaaacaaaaggaaacctcaaataagctagcggc1359

<210>21

<211>20

<212>dna

<213>artificial

<220>

<223>ribosomebindingsite

<400>21

taggaaaggaagattaaccc20

<210>22

<211>30

<212>dna

<213>artificial

<220>

<223>pcrprimerprop(f)

<400>22

gccgaattcatgaagaatatcgctaatacg30

<210>23

<211>34

<212>dna

<213>artificial

<220>

<223>pcrprimerprop(r)

<400>23

gccgctagcttatttgaggtttccttttgtttcc34

<210>24

<211>500

<212>prt

<213>cupriavidusbasilensis

<400>24

metasnalaglnhistrpilealaglyalatrpthrglygluproser

151015

alaaspservalasnproalaaspglythrleuileglyglnpheala

202530

aspglyglythrtrpglnalaglualaalailealaalaalaarghis

354045

valphegluargthrthrtrpglyglnaspalaargleuargglnasp

505560

valleuleualatrpalaglyalaleuglualagluarggluargleu

65707580

alaserleuleuthralagluasnglylysprovalalaglnalaarg

859095

glygluvalglyalaalailesergluvalargtyrtyralaglyleu

100105110

alaarghisileproglyhisvalleugluprogluproglythrile

115120125

serthrileleuarggluproalaglyvalalaalaileilevalpro

130135140

trpasnalaproalavalleuleuvalargserleualaproalaleu

145150155160

alaalaglycysthralavalvallysseralaalaglnthrthrleu

165170175

phethralaalametleuargleuphegluargthralaleuproala

180185190

glyalavalasnleuvalcysgluthrglytyralaalaalaasphis

195200205

leuvalargserargaspvalaspvalvalserphethrglyserthr

210215220

alathrglylyslysilemetilealaalaalaaspservallyslys

225230235240

leuserleugluleuglyglylyssercyscysleuvalpheaspasp

245250255

valaspalaglnalavalalalysargleualaleualaalathrval

260265270

ileserglyglnglncysthralaalaargargvalleuvalhisglu

275280285

alailealaproglnmetargarghisleuthrglualaleualaala

290295300

leuargleuglyproglyilegluproaspthrglnileglyproleu

305310315320

ileasphisprothrargalametvalseralaglnvalgluargala

325330335

cysaspglualaaspthrvalleuleuargglythrmetproglygly

340345350

alaleualaargglyalapheleuserprothrleuvalgluhisser

355360365

aspproglyalaphephecysglnglugluilepheglypropheval

370375380

thrphegluthrphealathrgluaspglualaleualalysalaasn

385390395400

asnthrvalpheglyleuseralaservaltrpthrhishisglyglu

405410415

argalaileargleualaargalaleuargasnglythrvaltrpval

420425430

asnasphisasnargleuphealaglualagluthrglyglytyrarg

435440445

glnserglyleuglyargleuhisglytyraspalaleualaaspphe

450455460

thrgluleulyshisilecysileglnalaglyleuprolysglymet

465470475480

serglnalaglycysargleuserglyvalalaalaarggluargmet

485490495

glyvalserval

500

<210>25

<211>479

<212>prt

<213>burkholderiasp.ccge1002

<400>25

metasnalaarghistrpilealaglyglutrpthrglythrproasn

151015

ileaspserileaspproalathrglyaspalaileglyargpheala

202530

aspglyglyserserglualaaspalaalailealaalaalaarghis

354045

alapheaspargthrthrtrpalaglnaspalaargleuargglnasp

505560

valleuleuglytrpalaseralaleuglualagluargaspmetleu

65707580

alathrleuleuthrarggluasnglylysalailealaglnserarg

859095

aspgluilealaglyalailesergluvalargtyrtyralaglyleu

100105110

alaarghisilealaglyhisvalleugluprogluproglythrile

115120125

serthrmetleuargglualaalaglyvalalaalaileilevalpro

130135140

trpasnalaproalavalleuleuvalargserleualaproalaleu

145150155160

alaalaglycysthrvalilevallysproalaalaglnthrserleu

165170175

leuthralaalametleuargcysphegluhisthralaleuproglu

180185190

glyalavalasnleuvalasngluargglytyralaalaserglnarg

195200205

leuvalaspserhisglyvalaspvalvalserphethrglyserthr

210215220

alathrglylyslysilemetalaalaalaalaaspsermetlyslys

225230235240

leuserleugluleuglyglylyssercyscysvalvalpheaspasp

245250255

alaaspvalalaalailealaproargleualaargalaalathrile

260265270

ileserglyglnglncysthralaalaargargvalleuvalhisala

275280285

serargalaalaglnmetarggluglnleualaseralaleualaser

290295300

leuargvalglyproglyileaspproalathraspileglyalaleu

305310315320

ileaspglythrthrargaspalavalalaargthrilegluargala

325330335

cysglythralagluargvalleuleuargglythrcysserglyhis

340345350

alapheleuserprothrleuvalgluhisaspaspprolysalaphe

355360365

phecysglnaspgluilepheglyprophevalthrleugluvalphe

370375380

gluasnglumetglualaileglulysalaasnaspthrvalphegly

385390395400

leuseralaservaltrpthrhisaspglyalaargalaleuargval

405410415

alaargalaleuargasnglythrvaltrpileasnasphisasnlys

420425430

leuphealaglualagluthrglyglytyrargglnserglyleugly

435440445

argleuhisglytyraspalaleualaaspphethrgluleulyshis

450455460

ilecysmetproalaglyvalalagluglyilealaproleuarg

465470475

<210>26

<211>483

<212>prt

<213>burkholderiagraminisc4d1m

<400>26

metgluargaspalametasntrpilealaglyglutrpalaglylys

151015

provalleualaserseraspproserasnglygluthrleuglyarg

202530

phevalserserasnthrglnaspalaaspalaalavalseralaala

354045

arghisthrpheasphisthrthrtrpalaglnaspalaargargarg

505560

glnaspvalleuleuargtrpalaglnalaleugluleuservalglu

65707580

proleualagluleuleuthrhisgluasnglylysthrileglygln

859095

alaargglyglumetargalaalailesergluvalargtyrtyrala

100105110

glyleualaarghisilealaglyhisvalilegluprogluprogly

115120125

thrileserthrmetleuargglualaalaglyvalalaalaileile

130135140

valprotrpasnalaproalavalleuleuvalargserleualapro

145150155160

alaleualaalaglycysthralailevallysproalaalaglnthr

165170175

serleuilethralaalametileargcysleuaspglnproalaleu

180185190

proalaglyalavalasnleuleuleugluasnglyalaglualaala

195200205

alaargleuvalgluseralaaspvalaspvalileserphethrgly

210215220

serthrgluvalglylysargilemetargalaalaalaaspsermet

225230235240

lysargleuserleugluleuglyglylyssercyscysleuvalphe

245250255

gluaspseraspvallysalailealaproargleualaargalaala

260265270

thrileileserglyglnglncysthralaalaargargileleuval

275280285

hisvalserlysalaaspglnmetargaspgluleuvallysalaleu

290295300

alaserleulysvalglyproglyileaspproalaseraspilegly

305310315320

alaleuileaspalaalaserargaspalavalglnthrthrvalglu

325330335

argalacysaspleualaaspargvalleuleuargglythrserser

340345350

glyproglyalapheleuserprothrleuvalgluhisglyglupro

355360365

hisalaphephecysglnaspgluilepheglyprophevalthrleu

370375380

gluthrphevalthrglulysglualavalglulysalaasnasnthr

385390395400

valpheglyleuseralaservaltrpthrhisaspseralaargala

405410415

pheargilealaargalaleuargaspglythrvaltrpileasnasp

420425430

hisasnargleuphealaglualagluthrglyglytyrargglnser

435440445

glyleuglyargleuhisglytyraspalaleualaaspphethrglu

450455460

ilelyshisilecysvalglyalaglyvalleugluglyilegluval

465470475480

leuglyser

<210>27

<211>483

<212>prt

<213>azospirillumsp.b510

<400>27

metthrasnleuaspserarghistrpileaspglyalatrpvalpro

151015

glythraspargphealaserileasnproalaaspglyservalleu

202530

glyhisalaalaaspglyglyargalaglualaglualaalaileala

354045

alaalahisalaalapheasnargproasptrpalaglnasnproarg

505560

leuargglnserileleuleuglytrpalaaspargleuaspthrgln

65707580

alagluaspleualaargleuleuthrleugluasnglylysalaile

859095

alaglnserargglygluilealaglyalailesergluileargtyr

100105110

tyrglyglyleualaarghisvalproglyhisvalleugluvalglu

115120125

proglyvalleuserthrmetleuarggluproalaglyvalalaala

130135140

leuileileprotrpasnalaproalavalleuleualaargalaile

145150155160

glyproalaleualacysglycysthrvalvalvallysproalaala

165170175

glnthrthrleuleuthralaalapheleuargalaleusergluval

180185190

proserleuproargglyvalcysasnmetilesergluthrglyhis

195200205

alaalaalaalaargleuvalaspserproleuvalaspvalvalser

210215220

phethrglyserthralathrglylysargilemetvalalaalaala

225230235240

aspthrmetlyslysleuserleugluleuglyglylyssercyscys

245250255

leuvalpheproaspalaaspproalagluthralaalaargileala

260265270

thralaalathrileileserglyglnglncysthralaalaargarg

275280285

valleuvalhisalaseralapheaspalametlysthrhisleuarg

290295300

alaalaleualaalametthrvalglyasnglyleuaspproalaile

305310315320

argmetglyproleuileaspargproalaargaspglnvalglnthr

325330335

glnvalgluargalapheaspalacysaspgluvalleuleuarggly

340345350

glyvalprothraspserproalaalaalaserpheleuthrproser

355360365

leuvalalahisaspaspproseralaphephecysglnaspgluile

370375380

pheglyprophevalvalleugluargphegluthrglualagluala

385390395400

valalalysalaasnasnthrvalpheglyleuseralaservaltrp

405410415

thrargaspglyalaargalaleuargmetalaargalaleuargasn

420425430

glythrvaltrpileasnasphisasnargleuphealaglualaglu

435440445

thrglyglytyrargglnserglyleuglyargleuhisglytyrasp

450455460

alaphealaaspphethrgluleulyshisvalcysglnthrvalgly

465470475480

thrilegly

<210>28

<211>480

<212>prt

<213>pseudomonasputida

<400>28

metglnserglnhistyrileaspglyglntrpthrserthrasparg

151015

trpthraspserleuaspproalaserglygluleuileglycysphe

202530

alaaspglyglyglualaglualaglualaalavalalaalaalaala

354045

argalapheasnaspproglntrpalaglnasnproargleuarggln

505560

glnleuleuleuglutrpalaalaglyleulysalaargglnglugln

65707580

leualaglnleuleuthrarggluasnglylysalaleualaglnser

859095

argglygluileglyglyalailesergluileleutyrtyralagly

100105110

leualaarghisasnproglyhismetleugluvalalaproglyglu

115120125

phesersermetleuarggluproalaglyvalalaglyleuileile

130135140

protrpasnalaproalavalleuleuvalargalaleualaproala

145150155160

ilealaalaglycysthrvalvalilelysproalaproglnthrala

165170175

leupheasnalaalametleugluproleuphealaleuproglyleu

180185190

proalaglyalavalasnleuphealagluserglyhisalaglyala

195200205

alahisleuvalalaserproargvalaspvalleuserphethrgly

210215220

serthralathrglyglnargilemetargaspcysalaalathrmet

225230235240

lyslysleuserleugluleuglyglylyssercyscysleuvalphe

245250255

gluaspalaaspilealaalailealaprolysleualaalaalaala

260265270

thrileileserglyglnglncysthralaalaargargvalleuval

275280285

hisalaserargphealaglumetlysthralaleuseralaalaleu

290295300

glyglnileargleuglyasnglyleuaspproalaasnasnmetgly

305310315320

proleuileasptrphisserargaspservalgluargargilegly

325330335

glualaleuaspsercysaspgluvalleuleualaglyglyargpro

340345350

glnglygluleuserlysglyalapheleualaproserleuileala

355360365

hisargaspserseralaphephecysglnglugluilepheglypro

370375380

leuleuvalleugluserphegluaspgluthrglualavalalaarg

385390395400

alaasnhisthrglupheglyleuseralaservaltrpthraspgln

405410415

glyalaargalatrpargvalalaargalaleuargasnglythrval

420425430

trpleuasnasphisasnargleuphealaglualagluthrglygly

435440445

tyrarglysserglyleuglyargleuhisglyvalaspalaleuleu

450455460

aspphesergluleulyshisiletyrglnasnvalglythrleugly

465470475480

<210>29

<211>486

<212>prt

<213>rhodopseudomonaspalustris

<400>29

metglymetthralaleuhisalaaspasnleuileaspglyalatrp

151015

glnproalaglnserglyalathralaproserleuaspproserser

202530

glyglythrileglyglyphealaalaglyglyalaalaaspalagln

354045

alaalavalalaalaalaargargalaphegluargproglutrpser

505560

glnasnproargalaargglnmetvalmetleuargtrpalaasparg

65707580

metglualaglnalaaspglnleualaargleuleuthrleugluasn

859095

glylysproleuproglnserargglygluilealaglyservalser

100105110

gluileargtyrtyralaglyleuthrargtyrileproglyhisval

115120125

phegluvalgluproglyserpheserthrleuleulysgluproala

130135140

glyvalalaglyleuileileprotrpasnalaproalavalleuleu

145150155160

ileargalaleuthrproalaleualaalaglycysthrvalvalile

165170175

lysproalaproglnthralaglnilethralaalaileilelyscys

180185190

leuhisgluvalaspglyleuproargglyvalvalasnleuvalser

195200205

gluglnglyhisglnvalalagluhisleuvalthrserasnaspval

210215220

aspvalileserphethrglyserasnalathrglyalaargilemet

225230235240

alaalaalaalaprothrmetlyslysleuserleugluleuglygly

245250255

lysseralacysleuvalpheaspaspalaaspilealaaspvalala

260265270

prolysleualaalaalaalathrileilealaglyglnglncysthr

275280285

alaalaargargvalleuvalhisalaserargtyraspglumetlys

290295300

alaalaleulysalaalaleualaasnileargilealaproglyser

305310315320

alaalaglyalaglumetglyproleuileaspalaalaserleuala

325330335

alavalalalysargalaaspglualametglnalaalaaspgluval

340345350

valleuargglyglyargproalaglyaspleualaasnglytyrphe

355360365

leuserprothrleuvalalahisargaspthrseralaphepheval

370375380

glnglugluilepheglyproleuvalvalleuglulysphegluasp

385390395400

glulysglualavalalaargalaasnhisserasptyrglyleuser

405410415

alaservaltrpthrhisaspglyalaargalametargvalalaarg

420425430

alaleuargasnglythrvaltrpileasnasphisasnlysleuphe

435440445

alaglualagluthrglyglytyrargargserglyleuglyargleu

450455460

hisglytyraspalaleuileasppheleugluilelyshisvaltyr

465470475480

glnsercysglyvalval

485

<210>30

<211>485

<212>prt

<213>dinoroseobactershibaedfl12

<400>30

metthrthrthraspleuilealaarghismetileglyglysertyr

151015

seraspalaglyasplysilealaserileasnproalathrglyala

202530

valvalglyhisvalargalaaspglyalaalaglnalathralaala

354045

ilealaalaalaargalaalapheaspthrthrleutrpproglnser

505560

proargaspargglnmetalaleuleuargtrpalaaspalaleuglu

65707580

alaaspleualaargleualagluleuleuthrleuthrasnglylys

859095

proleuglyalaserlysglygluleuglyalaalailesergluile

100105110

argtyrtyralaglyleuthrarghisasnproglyhisalametglu

115120125

valalaproglygluleuservalmetleuarggluproalaglyval

130135140

alaglyileilevalprotrpasnalaproalavalleuleuilearg

145150155160

serleualaproalaleualavalglycysthrthrvalthrlyspro

165170175

alaproglnthralaleuphethralaalacysmetalaproleuphe

180185190

gluaspalaalaileproalaglyvalvalasnvalvalphegluval

195200205

glyhisaspalaalaglnthrleuvalthrserproaspvalaspval

210215220

ileserphethrglyserasnalavalglyglnargilemetalaasp

225230235240

alaalaprothrmetlyslysleuserleugluleuglyglylysser

245250255

cyscysilevalleuaspaspalaaspileglyvalvalalaprolys

260265270

leualaalaalaalathrileileserglyglnglncysthralaala

275280285

argargvalleuvalhisgluserargleuaspglualalysserala

290295300

leuseralaalaleuglnalavalserileglyaspglymetserasp

305310315320

glythralametglyproleuileaspileglnserargaspargval

325330335

metargaspcysglythrvaltyraspthralaaspgluvalvalleu

340345350

argglyglyproleuaspglyprolysglyseralaphemetserpro

355360365

alaleuvalvalhisseraspproasnalaserphevalglnaspglu

370375380

ilepheglyproleuvalvalleugluthrpheargaspglualaasp

385390395400

alavalalalysalaasnasnthrvaltyrglyleuseralaserile

405410415

trpthrhisargglyaspalasertrpargleualaargalaleuarg

420425430

asnglythrvaltrpileasnasphisasnargleuphealagluala

435440445

gluthrglyglytyrargargserglyleuglyargleuhisglyphe

450455460

aspglyleuleuaspphecysgluleulyshisvaltyrglnasnval

465470475480

glyvalvalglyhis

485

<210>31

<211>447

<212>prt

<213>cupriavidusbasilensis

<400>31

metglualavalalalyslysargthrgluthrileserglualaleu

151015

proalaalathrasnargglnvalpheglyalavalthralasercys

202530

metglytrpalaleuaspleupheaspleupheileleuleupheval

354045

alaprovalileglyargleuphepheprosergluhisalametleu

505560

serleualaalavaltyralaserphealavalthrleuleumetarg

65707580

proleuglyseralailepheglythrtyralaasparghisglyarg

859095

lysglyalametvalvalalavalthrglyvalglyleuserthrala

100105110

alapheglyleuleuprothrvalglyglnvalglyleuleualapro

115120125

alaleupheileleuleuargleuvalglnglyilephevalglygly

130135140

valvalalaserthrhisthrileglythrgluservalproproser

145150155160

trpargglyalavalserglyleuvalglyglyglyglyalaglyile

165170175

glyalaleuleualaserilethrtyrmetalametthralaleuphe

180185190

proglyglualapheaspalatrpglytrpargcysmetphepheser

195200205

glyileileserservalleuglyleupheilepheasnserleuglu

210215220

gluserproleutrplysglnleuglnalaalalysglyhisalaala

225230235240

provalgluasnproleuargvalilepheserargglntyrarggly

245250255

valleuphevalasnileleuleuthrvalglyglyglyseralatyr

260265270

tyrleuthrserglytyrleuprothrpheleulysvalvalvallys

275280285

alaproalaglyalaseralaalaileleumetalaserservalgly

290295300

valilevalalaserileilealaglyhisleuserthrleuilegly

305310315320

arglysargalapheleuleuileglyalaleuasnvalvalleuleu

325330335

proleuiletyrglnargmetproalaalaproaspvalthrthrleu

340345350

glyiletyralavalalaleualametleuglyserthrglypheala

355360365

proileleuilepheleuasngluargpheprothrserileargala

370375380

thrglythrglyleusertrpasnileglyphealaileglyglymet

385390395400

metprothrphealaserleucysalaserthrproalaaspleupro

405410415

lysvalleuglyilephevalalavalvalthralailetyrleuala

420425430

glyalaalailevalprogluthralaglyargleuglyglulys

435440445

<210>32

<211>449

<212>prt

<213>cupriavidusbasilensis

<400>32

metglualavalalalyslysseralaalathrileserglualaleu

151015

proalaalaserasnargglnvalpheglyalavalalaalasercys

202530

metglytrpalaleuaspleupheaspleupheileleuleupheval

354045

alaprovalileglyargleuphepheprosergluhisalametleu

505560

serleualaalavaltyralaserphealavalthrleuleumetarg

65707580

proleuglyseralailepheglysertyralaasparghisglyarg

859095

lysglyalametvalvalalavalthrglyvalglyleuserthrala

100105110

alapheglyleuleuprothrvalglyglnvalglyleuleualapro

115120125

alaleupheileleuleuargleuvalglnglyilephevalglygly

130135140

valvalalaserthrhisthrileglythrgluservalproproser

145150155160

trpargglyalavalserglyleuvalglyglyglyglyalaglyleu

165170175

glyalaleuleualaserilethrtyrmetalametthralaleuphe

180185190

proglyglualapheaspalatrpglytrpargcysmetphepheser

195200205

glyileileserservalleuglyleupheilepheasnserleuglu

210215220

gluserproleutrplysglnleuglnalaalalysglyhisalaala

225230235240

provalgluasnproleuargvalilepheserargglntyrarggly

245250255

valleuphevalasnileleuleuthrvalglyglyglyseralatyr

260265270

tyrleuthrserglytyrleuprothrpheleulysvalvalvallys

275280285

alaseralaglygluseralaalaileleumetalaserserleugly

290295300

valilevalalaserileleualaglyhisleuserthrmetilegly

305310315320

arglysargalapheleuleuileglyalaleuasnvalvalvalleu

325330335

proleuleutyrglntrpmetproalaalaproaspthrthrthrleu

340345350

glyleutyralavalvalleusermetleuglycysserglypheala

355360365

proileleuilepheleuasngluargpheprothrserileargala

370375380

thrglythrglyleusertrpasnileglyphealavalglyglymet

385390395400

metprothrphealaserleucysalaserthrproalagluleupro

405410415

metvalleuglyilepheleualavalvalthrileiletyrleuval

420425430

glyalapheilevalprogluthrvalglyargleuglyaspasngly

435440445

ala

<210>33

<211>449

<212>prt

<213>methylobacteriumradiotolerans

<400>33

metglnthralaalathrphealaseraspproproalaleualalys

151015

prothrglyargglnthrvalthralaalametalaserleuphegly

202530

trpglyleuaspleupheaspleupheileleuleutyrvalalapro

354045

valvalglythrleuphepheproalaasplysprometleuserleu

505560

alaglyalatyralaserphealavalthrleuleuileargproleu

65707580

glyseralaleupheglysertyralaaspargpheglyargargarg

859095

alaleumetvalalavalvalglyvalglyileserthralavalphe

100105110

glyleuleuprothrvalglyglnileglytrpleualathralaval

115120125

pheleuphepheargleuvalglnglyilephevalglyglyvalval

130135140

alaalaserhisthrileglythrgluservalprogluargtrparg

145150155160

glyleumetserglyalavalglyglyglyglyseralaileglygly

165170175

leuleualaserleuvalphetyrvalvalserleumetalaprogly

180185190

glualaphealaglutrpglytrpargleumetphepheserglyleu

195200205

leuthrservalileglyleuileleupheargasnleuglugluser

210215220

proilephelysgluleuglnalaarglysalaalaleuargalagly

225230235240

alaproalaglualaserproileargserleupheserproserasn

245250255

argglyserphealavalalathrleuileserpheglyglyglyala

260265270

alatyrtyrleuthrserglytyrleuprothrleuleulysleuval

275280285

asnglyvalproasnalathralasermetileleuileglyalaasn

290295300

valalaalaalaileglyalacysglymetglygluleuserglnhis

305310315320

ileglyarglysargserpheleuleumetglyvalileargleuleu

325330335

alapheproalaleupheleuthrmetalaasnthrthrserleuval

340345350

glyvalalaalacysalapheleuleualaleuilealaasnglyser

355360365

tyrglyproleuleuilepheleuasnglulyspheprothralaval

370375380

argalathrglythrglyleuthrtrpasnileglyphealaleugly

385390395400

glymetleuprothrleuvalserleuvalalaaspglyprothrgln

405410415

ileprometvalleualavalilethrthrglyvalthrleuvaltyr

420425430

leuvalglyalapheleuthraspgluthrglnglyasnleuasparg

435440445

ala

<210>34

<211>443

<212>prt

<213>sulfolobusacidocaldarius

<400>34

metlyslysgluglulysphethrserasnhisphelystrpthrleu

151015

alathrphephethrtrpthrpheaspleutyraspleuphethrile

202530

leuleuvalalaprotyrileserserleuphepheproserserile

354045

thrpheleuserilealaalathrtyralaglyphealathrserleu

505560

ilemetargprovalglyalathrvalpheglyserargvalserasp

65707580

lysvalglyarglysargalailephetyrglyleuileglyleuval

859095

ilethrserthrleuglnglyalaleuprothrtyrglnvalvalgly

100105110

valilealaproileleuleuleualavalargleuileglnglyval

115120125

pheileglyglyilethralaglyserhisvalileglyprogluser

130135140

valprogluargtyrargglyilevalglyglyleuglypheserala

145150155160

alaglyvalalatyrleuilealaalaglytrpphepheleuthrthr

165170175

ileleutyrproglysersertyrleuvaltrpglytrpargvalmet

180185190

phepheglyglyleuleuserleualavalleuglyphevalasntyr

195200205

leuvalproglusergluvaltrpthrlysilelyslysargglyser

210215220

valvallysserproleulysgluilepheserlystyrargtyrgln

225230235240

leuglyvalalaleuleuleuserileglytrpglyalaserphetyr

245250255

valthraspglyileleuprothrpheleuserservalasnlysleu

260265270

alalysthrgluilealailevalmetileileglyserileglymet

275280285

serileglyproleuileglyglygluileserglnileileglyarg

290295300

lysilethrserleuileglyalaileilevalleualavalvalgly

305310315320

proleupheleuserleuglyserleulysserglyaspleuasngln

325330335

ileileleuhisserphealaileleupheleuvalaspileglygly

340345350

glymetleumetthrtyrleuasngluiletyrproalaservalarg

355360365

glythrglyvalglyphethrtrpasnthrglyphealaileglygly

370375380

thrileprothrileileserleualavalalaseralaglyleuser

385390395400

alapheproserilemetphetyrthrleuilevalvalservalile

405410415

ileleuvalglythrvalleuthrlysgluthrlysglythrileser

420425430

lysgluglutyrgluileglnlysgluthrleu

435440

<210>35

<211>1240

<212>dna

<213>artificial

<220>

<223>synthetickpni-nheifragmentforexpressionofalcohol

dehydrogenaseofaneurinibacillusterranovensis

<400>35

ggtaccgaattccacatgacaaggggagaccgcatgaccattagtccggcagttaaagcc60

atcaactttgaattttcatttaacctgccgaccctgatcgaatttggttatggtaaaatg120

gaaaaattcggccagcagctgattagcattggtgttaaacgcatttttatggtgaccgat180

aaaggtgttgaaagcgcaggtctgctggcagcactgaccgattcactgcaggcagcagca240

attcagtttgatatctataccgatgtggaaagcgatccgagcctggaaaccattgatcgt300

ggtgttgaagtttttcagcagaaaccgtatgattgcattgttgcagttggtggtggtagc360

ccgattgataccgcaaaaggtattcgtgttgttgcagcaaatggtggtaatattggtcat420

tatgccggtgttaatcagattccggttgcaccgaccattccgctgctggcaattccgacc480

accagtggcaccggtagcgaagttaccaattttggtgtttatagcgattggcagaacaac540

gttaaagttaccgttaccagccagtatatggcaccgacaattgcatgggttgatccggca600

ctgaccatgagcctgcctgcaaaaatgaccgcagcaagcggtattgatgcactggcacat660

ggtattgaaaccttttttagcctgggtagcagtccggcaagtgatgccctggcaattgaa720

gcaattcataccgttaatcgttatctgagccgtgcagttcataatggtagcgatatggaa780

gcacgtattggtatgagccatggtagcctgctggctggcatggcatttaacaatggtttt840

ctgggtctggcccatgccattggtagcgcactgagcggtcattgtcatgttccgcatggt900

gttgcaattggtctgctgctgccgaaagttgttgaatttaatgcaaccgttcgtccggat960

aaagcagcaaaaattgcaggtctgatgggtatgaaaggtgaacatagcgaagaactggcc1020

ctgcaggcatcaccggcagttgcacgtctggttgaagatattggcctgccgacacgtctg1080

cgtgaagttgatgttaccgaaaaaaaactgttcgagatcgccaaagatagctttaaaagc1140

ggcatgatgaaattcaatccgcgtcagccgagcgaaagcgaagttctgcagctgctgaaa1200

gaaatcttttgaagaccgaagcgaattcctcgagtctaga1240

<210>36

<211>1205

<212>dna

<213>artificial

<220>

<223>synthetickpni-nheifragmentforexpressionofalcohol

dehydrogenaseofbrevibacillusthermoruber

<400>36

ggtacctaggaaaggaagattaacccatgagccagaccgtgcagggcaccgacttcgcct60

tcagcttccacctgccgaccctgatcgagttcggctacggccgcgccagccgcctgggcg120

agcgcctgcagcacctgggcgtgaccaacgtgttcgtggtgaccgacaagggcgtggagg180

ccgccggcctgctgaacggcctggtgggcagcctgcagagcgccggcatcgccttcgacc240

tgtacaccgaggtggagccggacccgggcctggagaccatcgaccgcggcgccgccgtgt300

tccgcgccaagccgtacgactgcctggtggccgtgggcggcggcagcccgatcgacgccg360

ccaagggcatgcgcgtggtgaccagctgcggcggcagcatcgccgactacgccggcgtga420

accgcgtgccgatggccccggccgtgccgctggtggccgtgccgaccaccagcggcaccg480

gcagcgaggtgaccatgttcggcgtgtacagcgactggcacaaccacgtgaaggtgaccg540

tgaccagcccgcacatggccccgaccatcgccctggtggacccggccctgaccgtgagcc600

tgccggccaagatgaccgccgccagcggcatcgacgccctggcccacggcatcgagacct660

tcttcagcgtgcgcagccgcccggccagcgacgccctggccatggaggccatcgccgccg720

tgaacgcccacctgcgccgcgccgtgcacgacggcagcgacgtggaggcccgcatcggca780

tgagccacggcagcctgctggccggcatggccttcaccaacggcttcctgggcctggccc840

acgccatcggcagcgccctgagcggccactgccacgtgccgcacggcatcgccatcggcc900

tgctgctgccgcacgtggtggccttcaacgccccggcccgcccggacaaggccgcccagc960

tggcccgcctgctgggcgtggaggccaacccgcgcgaggagcgcggcgaggagaccagcg1020

ccgccgtggcccgcatggtggccgacatcggcctgccgacccgcctgcgcgacgtgggcg1080

tgccggaggagaagctgccggccatcgccaaggacgccttcaagagcggcatgatgacct1140

gcaacccgcgccagccgaccgagcaggaggtgcgcgagctgctgcgccgcgccttctgag1200

ctagc1205

<210>37

<211>1228

<212>dna

<213>artificial

<220>

<223>synthetickpni-nheifragmentforexpressionofalcohol

dehydrogenaseofbrevibacilluspanacihumi

<400>37

ggtaccgaattccacatgacaaggggagaccgcatgagcgcaaatcagagcgttcagggt60

attgaaagcccgtttagctttcatctgccgaccaatgttcagtttggtgttggtagcgca120

agccgtctgggtgaaatgctgctgagcatgggtgttcgtcgtgtttttctggttaccgat180

cagggtgtgcgtcaggcaggtctgctggatgaagttattcatagcctggaagaaaaaggc240

ctgcactttcagatttatgcagatgttgaaccggatccgagcctggaaaccattcaggca300

ggcgcagcaatgtttcagcagcagagctttgattgtatggttgcaattggtggtggtagt360

ccgattgataccgcaaaaggtattcgtgttctggcagcaaatggtggcggtattggtcag420

tatgccggtgttaatcgcgttccggcagcaagcgcaattccgctgattgcaattccgacc480

accagtggcaccggtagcgaagttaccatttttggtgtttatagcgattgggagaaccac540

gtgaaaattaccgttaccagtccgcatatggcaccgagcaccgcactgattgatccggca600

ctgaccctgagcctgcctgcaaaaatgaccgcagcaaccggtattgatgcactggcacat660

ggcattgaaaccttttttagcctgcgtagcagtccggcaagtgatgccctggcaattcat720

gcaatgaaaatgattgcaccgcatctgcgtcgtgcagttcgtgatggtgcagatatggaa780

gcacgtattggtatgagccagggtagcgtgctggcaggtatggcatttaacaatggtttt840

ctgggtctggcccatgccattggtagtgcactgagcggtcattgtcatgttccgcatggt900

gttgcgattggcctgctgctgccgcatgtggttgcatttaatacaccggttcgtccggaa960

aaagcagaactgattgccgatgttctgggtagcgttcagaaagaaaccggcaccgcagcc1020

gaactggttggtcagctggttcaggatattggtctgccgcagcgtctgcaagaagttggc1080

gttccggaagcgaaactggttgatattgcaaaagatagctttaaaagcggcatgatgaaa1140

tggaatccgcgtctgccgacagaacaagaagttctggaactgctgcagaaagccttttga1200

agaccgaagcgaattcctcgagtctaga1228

<210>38

<211>1184

<212>dna

<213>artificial

<220>

<223>synthetickpni-nheifragmentforexpressionofalcohol

dehydrogenaseofbacillussp.fjat-14578

<400>38

ggtacctaggaaaggaagattaacccatgtacccgagcttcgagttccacctgccgacca60

agatccacttcggctacaacaccatcaagcagctggaccacctgccgttcgagatcaagc120

gcgccttcatcgtgaccgaccagggcgtgctgaacagcggcctggtggagaacgtgacca180

acatcctgaaggaccaccagatcagctacgtgatctacagcgaggtggagccggacccga240

gcgtggagaccgtggacaaggccgcccagatgttccagcgcgaggaggccgacgccctga300

tcgccatcggcggcggcagcccgatcgacaccgccaagggcgtgcgcgtgatcgccggca360

acggcggcagcatccgcgactacgccggcgtgaacctgatcaagcagaagagcaacatcc420

cgctgatcgccatcccgaccaccagcggcaccggcagcgaggtgaccatcttcgccgtgt480

tcagcgactgggaggagaaccgcaaggtgaccgtgaccagcccgttcctggccccggaca540

tcagcatcgtggacccgaagatgaccatgaccgccccgccggccatcaccgccgccagcg600

gcttcgacgccttcgcccacggcgccgagaccttcgtgagccgcgccagccagccggcca660

gcgacgtgctggccttcagcgccatgagcaccgtgagcaagtacctgcgccgcgccgtgt720

acaacggcgaggacgtggaggcccgcatcaagatggccgaggccagcctgctggccggca780

tggccttcaaccagagctacctgggcctgacccacgccatcggcagcgccctgagcggcc840

acgcccacgtgagccacggcgtggccatcggcctgctgctgccgggcgtgatccgctaca900

acagcatcagccgcatggacaagcacatcgagatggccggcgccttccgcgagatcgacc960

gcagcctgagcgactgggagatcatcgaccagctgatcgaggacgtgagccgcctgcgcg1020

acgacatcggcctgccgcagcgcctgcagcaggtgggcgtgaaggaggaccagctgaaga1080

tgatcgccgccgacagcgtgaagagcggcatgtggaagttcaacccgcgccaggccagcg1140

aggaggagatcctggagctgctgaaggagctgtactgagctagc1184

<210>39

<211>1184

<212>dna

<213>artificial

<220>

<223>synthetickpni-nheifragmentforexpressionofalcohol

dehydrogenaseofbacillussp.l1(2012)

<400>39

ggtacctaggaaaggaagattaacccatgtacaccagcttcaacttccacctgccgaccc60

gcatccagttcggctacgagaaggtgaaggagctgaagaacctgccgttccaggccaacc120

gcgccttcatcgtgaccgacaagggcgtggagaaggccggcctgctgaacgacgtgatcg180

acgccatcaagcaggccaacatgacctacaagatctaccgcgacgtggagccggacccga240

gcgtggagaccgtggacaaggccgccaaggccttcgccgaggccgagtgcgacctgctga300

tcgccgtgggcggcggcagcccgatcgacaccgccaagggcgtgcgcgtggtggccagca360

acggcggcagcatccgcaactacagcggcgtgaacctggtgaaggaggccccgagcgtgc420

cgctggtggccatcccgaccaccgccggcaccggcagcgaggtgaccatcttcgccgtgt480

tcagcgacgacaaggagaaccgcaaggtgaccgtgaccagcagccacctgagcccggacg540

tgagcatcatcgacccgaagctgaccctgaccgccccgccgagcatcaccgccgccgccg600

gcttcgacgccttcgcccacgccgccgaggccttcgtgagccgcatcagccagccgccga660

gcgacgccctggccctgagcgccatgaagaccgtgcacacctacctgcgccgcgccgtgt720

acaacggcgacgacatcgaggcccgcatgaagatggccgaggccagcctgctggccggca780

tggccttcaaccagagctacctgggcctggcccacgccatcggcagcgccatcagcgtgc840

acgcccacgtgagccacggcgtggtgatcggcctgctgctgccgaaggtgatcgagtaca900

acctggtggccaagatcgacaagtacgccgaggccggcaagtacatcgagcagagcagcc960

acggcctgagcaactacgaggccgccgccctgttcagcgagaccgtgacccagctgcgca1020

acgacatcggcctgccgaagcagctgcgcgaggtgaacgtgaaggaggcccagctggagg1080

ccatcagcaaggacagcatcaagagcggcatgtggcagttcaacccgcgccgcgccagcg1140

agcaggacgtgtaccagatgctgcgcgagatgctgtgagctagc1184

<210>40

<211>27

<212>dna

<213>artificial

<220>

<223>ribosomebindingsitecontainingspacerno.2

<400>40

gaattccacatgacaaggggagaccgc27

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1