用于生物合成化合物的方法,试剂和细胞与流程

文档序号:12509459阅读:509来源:国知局
用于生物合成化合物的方法,试剂和细胞与流程

本申请要求于2014年6月16日提交的美国临时申请序列号62/012,659,于2014年6月16日提交的62/012,666和于2014年6月16日提交的62/012,604的权益,其全部内容通过引用并入本文。

技术领域

本发明涉及使用一种或多种分离的酶(如脂肪酸O-甲基转移酶,醇O-乙酰转移酶和单加氧酶)生物合成6-羟基己酸甲酯和己酸己酯的方法,以及表达一种或多种此类酶的重组宿主细胞。本发明还涉及使用一种或多种酶,如酯酶,单加氧酶和脱甲基酶将6-羟基己酸甲酯和己酸己酯酶促转化为6-羟基己酸和1,6-己二醇的方法。此外,本发明涉及将6-羟基己酸和/或1,6-己二醇酶促转化为己二酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇(以下称为“C6构件块”)和产生此类C6构件块的重组宿主。

发明背景

尼龙是聚酰胺,其一般通过二胺与二羧酸的缩合聚合(condensation polymerization)合成。类似地,可以通过内酰胺的缩合聚合生成尼龙。一种普遍存在的尼龙是尼龙6,6,其通过六亚甲基二胺(HMD)和己二酸的缩合聚合生成。可以通过己内酰胺的开环聚合生成尼龙6(Anton&Baird,Polyamides Fibers,Encyclopedia of Polymer Science and Technology,2001)。

生物技术通过生物催化提供了石油化学方法的备选方法。生物催化是使用生物催化剂,如酶,来进行有机化合物的生物化学转化。

生物衍生的原料和石油化学原料两者都是用于生物催化过程的可行的起始材料。

因而,针对此背景,清楚的是需要用于生产己二酸,6-羟基己酸,6-氨基己酸,六亚甲基二胺和1,6-己二醇(下文称为“C6构件块”)中的一种或多种的可持续的方法,其中所述方法是基于生物催化的。

然而,无野生型原核生物或真核生物天然过度生成或分泌C6构件块到细胞外环境。但是,己二酸的代谢已有报道。

许多细菌和酵母经由β-氧化将二羧酸己二酸作为碳源高效转化为中心代谢产物。辅酶A(CoA)活化的己二酸至CoA活化的3-氧代己二酸的β-氧化通过例如与芳族底物降解相关的途径促进进一步的分解代谢。已经全面地表征通过几种细菌将3-氧代己二酰基-CoA分解代谢成乙酰基-CoA和琥珀酰基-CoA。

最优性原理叙述,微生物调节它们的生物化学网络来支持最大生物质(biomass)生长。超出在宿主生物体中表达异源途径的需要,将碳通量引导到充当碳源的C6构件块而非生物质生长组分与最优性原理矛盾。例如,将1-丁醇途径从梭菌属(Clostridium)物种转移至其它生产菌株与天然生产者的生产性能相比经常相差一个数量级(Shen等人,Appl.Environ.Microbiol.,2011,77(9):2905–2915)。

七碳脂肪族主链前体的有效合成是在C6脂肪族主链上形成末端官能团,如羧基,胺或羟基基团前合成一个或多个C6构件块的关键考虑。

发明概述

本文件至少部分地基于以下发现:可以构建用于产生七碳链脂肪族主链前体的生物化学途径,其中可以形成一个或两个官能团,即羧基,胺或羟基,从而导致己二酸,6-氨基己酸,6-羟基己酸,六亚甲基二胺和1,6-己二醇(下文称为“C6构件块”)中的一种或多种的合成。己二酸和己二酸盐(酯),6-羟基己酸和6-羟基己酸盐(酯),以及6-氨基己酸和6-氨基己酸盐(酯)在本文中可互换使用,是指任何其中性或离子化形式的相关化合物,包括其任何盐形式。本领域技术人员应当理解,具体形式将取决于pH。

本领域技术人员理解,当存在于亲本化合物中的酸性质子被金属离子,例如碱金属离子,碱土金属离子或铝离子替代;或与有机碱配位时,含有羧酸基团的化合物(包括但不限于有机一元酸,羟基酸,氨基酸和二羧酸)形成或转化成其离子盐形式。可接受的有机碱包括但不限于乙醇胺,二乙醇胺,三乙醇胺,氨丁三醇,N-甲基葡糖胺等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等。将本发明的盐分离为盐或通过经由添加酸或用酸性离子交换树脂处理将pH降至pKa以下而转化成游离酸。

本领域技术人员理解,含有胺基团的化合物(包括但不限于有机胺,氨基酸和二胺)形成或转化为它们的离子盐形式,例如通过向胺中加入酸性质子形成铵盐,与无机酸如盐酸,氢溴酸,硫酸,硝酸,磷酸等形成;或与有机酸形成,包括但不限于乙酸,丙酸,己酸,环戊烷丙酸,乙醇酸,丙酮酸,乳酸,丙二酸,琥珀酸,苹果酸,马来酸,富马酸,酒石酸,柠檬酸,苯甲酸,3-(4-羟基苯甲酰基)苯甲酸,肉桂酸,扁桃酸,甲磺酸,乙磺酸,1,2-乙二磺酸,2-羟基乙磺酸,苯磺酸,2-萘磺酸,4-甲基双环-[2.2.2]辛-2-烯-1-羧酸,葡庚糖酸,4,4'-亚甲基双-(3-羟基-2-烯-1-羧酸),3-苯基丙酸,三甲基乙酸,叔丁基乙酸,月桂基硫酸,葡糖酸,谷氨酸,羟基萘甲酸,水杨酸,硬脂酸,粘康酸等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等。本发明的盐以盐的形式分离或通过经由添加碱或用碱性离子交换树脂处理将pH至高于pKb转化成游离胺。

本领域技术人员理解,含有胺基团和羧酸基团两者的化合物(包括但不限于氨基酸)通过以下形成或转化成它们的离子盐形式:通过1)与无机酸形成的酸加成盐,所述无机酸包括但不限于盐酸,氢溴酸,硫酸,硝酸,磷酸等;或与有机酸形成的酸加成盐,所述有机酸包括但不限于乙酸,丙酸,己酸,环戊烷丙酸,乙醇酸,丙酮酸,乳酸,丙二酸,琥珀酸,苹果酸,马来酸,富马酸,酒石酸,柠檬酸,苯甲酸,3-(4-羟基苯甲酰基)苯甲酸,肉桂酸,扁桃酸,甲磺酸,乙磺酸,1,2-乙二磺酸,2-羟基乙磺酸,苯磺酸,2-萘磺酸,4-甲基双环-[2.2.2]辛-2-烯-1-羧酸,葡庚糖酸,4,4'-亚甲基双-(3-羟基-2-烯-1-羧酸),3-苯基丙酸,三甲基乙酸酸,叔丁基乙酸,月桂基硫酸,葡糖酸,谷氨酸,羟基萘甲酸,水杨酸,硬脂酸,粘康酸等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等,或2)当存在于亲本化合物中的酸性质子被金属离子,例如碱金属离子,碱土金属离子或铝离子置换时;或与有机碱配位。可接受的有机碱包括但不限于乙醇胺,二乙醇胺,三乙醇胺,氨丁三醇,N-甲基葡糖胺等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等。本发明的盐可以作为盐分离或通过经由添加酸或用酸性离子交换树脂处理将pH降至pKa以下而转化为游离酸。

本文所述的途径,代谢工程和培养策略依赖于使用例如脂肪酸O-甲基转移酶从己酸产生己酸甲酯,并使用例如单加氧酶从己酸甲酯产生6-羟基己酸甲酯。可以使用例如脱甲基酶或酯酶从6-羟基己酸甲酯产生6-羟基己酸。

本文所述的途径,代谢工程和培养策略依赖于使用例如醇O-乙酰转移酶产生己酸己酯,并使用例如单加氧酶从己酸己酯产生6-羟基己酸己酯,6-羟基己酸6-羟基己酯和/或己酸6-羟基己酯。可以使用例如酯酶从6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯产生6-羟基己酸。可以使用例如酯酶从己酸6-羟基己酯和/或6-羟基己酸6-羟基己酯产生1,6-己二醇。

来自聚羟基链烷酸酯累积细菌的与碳储存途径相关的CoA依赖性延长酶或同源物可用于产生前体分子。参见例如图1-2。

面对最优性原理,令人惊讶地,本发明人发现可以组合合适的非天然途径,原料,宿主微生物,对宿主生物化学网络的减弱策略和培养策略,以有效地产生一种或多种C6构件块。

在一些实施方案中,可以通过使用NADH或NADPH依赖性酶经由两个循环的CoA依赖性碳链延长从乙酰基-CoA形成用于转化成C6构件块的C6脂肪族主链。参见图1和图2。

在一些实施方案中,产生C6脂肪族主链的CoA依赖性碳链延长途径中的酶有目的地含有不可逆的酶促步骤。

在一些实施方案中,可以使用硫酯酶,醛脱氢酶,7-氧代庚酸脱氢酶,6-氧代己酸脱氢酶,5-氧代戊酸脱氢酶或单加氧酶来酶促形成末端羧基。参见图3和图4。

在一些实施方案中,可以使用ω-转氨酶或脱乙酰酶酶促形成末端胺基团。参见图5和图6。

在一些实施方案中,可以使用单加氧酶,酯酶或醇脱氢酶酶促形成末端羟基。参见图3、图7和图8。单加氧酶(例如,与氧化还原酶和/或铁氧还蛋白组合)或醇脱氢酶可以酶促形成羟基。单加氧酶可以与SEQ ID NO:13-15或27-28中所示的任一氨基酸序列具有至少70%的序列同一性。酯酶可以与SEQ ID NO:26所示的氨基酸序列具有至少70%的同一性。

ω-转氨酶或脱乙酰酶可以酶促形成胺基。ω-转氨酶可以与SEQ ID NO:7-12中所示的任一氨基酸序列具有至少70%的序列同一性。

硫酯酶,醛脱氢酶,7-氧代庚酸脱氢酶,6-氧代己酸脱氢酶或5-氧代戊酸脱氢酶可以酶促形成末端羧基。硫酯酶可以与SEQ ID NO:1所示的氨基酸序列具有至少70%的序列同一性。

羧酸还原酶(例如,与磷酸泛酰巯基乙胺基转移酶组合)可以形成末端醛基作为形成产物的中间体。羧酸还原酶可以与SEQ ID NO:2-6中所示的任一氨基酸序列具有至少70%的序列同一性。

可以在重组宿主中通过发酵进行任何方法。宿主可以经受在需氧,厌氧或微需氧培养条件下的培养策略。可以在营养限制如磷酸盐,氧或氮限制的条件下培养宿主。可以使用陶瓷膜保持宿主以在发酵期间保持高细胞密度。

在任何方法中,可以通过在选择性环境中连续培养来改善宿主对高浓度C6构件块的耐受性。

供给发酵的主要碳源可以来自生物或非生物原料。在一些实施方案中,生物原料是,包括,或源自单糖,二糖,木质纤维素、半纤维素、纤维素、木质素、乙酰丙酸和甲酸、甘油三酯、甘油、脂肪酸、农业废物、浓缩酒糟或城市废物。

在一些实施方案中,非生物原料是或源自天然气、合成气、CO2/H2、甲醇、乙醇、苯甲酸盐、非挥发性残留物(NVR)或来自环己烷氧化过程的碱洗液(caustic wash)废物流(non-volatile residue(NVR)or a caustic wash waste stream from cyclohexane oxidation processes)、或对苯二甲酸/异酞酸混合物废物流。

本文件的特征还在于重组宿主,其包括至少一种编码脂肪酸O-甲基转移酶和单加氧酶的外源核酸,并产生6-羟基己酸甲酯。此类宿主还可以包括脱甲基酶或酯酶,并进一步产生6-羟基己酸。此类宿主还可以包括(i)β-酮硫解酶或乙酰基-CoA羧化酶和β-酮酯酰基-[acp]合酶,(ii)3-羟基酰基-CoA脱氢酶或3-氧代酰基-CoA还原酶,(iii)烯酰基-CoA水合酶,和(iv)反式-2-烯酰基-CoA还原酶。宿主还可以进一步包括硫酯酶,醛脱氢酶或丁醛脱氢酶中的一种或多种。

本文件的特征还在于重组宿主,其包含至少一种编码醇O-乙酰转移酶的外源核酸并产生己酸己酯。此类宿主还可以包括单加氧酶和酯酶,并进一步产生6-羟基己酸和/或1,6-己二醇。此类宿主还可以包括(i)β-酮硫解酶或乙酰基-CoA羧化酶和β-酮酯酰基-[acp]合酶,(ii)3-羟基酰基-CoA脱氢酶或3-氧代酰基-CoA还原酶,(iii)烯酰基-CoA水合酶,和(iv)反式-2-烯酰基-CoA还原酶。宿主还可以进一步包括酸酯酶,羧酸还原酶,醛脱氢酶,丁醛或乙醛脱氢酶或醇脱氢酶中的一种或多种。

产生6-羟基己酸的重组宿主还可以包括单加氧酶,醇脱氢酶,醛脱氢酶,6-羟基己酸脱氢酶,5-羟基丁酸脱氢酶(5-hydroxybutanoate dehydrogenase),4-羟基丁酸脱氢酶,5-氧代丁酸(5-oxobutanoate)脱氢酶,6-氧代己酸脱氢酶或7-氧代庚酸脱氢酶中的一种或多种,所述宿主进一步产生己二酸或己二酸半醛。

产生6-羟基己酸的重组宿主还可以包括ω-转氨酶,6-羟基己酸脱氢酶,5-羟基戊酸脱氢酶,4-羟基丁酸脱氢酶和醇脱氢酶中的一种或多种,其中宿主进一步产生6-氨基己酸。

产生6-氨基己酸的重组宿主可包括酰胺水解酶(amidohydrolase),其中所述宿主进一步产生己内酰胺。

产生6-羟基己酸或6-氨基己酸的重组宿主还可以包括羧酸还原酶,ω-转氨酶,脱乙酰酶,N-乙酰转移酶或醇脱氢酶中的一种或多种,所述宿主进一步产生六亚甲基二胺。

产生6-羟基己酸的重组宿主还可以包括羧酸还原酶或醇脱氢酶,其中宿主进一步产生1,6-己二醇。

重组宿主可以是原核生物,例如来自埃希氏菌属(Escherichia)诸如大肠杆菌(Escherichia coli);来自梭菌属(Clostridia)诸如杨氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)或克鲁佛梭菌(Clostridium kluyveri);来自棒状杆菌属(Corynebacteria)诸如谷氨酸棒状杆菌(Corynebacterium glutamicum);来自贪铜菌属(Cupriavidus)诸如钩虫贪铜菌(Cupriavidus necator)或耐金属贪铜菌(Cupriavidus metallidurans);来自假单胞菌属(Pseudomonas)诸如荧光假单胞菌(Pseudomonas fluorescens),恶臭假单胞菌(Pseudomonas putida)或食油假单胞菌(Pseudomonas oleavorans);来自代尔夫特菌属(Delftia),食酸代尔夫特菌(Delftia acidovorans),来自芽孢杆菌属(Bacilluss)诸如枯草芽胞杆菌(Bacillus subtillis);来自乳杆菌属(Lactobacillus)诸如德氏乳杆菌(Lactobacillus delbrueckii);或来自乳球菌属(Lactococcus)诸如乳酸乳球菌(Lactococcus lactis)或来自红球菌属(Rhodococcus)诸如马红球菌(Rhodococcus equi)。

重组宿主可以是真核生物,例如来自曲霉属(Aspergillus)诸如黑曲霉(Aspergillus niger);来自酵母属(Saccharomyces)诸如酿酒酵母(Saccharomyces cerevisiae);来自毕赤酵母属(Pichia)诸如巴斯德毕赤酵母(Pichia pastoris);来自耶罗维亚酵母属(Yarrowia)诸如解脂耶罗维亚酵母(Yarrowia lipolytica),来自伊萨酵母属(Issatchenkia),诸如东方伊萨酵母(Issathenkia orientalis),来自德巴利酵母属(Debaryomyces)诸如汉逊德巴利酵母(Debaryomyces hansenii),来自Arxula属诸如Arxula adenoinivorans,或来自克鲁维酵母菌属(Kluyveromyces)诸如乳酸克鲁维酵母菌(Kluyveromyces lactis)。

在一些实施方案中,减弱或提升宿主的内源生物化学网络以(1)确保乙酰基-CoA的胞内利用度,(2)创建辅因子(即NADH或NADPH)不平衡,其可以经由C6构件块的形成平衡,(3)阻止导致并且包含C6构件块的中心代谢物,中心前体的降解和(4)确保从细胞的有效流出。

本文所述的任何重组宿主还可以包括一种或多种以下减弱的酶:聚羟基链烷酸合酶,乙酰基-CoA硫酯酶,乙酰基-CoA特异性β-酮硫解酶,形成乙酸的磷酸转乙酰酶,乙酸激酶,乳酸脱氢酶,menaquinol-延胡索酸氧化还原酶,产生异丁醇的2-酮酸脱羧酶,形成乙醇的醇脱氢酶,丙糖磷酸异构酶,丙酮酸脱羧酶,葡萄糖-6-磷酸异构酶,消散辅因子不平衡的转氢酶,对用于创建梯度的辅因子特异性的谷氨酸脱氢酶,利用NADH/NADPH的谷氨酸脱氢酶,庚二酰基-CoA脱氢酶;接受C6构件块和中心前体作为底物的酰基-CoA脱氢酶;戊二酰基-CoA脱氢酶;或庚二酰基-CoA合成酶。

本文所述的任何重组宿主还可以过表达一种或多种编码以下的基因:乙酰基-CoA合成酶,6-磷酸葡萄糖酸脱氢酶;转酮酶;反馈抗性苏氨酸脱氨酶;吡啶(puridine)核苷酸转氢酶;甲酸脱氢酶;甘油醛-3P-脱氢酶;苹果酸酶;葡萄糖-6-磷酸脱氢酶;果糖1,6二磷酸酶;丙酰基-CoA合成酶;L-丙氨酸脱氢酶;L-谷氨酸脱氢酶;L-谷氨酰胺合成酶;赖氨酸转运蛋白;二羧酸转运蛋白;和/或多药物转运蛋白。

本文件还涉及生成(C3-8羟基烷基)-C(=O)OCH3酯的方法,该方法包括将C4-9羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯;将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。

在一些实施方案中,可以使用具有脂肪酸O-甲基转移酶活性的多肽,将C4-9羧酸酶促转化为(C3-9烷基)-C(=O)OCH3酯。在一些实施方案中,具有脂肪酸O-甲基转移酶活性的多肽可以与SEQ ID NO:22,SEQ ID NO:23和/或SEQ ID NO:24所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,可使用具有单加氧酶活性的多肽将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。在一些实施方案中,单加氧酶分类在EC 1.14.14.-或EC 1.14.15.-下。在一些实施方案中,单加氧酶可以与SEQ ID NO:13-15,SEQ ID NO:27和/或SEQ ID NO:28中所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,可以从C4-9烷酰基(alkanoyl)-CoA酶促产生C4-9羧酸。在一些实施方案中,具有硫酯酶活性的多肽可以从C4-9烷酰基-CoA酶促产生C4-9羧酸。在一些实施方案中,硫酯酶可以与SEQ ID NO:1和/或SEQ ID NO:32-33所示的氨基酸序列具有至少70%的序列同一性。在一些实施方案中,具有丁醛脱氢酶活性的多肽和具有醛脱氢酶活性的多肽从C4-9烷酰基-CoA酶促产生C4-9羧酸。

本文件还描述了产生一种或多种羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯的方法。该方法包括将C4-9烷酰基-CoA酶促转化为(C4-9烷基)-OC(=O)-(C3-8烷基)酯;并且将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化为(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯中的任一种。

在一些实施方案中,可以使用具有醇O-乙酰转移酶活性的多肽将C4-9烷酰基-CoA酶促转化为(C4-9烷基)-OC(=O)-(C3-8烷基)酯。在一些实施方案中,醇O-乙酰转移酶可以与SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化成(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯。在一些实施方案中,所述具有单加氧酶活性的多肽归类于EC 1.14.14.-或EC 1.14.15.-。

在一些实施方案中,该方法还可以包括将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯转化为C4-9羟基链烷酸。在一些实施方案中,具有酯酶活性的多肽将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯酶促转化成C4-9羟基链烷酸。

在一个方面,本文件特征在于产生生物衍生的6-碳化合物的方法。用于产生生物衍生的六碳化合物的方法可包括在条件下培养或生长如本文所述的重组宿主达足够的时间段以产生生物衍生的六碳化合物,其中任选地,生物衍生的六碳化合物选自下组:己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇及其组合。

在一个方面,本文件的特征在于包含如本文所述的生物衍生的六碳化合物和除了生物衍生的六碳化合物之外的化合物的组合物,其中所述生物衍生的六碳化合物选自下组:己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇及其组合。例如,生物衍生的六碳化合物是宿主细胞或生物体的细胞部分。

本文件特征还在于基于生物的聚合物,其包含生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇,及其组合。

本文件特征还在于基于生物的树脂,其包含生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇及其组合的,以及通过模制基于生物的树脂获得的模制产品。

在另一方面,本文件特征还在于产生基于生物的聚合物的方法,其包括在聚合物产生反应中使生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,和/或1,6-己二醇与其自身或另一化合物起反应。

在另一方面,本文件特征在于产生基于生物的树脂的方法,其包括在树脂产生反应中使生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,和/或1,6-己二醇与其自身或另一种化合物起反应。

在另一个方面中,本文件提供了生物衍生的产物、基于生物的产物或发酵衍生的产物,其中所述产物包含:

(i).组合物,所述组合物包含本文中或图1-8中任一项提供的至少一种生物衍生的、基于生物的或发酵衍生的化合物,或它们的任何组合;

(ii).生物衍生的、基于生物的或发酵衍生的聚合物,其包含(i).的生物衍生的、基于生物的或发酵衍生的组合物或化合物,或它们的任何组合;

(iii).生物衍生的、基于生物的或发酵衍生的树脂,其包含(i).的生物衍生的、基于生物的或发酵衍生的化合物或生物衍生的、基于生物的或发酵衍生的组合物或它们的任何组合或(ii).的生物衍生的、基于生物的或发酵衍生的聚合物或它们的任何组合;

(iv).模制物质,其通过使(ii).的生物衍生的、基于生物的或发酵衍生的聚合物或(iii).的生物衍生的、基于生物的或发酵衍生的树脂或它们的任何组合模制获得;

(v).生物衍生的、基于生物的或发酵衍生的配制剂,其包含(i).的生物衍生的、基于生物的或发酵衍生的组合物、(i).的生物衍生的、基于生物的或发酵衍生的化合物、(ii).的生物衍生的、基于生物的或发酵衍生的聚合物、(iii).生物衍生的、基于生物的或发酵衍生的树脂,或(iv)的生物衍生的、基于生物的或发酵衍生的模制物质,或它们的任何组合;或

(vi).生物衍生的、基于生物的或发酵衍生的半固体或非半固体流,其包含(i).的生物衍生的、基于生物的或发酵衍生的组合物、(i).的生物衍生的、基于生物的或发酵衍生的化合物、(ii).的生物衍生的、基于生物的或发酵衍生的聚合物、(iii).生物衍生的、基于生物的或发酵衍生的树脂,(v).生物衍生的、基于生物的或发酵衍生的配制剂,或(iv)的生物衍生的、基于生物的或发酵衍生的模制物质,或它们的任何组合。

此外,本文描述了生物化学网络,其包含至少一种编码多肽的外源核酸,所述多肽具有(i)脂肪酸O-甲基转移酶活性或醇O-乙酰转移酶活性,(ii)单加氧酶活性和(iii)酯酶或脱甲基酶活性。

此外,本文描述了包含至少一种外源核酸的生物化学网络,所述外源核酸编码具有脂肪酸O-甲基转移酶活性的多肽和具有单加氧酶活性的多肽,其中所述生物化学网络酶促产生6-羟基己酸甲酯。生化网络可以进一步包括具有脱甲基酶活性的多肽或具有酯酶活性的多肽,其中具有脱甲基酶活性的多肽或具有酯酶活性的多肽酶促产生6-羟基己酸。

生化网络可以进一步包括至少一种外源核酸,所述外源核酸编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,其中具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和多肽具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽,具有反式-2-烯酰基-CoA还原酶活性的多肽酶促产生C6前体分子,如己酰基-CoA。

生化网络可以进一步包含以下一种或多种:具有硫酯酶活性的外源多肽,具有醛脱氢酶活性的多肽或具有丁醛脱氢酶活性的多肽,其中具有硫酯酶活性的多肽,具有醛脱氢酶活性的多肽或具有丁醛脱氢酶活性酶促产生己酸作为C6前体分子。

此外,本文描述了生物化学网络,其包含至少一种编码具有醇O-乙酰转移酶活性的多肽和具有单加氧酶活性的多肽的外源核酸,其中所述生化网络产生己酸己酯。生化网络可以进一步包括酯酶,其中酯酶将己酸己酯酶促转化为6-羟基己酸和/或1,6-己二醇。

生化网络可以进一步包括至少一种外源核酸,其编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽,和具有反式-2-烯酰基-CoA还原酶活性的多肽,其中具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽,和具有β-酮脂酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性酶促产生C6前体分子,如己酰基-CoA。生化网络可以进一步包括以下一种或多种:具有醛脱氢酶活性的外源多肽,具有醇脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有羧酸还原酶活性的多肽或具有硫酯酶活性的多肽,其中具有醛脱氢酶活性的多肽,具有醇脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有羧酸还原酶活性的多肽或具有硫酯酶活性的多肽酶促产生己醇作为C6前体分子。

产生6-羟基己酸的生物化学网络可以进一步包括以下一种或多种:具有单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽,其中具有单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽将6-羟基己酸酶促转化为己二酸或己二酸半醛。

产生6-羟基己酸的生物化学网络可以进一步包括以下一种或多种:具有ω-转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽和具有醇脱氢酶活性的多肽,其中具有ω-转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为6-氨基己酸。

产生6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇的生化网络可以进一步包括以下一种或多种:具有羧酸还原酶活性的多肽,具有ω-转氨酶的多肽活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽或具有醇脱氢酶活性的多肽,其中具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽或具有醇脱氢酶活性的多肽将6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇酶促转化成六亚甲基二胺。

产生6-羟基己酸的生物化学网络可以进一步包括以下一种或多种:具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽,其中具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为1,6-己二醇。

此外,本文描述了用于获得6-羟基己酸的手段(means),其使用(i)具有脂肪酸O-甲基转移酶活性的多肽和具有单加氧酶活性的多肽和(ii)具有脱甲基酶活性的多肽或具有酯酶活性的多肽进行。所述手段还可以包括将6-羟基己酸转化为己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种的手段。所述手段可以包括具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽。

此外,本文描述了用于获得6-羟基己酸的手段,其使用(i)具有醇O-乙酰转移酶的多肽和具有单加氧酶活性的多肽和(ii)具有脱甲基酶活性的多肽或具有酯酶活性的多肽进行。所述手段还可以包括将6-羟基己酸转化为己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种的手段。所述手段可以包括具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽。

本文还描述了(i)用于获得6-羟基己酸的步骤,其使用具有醇O-乙酰转移酶的多肽,具有单加氧酶活性的多肽和具有脱甲基酶活性的多肽或具有酯酶活性的多肽获得,和(ii)用于获得己二酸,6-氨基己酸,己二酸半醛,1,6-己二醇,六亚甲基二胺的步骤,其使用具有羧酸还原酶活性的多肽,具有醇脱氢酶活性的多肽,具有ω-转氨酶的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽。

另一方面,本文件的特征在于组合物,其包含6-羟基己酸和具有醇O-乙酰转移酶的多肽,具有单加氧酶活性的多肽和具有脱甲基酶活性的多肽或具有酯酶活性复合物的多肽。组合物可以是细胞的。组合物还可以包括具有羧酸还原酶活性的多肽,具有醇脱氢酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽,以及己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种。组合物可以是细胞的。

本文中所述的途径的反应可在一种或多种细胞(例如宿主细胞)株中进行,其(a)天然表达一种或多种相关酶,(b)经基因工程化改造以表达一种或多种相关酶,或(c)天然表达一种或多种相关酶并且遗传工程化改造以表达一种或多种相关酶。或者,可以从上述类型的宿主细胞中提取相关酶,并以纯化或半纯化形式使用。提取的酶可以任选地固定到合适的反应容器的底部和/或壁。此外,此类提取物包括可用作相关酶来源的裂解物(例如细胞裂解物)。在本文件提供的方法中,所有步骤可以在细胞(例如宿主细胞)中进行,所有步骤可以使用提取的酶进行,或者一些步骤可以在细胞中进行,而其它步骤可以使用提取的酶进行。

除非另有定义,本文中使用的所有技术和科学术语与本发明所属领域的普通技术人员的通常理解具有相同的含义。尽管与本文中所述的方法和材料类似或等同的方法和材料可用于实施本发明,但下文描述了合适的方法和材料。本文中提及的所有出版物,专利申请,专利和其它参考文献,包括具有登录号的GenBank和NCBI提交物通过引用整体并入。在冲突的情况下,以本说明书(包括定义)为准。此外,材料,方法和实施例仅仅是说明性的,而不是限制性的。

在下面的附图和描述中阐述了本发明的一个或多个实施例的细节。本发明的其它特征,目的和优点将从说明书和附图以及权利要求书中显而易见。根据专利法中的标准实践,权利要求书中的词语“包括”可以被“基本上由...组成”或由“由...组成”替代。

附图简述

图1是使用NADH依赖性酶和乙酰基-CoA作为中心代谢物导致己酰基-CoA的示例性生物化学途径的示意图。

图2是使用NADPH依赖性酶和乙酰基-CoA作为中心代谢物导致己酰基-CoA的示例性生物化学途径的示意图。

图3是使用己酰基-CoA作为中心前体导致己酸和己醇的示例性生物化学途径的示意图。

图4是使用6-羟基己酸作为中心前体导致己二酸的示例性生物化学途径的示意图。

图5是使用6-羟基己酸作为中心前体导致6-氨基己酸和己内酰胺的示例性生物化学途径的示意图。

图6是使用6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇作为中心前体导致六亚甲基二胺的示例性生物化学途径的示意图。

图7是使用己酸或己酰基-CoA作为中心前体经由酯中间体导致6-羟基己酸的示例性生物化学途径的示意图。图7还含有使用1,6-己二醇作为中心前体导致6-羟基己酸的示例性生物化学途径。

图8是使用6-羟基己酸或己酰基-CoA作为中心前体导致1,6-己二醇的示例性生物化学途径的示意图。

图9含有由tesB编码的大肠杆菌硫酯酶(参见GenBank登录号AAA24665.1,SEQ ID NO:1),海分枝杆菌羧酸还原酶(参见GenBank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌羧酸还原酶(参见GenBank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus羧酸还原酶(参见GenBank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌羧酸还原酶(参见GenBank登录号EIV11143.1,SEQ ID NO:5),Segniliparus rotundus羧酸还原酶(参见GenBank登录号ADG98140.1,SEQ ID NO:6),青紫色杆菌ω-转氨酶(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌ω-转氨酶(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌ω-转氨酶(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌ω-转氨酶(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌ω-转氨酶(参见GenBank登录号AAA57874.1,SEQ ID NO:11)和河流弧菌ω-转氨酶(参见GenBank登录号AEA39183.1,SEQ ID NO:12),极胞菌属物种(Polaromonas sp.)JS666单加氧酶(参见GenBank登录号ABE47160.1,SEQ ID NO:13),分枝杆菌属物种HXN-1500单加氧酶(参见GenBank登录号CAH04396.1,SEQ ID NO:14),南非分枝杆菌(Mycobacterium austroafricanum)单加氧酶(参见GenBank登录号ACJ06772.1,SEQ ID NO:15),极胞菌属物种JS666氧化还原酶(参见GenBank登录号ABE47159.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500氧化还原酶(参见GenBank登录号CAH04397.1,SEQ ID NO:17),极胞菌属物种JS666铁氧还蛋白(参见GenBank登录号ABE47158.1,SEQ ID NO:18),分枝杆菌属物种HXN-1500铁氧还蛋白(参见GenBank登录号CAH04398.1,SEQ ID NO:19),枯草芽孢杆菌磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号CAA44858.1,SEQ ID NO:20),诺卡氏菌属物种NRRL 5646磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号ABI83656.1,SEQ ID NO:21),海分枝杆菌脂肪酸O-甲基转移酶(GenBank登录号ACC41782.1;SEQ ID NO:22),耻垢分枝杆菌菌株MC2脂肪酸O-甲基转移酶(GenBank登录号ABK73223.1;SEQ ID NO:23),恶臭假单胞菌脂肪酸O-甲基转移酶(GenBank登录号CAA39234.1;SEQ ID NO:24),酿酒酵母醇O-乙酰基转移酶(Genbank登录号:CAA85138.1,SEQ ID NO:25),荧光假单胞菌羧酸酯酶(Genbank登录号AAC60471.2,SEQ ID NO:26),恶臭假单胞菌烷1-单加氧酶(Genbank登录号CAB51047.1,SEQ ID NO:27),麦芽糖假丝酵母色素P450(Genbank登录号BAA00371.1,SEQ ID NO:28),肠沙门氏菌肠亚种鼠伤寒血清型(Salmonella enterica subsp.enterica serovar Typhimurium)丁醛脱氢酶(GenBank登录号AAD39015,SEQ ID NO:29),少动鞘氨醇单胞菌脱甲基酶(GenBank登录号BAD61059.1和GenBank登录号BAC79257.1,分别为SEQ ID NO:30和31),短乳杆菌硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32),和植物乳杆菌硫酯酶(GenBank登录号CCC78182.1,SEQ ID NO:33)的氨基酸序列。

图10是释放的CoA在412nm处的相对吸光度的条形图,作为相对于空载体对照,硫酯酶用于将己酰基-CoA转化为己酸的活性的量度。

图11是总结20分钟后340nm处吸光度变化的条形图,其是没有底物(仅酶对照)的NADPH消耗和羧酸还原酶活性的量度。

图12是20分钟后340nm处吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸还原酶用于将己二酸转化为己二酸半醛的活性的量度。

图13是20分钟后在340nm处的吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸还原酶用于将6-羟基己酸转化为6-羟基己醛的活性的量度。

图14是20分钟后340nm处吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸盐还原酶将N6-乙酰基-6-氨基己酸转化为N6-乙酰基-6-氨基己醛的活性的量度。

图15是20分钟后340nm处吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸还原酶用于将己二酸半醛转化为己二醛的活性的量度。

图16是总结在4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)作为仅酶对照(无底物)的ω-转氨酶活性的量度的条形图。

图17是24小时后丙酮酸至L-丙氨酸转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将6-氨基己酸转化为己二酸半醛的ω-转氨酶活性的量度。

图18是4小时后L-丙氨酸至丙酮酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将己二酸半醛转化为6-氨基己酸的ω-转氨酶活性的量度。

图19是4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将六亚甲基二胺转化为6-氨基己醛的ω-转氨酶活性的量度。

图20是4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将N6-乙酰基-1,6-二氨基己烷转化为N6-乙酰基-6-氨基己醛的ω-转氨酶活性的量度。

图21是4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将6-氨基己醇转化为6-氧代己醇的ω-转氨酶活性的量度。

图22是通过LC-MS测定的6-羟基己酸的峰面积变化的条形图,作为相对于空载体对照,用于将己酸转化为6-羟基己酸的单加氧酶活性的量度。

图23是20分钟后在340nm处的吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和用于将己酸转化为己醛的羧酸还原酶活性的量度。

发明详述

本文件提供了酶,非天然途径,培养策略,原料,中心前体,宿主微生物和对宿主生物化学网络的减弱,其从中心代谢物产生六碳链脂肪族主链(其可以与辅酶A部分结合),其中可形成两个末端官能团,导致合成以下一种或多种:己二酸、6-羟基己酸、6-氨基己酸、己内酰胺、六亚甲基二胺或1,6-己二醇(在本文中称为“C6构件块”)。如本文中使用,术语“中心前体”用于意指导致C6构件块合成的本文中显示的任何代谢途径中的任何代谢物。术语“中心代谢物”用于意指所有微生物中生成以支持生长的代谢物。

本文中描述的宿主微生物可以包含内源途径,该内源途径可以通过操作,使得可以生成一种或多种C6构件块或其中心前体。在内源途径中,宿主微生物天然表达催化途径内的反应的所有酶。含有工程化途径的宿主微生物不天然表达催化途径内的反应的所有酶,但是已经经过工程化改造,使得在宿主中表达途径内的所有酶。

如本文中提及核酸(或蛋白质)和宿主使用的,术语“外源”指不像其在自然界中被发现一样存在于特定类型细胞中(并且不能从特定类型细胞获得)的核酸或由所述核酸编码的蛋白质。如此,非天然存在的核酸一旦在宿主中即视为对于宿主而言外源的。重要的是注意非天然存在的核酸可含有在自然界中发现的核酸序列的核酸亚序列或片段,只要该核酸作为整体不存在于自然界中。例如,表达载体内含有基因组DNA序列的核酸分子是非天然存在的核酸,如此一旦导入宿主中对于宿主细胞而言是外源的,因为该核酸分子作为整体(基因组DNA加载体DNA)不存在于自然界中。如此,作为整体不存在于自然界中的任何载体、自主复制的质粒或病毒(例如逆转录病毒、腺病毒、或疱疹病毒)视为非天然存在的核酸。由此得出结论通过PCR或限制内切性核酸酶处理产生的基因组DNA片段以及cDNA也视为非天然存在的核酸,因为它们作为未见于自然界的分开的分子存在。由此还得出结论任何以未见于自然界中的排布含有启动子序列和多肽编码序列(例如cDNA或基因组DNA)的任何核酸也是非天然存在的核酸。天然存在的核酸可以是对于特定宿主微生物而言外源的。例如,从酵母x的细胞分离的完整染色体一旦将该染色体导入酵母y的细胞中就酵母y细胞而言是外源核酸。

比较而言,如本文中提及核酸(例如基因)(或蛋白质)和宿主使用的,术语“内源的”指就像其在自然界中被发现一样的确存在于特定宿主中(并且可以从特定宿主获得)的核酸(或蛋白质)。此外,“内源表达”核酸(或蛋白质)的细胞就像其在自然界中被发现时相同特定类型的宿主那样表达所述核酸(或蛋白质)。此外,“内源生成”核酸、蛋白质、或其它化合物的宿主就像其在自然界中被发现时相同特定类型的宿主那样生成所述核酸、蛋白质、或化合物。

例如,根据宿主和宿主产生的化合物,除了具有脂肪酸O-甲基转移酶活性的多肽或具有醇O-乙酰转移酶活性的多肽之外,还可以在宿主中表达一种或多种下列多肽:具有单加氧酶活性的多肽,具有酯酶活性的多肽,具有脱甲基酶活性的多肽,具有β-酮硫解酶活性的多肽,具有乙酰基-CoA羧化酶活性的多肽,具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽,具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽,具有反式-2-烯酰基-CoA还原酶活性的多肽,具有硫酯酶活性的多肽,具有醛脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有例如CYP4F3B家族中的单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有5-氧代戊酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有7-氧代庚酸脱氢酶活性的多肽,具有ω-转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽,具有羧酸还原酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽,或具有酰胺水解酶活性的多肽。在表达具有羧酸还原酶活性的多肽的重组宿主中,也可以表达具有磷酸泛酰巯基乙胺基转移酶活性的多肽,因为它增强具有羧酸还原酶活性的多肽的活性。在表达具有单加氧酶活性的多肽的重组宿主中,还可以表达电子转移链蛋白,如具有氧化还原酶活性的多肽和/或具有铁氧还蛋白多肽活性的多肽。

在一些实施方案中,重组宿主可以包括至少一种外源核酸,其编码具有(i)脂肪酸O-甲基转移酶活性的多肽或具有醇O-乙酰转移酶活性的多肽,(ii)具有单加氧酶活性的多肽,和(iii)具有酯酶活性的多肽或具有脱甲基酶活性的多肽。

在一些实施方案中,重组宿主可以包括编码具有脂肪酸O-甲基转移酶活性的多肽和具有单加氧酶活性的多肽的至少一种外源核酸,其中所述宿主产生6-羟基己酸甲酯。此类宿主还可以包括具有脱甲基酶活性的多肽或具有酯酶活性的多肽并进一步产生6-羟基己酸。在一些实施方案中,重组宿主还可以包括至少一种外源核酸,其编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,以产生C6前体分子,如己酰基-CoA。此类宿主还可以包括以下一种或多种(例如,两种或三种):具有硫酯酶活性的外源多肽,具有醛脱氢酶活性的多肽或具有丁醛脱氢酶活性的多肽,并产生己酸作为C6前体分子。

在一些实施方案中,重组宿主可以包括编码具有醇O-乙酰转移酶活性的多肽和具有单加氧酶活性的多肽的至少一种外源核酸,其中宿主产生己酸己酯。此类宿主还可以包括具有酯酶活性的多肽并进一步产生6-羟基己酸和/或1,6-己二醇。在一些实施方案中,重组宿主还可以包括至少一种外源核酸,其编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,以产生C6前体分子,如己酰基-CoA。此类宿主还可以包括以下一种或多种(例如,两种或三种):具有醛脱氢酶活性的外源多肽,具有醇脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有羧酸还原酶活性的多肽或具有硫酯酶活性的多肽,并且产生己醇作为C6前体分子。

产生6-羟基己酸的重组宿主还可以包括以下一种或多种:具有单加氧酶活性的多肽(例如在CYP4F3B家族中),具有醇脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽,并产生己二酸或己二酸半醛。例如,重组宿主还可以包括具有单加氧酶活性的多肽并产生己二酸或己二酸半醛。作为另一个实例,重组宿主还可以包括(i)具有醇脱氢酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽或具有4-羟基丁酸脱氢酶活性的多肽,或(ii)具有醛脱氢酶活性的多肽,具有5-氧代丁酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽或具有7-氧代己酸脱氢酶活性的多肽,并产生己二酸。

产生6-羟基己酸的重组宿主还可以包括以下一种或多种:具有转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽和具有醇脱氢酶活性的多肽,并产生6-氨基己酸。例如,产生6-羟基己酸的重组宿主还可以包括具有ω-转氨酶活性的多肽和具有6-羟基己酸脱氢酶活性的多肽或具有醇脱氢酶活性的多肽。

产生6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇的重组宿主还可以包括以下一种或多种:具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽或具有醇脱氢酶活性的多肽,并产生六亚甲基二胺。在一些实施方案中,重组宿主还可以包括以下每种:具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽和具有N-乙酰转移酶活性的多肽。在一些实施方案中,重组宿主还可以包括具有羧酸还原酶活性的多肽和具有ω-转氨酶活性的多肽。在一些实施方案中,重组宿主还可以包括具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽和具有醇脱氢酶活性的多肽。在其中重组宿主产生6-氨基己酸的实施方案中,具有ω-转氨酶活性的另外的多肽对于产生六亚甲基二胺可以是不必要的。在一些实施方案中,宿主包括具有ω-转氨酶活性的第二外源多肽,其不同于具有ω-转氨酶活性的第一外源多肽。

产生6-羟基己酸的重组宿主还可以包括具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽中的一种或多种,并产生1,6-己二醇。

在工程化途径内,酶可以来自单一来源,即来自一种物种或属,或者可以来自多种来源,即不同物种或属。编码本文中描述的酶的核酸已经自各种生物体鉴定,并且在公众可用的数据库(诸如GenBank或EMBL)中容易地可得到。在含有外源酶的重组宿主中,宿主含有编码酶的外源核酸。

可用于生成一种或多种C6构件块的本文中描述的任何酶可以与相应野生型酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)。应当理解,可以基于成熟酶(例如除去任何信号序列)或基于未成熟的酶(例如包括任何信号序列)测定序列同一性。

例如,本文中描述的具有硫酯酶活性的多肽可以与由tesB编码的大肠杆菌硫酯酶的氨基酸序列(参见GenBank登录号AAA24665.1,SEQ ID NO:1),与短乳杆菌硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌硫酯酶的氨基酸序列(GenBank登录号CCC78182.1,SEQ ID NO:33)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有羧酸还原酶活性的多肽可以与海分枝杆菌(参见Genbank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌(参见Genbank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus(参见Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(参见Genbank登录号EIV11143.1,SEQ ID NO:5),或Segniliparus rotundus(参见Genbank登录号ADG98140.1,SEQ ID NO:6)羧酸还原酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)。参见图9。

例如,本文中描述的具有ω-转氨酶活性的多肽与青紫色杆菌(参见Genbank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见Genbank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见Genbank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见Genbank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:11),或河流弧菌(参见Genbank登录号AEA39183.1,SEQ ID NO:12)ω-转氨酶的氨基酸序列可以具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。这些ω-转氨酶中的一些是二胺ω-转氨酶。参见图9。

例如,本文中描述的具有单加氧酶活性的多肽可以与极胞菌属物种JS666单加氧酶(参见GenBank登录号ABE47160.1,SEQ ID NO:13),分枝杆菌物种HXN-1500单加氧酶(参见GenBank登录号CAH04396.1,SEQ ID NO:14),或南非分枝杆菌单加氧酶(参见GenBank登录号ACJ06772.1,SEQ ID NO:15)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有氧化还原酶活性的多肽可以与极胞菌属物种JS666氧化还原酶(参见GenBank登录号ABE47159.1,SEQ ID NO:16)或分枝杆菌物种HXN-1500氧化还原酶(参见GenBank登录号CAH04397.1,SEQ ID NO:17)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有铁氧还蛋白活性的多肽可以与极胞菌属物种JS666铁氧还蛋白(参见GenBank登录号ABE47158.1,SEQ ID NO:18)或分枝杆菌物种HXN-1500铁氧还蛋白(参见GenBank登录号CAH04398.1,SEQ ID NO:19)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有磷酸泛酰巯基乙胺基转移酶活性的多肽可以与枯草芽孢杆菌磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号CAA44858.1,SEQ ID NO:20)或诺卡尔菌属物种NRRL 5646磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号ABI83656.1,SEQ ID NO:21)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有脂肪酸O-甲基转移酶活性的多肽可以与海分枝杆菌(参见GenBank登录号ACC41782.1,SEQ ID NO:22),耻垢分枝杆菌(参见GenBank登录号ABK73223.1,SEQ ID NO:23),或恶臭假单胞菌(参见GenBank登录号CAA39234.1,SEQ ID NO:24)甲基转移酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有醇-O乙酰基转移酶活性的多肽可以与酿酒酵母(参见GenBank登录号CAA85138.1,SEQ ID NO:25)醇-O乙酰基转移酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有酯酶活性的多肽可以与荧光假单胞菌(参见GenBank登录号AAC60471.2,SEQ ID NO:26)酯酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。

例如,本文中描述的具有烷1-单加氧酶活性的多肽可以与恶臭假单胞菌烷1-单加氧酶的氨基酸序列(Genbank登录号CAB51047.1,SEQ ID NO:27)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。

例如,本文中描述的具有色素P450单加氧酶活性的多肽可以与麦芽糖假丝酵母(Candida maltose)色素P450的氨基酸序列(Genbank登录号:BAA00371.1,SEQ ID NO:28)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。

例如,本文中描述的具有丁醛脱氢酶活性的多肽可以与肠沙门氏菌肠亚种鼠伤寒血清型丁醛脱氢酶的氨基酸序列(参见GenBank登录号AAD39015,SEQ ID NO:29)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。

例如,本文中描述的具有丁香酸(syringate)O-脱甲基酶活性的多肽可以与少动鞘氨醇单胞菌脱甲基酶的氨基酸序列(参见GenBank登录号BAD61059.1和GenBank登录号BAC79257.1,分别为SEQ ID NO:30和31)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。

可以如下测定两种氨基酸序列间的百分比同一性(同源性)。首先,使用来自含有BLASTP第2.0.14版的单机版BLASTZ的BLAST 2Sequences(Bl2seq)程序比对氨基酸序列。此单机版BLASTZ可以获自Fish&Richardson的网站(例如www.fr.com/blast/)或美国政府国立生物技术信息中心网站(www.ncbi.nlm.nih.gov)。解释如何使用Bl2seq程序的用法说明可以参见伴随BLASTZ的自述文件。Bl2seq使用BLASTP算法实施两种氨基酸序列之间的比较。为了比较两种氨基酸序列,如下设置Bl2seq的选项:-i设置为含有要比较的第一氨基酸序列的文件(例如C:\seq1.txt);-j设置为含有要比较的第二氨基酸序列的文件(例如C:\seq2.txt);-p设置为blastp;-o设置为任何期望的文件名称(例如C:\output.txt);并且所有其它选项保持为其缺省设置。例如,可以使用以下命令来产生含有两种氨基酸序列间的比较的输出文件:C:\Bl2seq–i c:\seq1.txt–j c:\seq2.txt–p blastp–o c:\output.txt。如果两种比较序列共享同源性(同一性),那么指定的输出文件会呈现那些同源性区作为比对序列。如果两种比较序列不共享同源性(同一性),那么指定的输出文件不会呈现比对序列。可以对核酸序列遵循相似的规程,只是使用blastn。

一旦比对,通过计算相同氨基酸残基在这两种序列中呈现的位置的数目确定匹配数目。通过用匹配数目除以全长多肽氨基酸序列的长度,接着将所得的数值乘以100来确定百分比同一性(同源性)。注意到百分比同一性(同源性)值被四舍五入到最近的十分位。例如,78.11、78.12、78.13、和78.14被向下四舍五入到78.1,而78.15、78.16、78.17、78.18、和78.19被向上四舍五入到78.2。还注意到长度值会总是整数。

应当领会,许多核酸可以编码具有特定氨基酸序列的多肽。遗传密码的简并性是本领域中公知的;即对于许多氨基酸,存在有超过一种充当氨基酸密码子的核苷酸三联体。例如,可以修饰给定酶的编码序列中的密码子,从而获得特定物种(例如细菌或真菌)中的最佳表达,这使用适合于所述物种的密码子偏好表进行。

也可以在本文件的方法中使用本文中描述的任何酶的功能性片段。如本文中使用的,术语“功能性片段”指短于全长未成熟的蛋白质并且具有至少25%(例如至少30%;40%;50%;60%;70%;75%;80%;85%;90%;91%;92%;93%;94%;95%;96%;97%;98%;99%;100%;或甚至大于100%)的相应的成熟、全长、野生型蛋白质活性的蛋白质的肽片段。功能性片段一般但不总是可以由蛋白质的连续区构成,其中该区具有功能性活性。

此文件还提供了(i)本文件的方法中使用的酶的功能性变体和(ii)上文描述的功能性片段的功能性变体。相对于相应的野生型序列,酶和功能性片段的功能性变体可以含有添加、缺失、或取代。具有取代的酶一般会具有不超过50(例如不超过1、2、3、4、5、6、7、8、9、10、12、15、20、25、30、35、40、或50)处氨基酸取代(例如保守取代)。这适用于本文中描述的任何酶和功能性片段。保守取代是用一种氨基酸取代具有相似特征的另一种。保守取代包括下列组内的取代:缬氨酸、丙氨酸和甘氨酸;亮氨酸、缬氨酸、和异亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;丝氨酸、半胱氨酸、和苏氨酸;赖氨酸和精氨酸;和苯丙氨酸和酪氨酸。非极性疏水性氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。带正电荷的(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸。带负电荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。上文提及的极性、碱性或酸性组的一种成员被相同组的另一种成员的任何取代可以视为保守取代。比较而言,非保守取代是用一种氨基酸取代具有不同特征的另一种。

缺失变体可以缺乏1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个氨基酸的区段(具有两种或更多种氨基酸)或非连续的单一氨基酸。添加(添加变体)包括融合蛋白,其含有:(a)本文中描述的任何酶或其片段;和(b)内部或末端(C或N)无关或异源氨基酸序列。在此类融合蛋白的背景中,术语“异源氨基酸序列”指与(a)不同的氨基酸序列。异源序列可以是例如用于纯化重组蛋白的序列(例如FLAG、多组氨酸(例如六组氨酸)、凝集素(HA)、谷胱甘肽-S-转移酶(GST)、或麦芽糖结合蛋白(MBP))。异源序列也可以是可用作可检测标志物的蛋白质,例如萤光素酶、绿色荧光蛋白(GFP)、或氯霉素乙酰基转移酶(CAT)。在一些实施方案中,融合蛋白含有来自另一种蛋白质的信号序列。在某些宿主细胞(例如酵母宿主细胞)中,可以经由使用异源信号序列提高靶蛋白的表达和/或分泌。在一些实施方案中,融合蛋白可以含有可用于例如引发免疫应答以生成抗体的载体(例如KLH)或ER或高尔基体保留信号。异源序列可以是不同长度的,并且在一些情况中可以是比与异源序列附接的全长靶蛋白质更长的序列。

工程化宿主可以天然表达本文中描述的途径的酶中的无一或一些(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、或六种或更多种)。如此,工程化宿主内的途径可以包含所有外源酶,或者可以包含内源和外源酶两者。也可以破坏工程化宿主的内源基因以阻止不想要的代谢物的形成或阻止经由对中间体起作用的其它酶引起的途径中此类中间体的损失。工程化宿主可以称为重组宿主或重组宿主细胞。如本文中描述的,重组宿主可以包含编码下列一种或多种的核酸:具有脂肪酸O-甲基转移酶活性的多肽,具有醇O-乙酰转移酶活性的多肽,具有脱氢酶活性的多肽,具有β-酮硫解酶活性的多肽,具有β-酮脂酰基-acp]合酶活性的多肽,具有羧化酶活性的多肽,具有还原酶活性的多肽,具有水合酶活性的多肽,具有硫酯酶活性的多肽,具有单加氧酶活性的多肽,具有脱甲基酶活性的多肽,具有酯酶活性的多肽或具有转氨酶活性的多肽,如本文中描述的。

另外,可以使用本文中描述的分离的酶,使用来自宿主微生物的裂解物(例如细胞裂解物)作为酶来源,或者使用来自不同宿主微生物的多种裂解物作为酶来源体外进行一种或多种C6构件块的产生。

生物合成方法

本文提供了产生(C3-8羟基烷基)-C(=O)OCH3酯的方法。如本文中所用的,术语(C3-8羟基烷基)-C(=O)OCH3酯是指具有下式的化合物:

如本文中所用的,术语“C3-8羟基烷基”是指可以是直链或支链,并且被至少一个羟基(即羟基或OH)基团取代的饱和烃基。在一些实施方案中,C3-8羟基烷基是指可以是直链或支链,并且被至少一个末端羟基(OH)基团取代的饱和烃基。在一些实施方案中,烷基含有4至8、4至7、4至6、4至5、5至8、5至7、5至6、6至8、6至7、或7至8个碳原子。在一些实施方案中,C3-8羟基烷基是下式的基团:

在一些实施方案中,该方法包括:

a)将C3-8羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯;并且

b)将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。

如本文中所用的,术语“C4-9羧酸”是指具有式RC(=O)OH的化合物,其中R是指可以是直链或支链的饱和烃基(即烷基),其中该化合物具有4至9个碳原子。在一些实施方案中,C4-9羧酸基团含有4至9、4至8、4至7、4至6、4至5、5至9、5至8、5至7、5至6、6至9,6至8,6至7,7至9,7至8或8至9个碳原子。示例性的C4-9羧酸包括丁酸(即丁酸盐),戊酸(即戊酸盐),己酸(即己酸盐),庚酸(即庚酸盐),辛酸(例如辛酸盐),壬酸(即壬酸盐),2-甲基己酸(即2-甲基己酸盐),3-甲基己酸(即3-甲基己酸盐),4-甲基己酸(即4-甲基己酸盐)和5-甲基己酸(即5-甲基己酸盐)。在一些实施方案中,C4-9羧酸是己酸盐(即己酸)。

如本文中所用,术语“(C3-8烷基)-C(=O)OCH3酯”是指具有下式的化合物:

如本文中所用的,术语“C3-8烷基”是指可以是直链或支链的,具有3至9个碳原子的饱和烃基。在一些实施方案中,烷基含有4至8、4至7、4至6、4至5、5至8、5至7、5至6、6至8、6至7或7至8个碳原子。实例烷基部分包括正丁基,异丁基,仲丁基,叔丁基,正戊基,异戊基,新戊基,正己基,正庚基,正辛基。在一些实施方案中,C3-8烷基是下式的基团:

在一些实施方案中,该方法包括:

a)将C4-9羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯;并且

b)将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。

在一些实施方案中,使用具有脂肪酸O-甲基转移酶活性的多肽将C4-9羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯。在一些实施方案中,具有甲基转移酶活性的多肽与SEQ ID NO:23,SEQ ID NO:24或SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,使用具有单加氧酶活性的多肽将(C3-8烷基)-C(=O)OCH3酯酶促转化成(C3-8羟烷基)-C(=O)OCH3酯。在一些实施方案中,单加氧酶分类在EC 1.14.14.-或EC 1.14.15.-下。在一些实施方案中,单加氧酶与SEQ ID NO:13-15,SEQ ID NO:27和/或SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,从C4-9烷酰基-CoA酶促产生C4-9羧酸。如本文所用的,术语“C4-9烷酰基-CoA”是指具有下式的化合物:

其中C3-8烷基如本文所定义。在一些实施方案中,C3-8烷基是下式的基团:

在一些实施方案中,具有硫酯酶活性的多肽从C4-9烷酰基-CoA酶促产生C4-9羧酸。在一些实施方案中,硫酯酶与SEQ ID NO:1所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,具有丁醛脱氢酶活性的多肽和具有醛脱氢酶活性的多肽从C4-9烷酰基-CoA酶促产生C4-9羧酸。

在一些实施方案中,产生(C3-8羟基烷基)-C(=O)OCH3酯的方法是用于产生6-羟基己酸甲酯的方法,所述方法包括:

a)将己酸酶转化为己酸甲酯;并且

b)将己酸甲酯酶促转化为6-羟基己酸甲酯。

在一些实施方案中,使用具有脂肪酸O-甲基转移酶活性的多肽将己酸酶促转化成己酸甲酯。在一些实施方案中,具有脂肪酸O-甲基转移酶活性的多肽与SEQ ID NO:22,SEQ ID NO:23或SEQ ID NO:24中所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,使用具有单加氧酶活性的多肽将己酸甲酯酶促转化为6-羟基己酸甲酯。在一些实施方案中,具有单加氧酶活性的多肽与SEQ ID NO:13-15,SEQ ID NO:27和/或SEQ ID NO:28中所示的氨基酸具有至少70%的序列同一性。在一些实施方案中,具有单加氧酶活性的多肽分类在EC1.14.14.-或EC 1.14.15.-下。

在一些实施方案中,从己酰基-CoA酶促产生己酸。在一些实施方案中,具有硫酯酶活性的多肽从己酰基-CoA酶促产生己酸。在一些实施方案中,具有硫酯酶活性的多肽与SEQ ID NO:1,和/或SEQ ID NO:32-33所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,具有丁醛脱氢酶活性的多肽和具有醛脱氢酶活性的多肽从己酰基-CoA酶促产生己酸。

本文件还提供了产生一种或多种末端羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯的方法。如本文所用的,术语“(C4-9烷基)-OC(=O)-(C3-8烷基)酯”是指具有下式的化合物:

其中C3-8烷基如本文所定义。如本文所用的,术语“末端羟基取代的”(C4-9烷基)-OC(=O)-(C3-8烷基)酯”是指具有下式的化合物:

其中烷基中的至少一个(即C4-9烷基和C3-8烷基中的至少一个)被至少一个末端羟基(-OH)基团取代,并且C3-8烷基如本文所定义。如本文所用的,术语“C4-9烷基”是指可以是直链或支链的,具有4-9个碳原子的饱和烃基。在一些实施方案中,烷基包含4至9、4至8、4至7、4至6、4至5、5至9、5至8、5至7、5至6、6至9、6至8,6至7,7至9,7至8或8至9个碳原子。实例烷基部分包括正丁基,异丁基,仲丁基,叔丁基,正戊基,异戊基,新戊基,正己基,正庚基,正辛基和正壬基。在一些实施方案中,烷基之一被至少一个末端羟基取代。在一些实施方案中,每个烷基被至少一个末端羟基取代。在一些实施方案中,烷基之一被一个末端羟基取代。在一些实施方案中,每个烷基被一个末端羟基取代。在一些实施方案中,末端羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯选自:

在一些实施方案中,该方法包括:

a)将C4-9烷酰基-CoA酶促转化成(C4-9烷基)-OC(=O)-(C3-8烷基)酯;并且

b)将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化为(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯中的任一种。

在一些实施方案中,使用具有醇O-乙酰转移酶活性的多肽将C4-9烷酰基-CoA酶促转化为(C4-9烷基)-OC(=O)-(C3-8烷基)酯。在一些实施方案中,所述醇O-乙酰转移酶与SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,使用具有单加氧酶活性的多肽将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化为(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯中的任一种。在一些实施方案中,具有单加氧酶活性的多肽归类在EC 1.14.14.-或EC 1.14.15.-下。

在一些实施方案中,所述方法还包括将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯酶促转化成C4-9羟基链烷酸。在一些实施方案中,具有酯酶活性的多肽将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯转化为C4-9羟基链烷酸。

如本文所用,术语C4-9羟基链烷酸是指具有下式的化合物:

其中C3-8羟基烷基如本文所定义。实例C4-9羟基链烷酸包括但不限于6-羟基己酸盐(即6-羟基己酸),5-羟基己酸盐(即5-羟基己酸),4-羟基己酸盐(即4-羟基己酸),3-羟基己酸盐(即,3-羟基己酸)等。本领域技术人员应理解,具体形式将取决于pH(例如,中性或离子化形式,包括其任何盐形式)。在一些实施方案中,C3-8羟基烷基是具有下式的基团:

在一些实施方案中,产生一种或多种羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯的方法是产生一种或多种己酸己基羟基酯的方法。在一些实施方案中,该方法包括:

a)将己酰基-CoA酶促转化成己酸己酯;并且

b)将己酸己酯酶促转化为6-羟基己酸己酯,6-羟基己酸6-羟基己酯或己酸6-羟基己酯中的任一种。

在一些实施方案中,使用具有醇O-乙酰转移酶活性的多肽将己酰基-CoA酶促转化成己酸己酯。在一些实施方案中,具有醇O-乙酰转移酶活性的多肽与SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,使用具有单加氧酶活性的多肽将己酸己酯酶促转化为6-羟基己酸己酯,6-羟基己酸6-羟基己酯和/或己酸6-羟基己酯中的任一种。在一些实施方案中,具有单加氧酶活性的多肽归类在EC 1.14.14.-或EC 1.14.15.-下。

在一些实施方案中,所述方法还包括将6-羟基己酸6-羟基己酯或6-羟基己酸己酯酶促转化为6-羟基己酸。在一些实施方案中,具有酯酶活性的多肽将6-羟基己酸6-羟基己酯或6-羟基己酸己酯酶促转化为6-羟基己酸。

在一些实施方案中,所述方法还包括将6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化为1,6-己二醇。在一些实施方案中,具有酯酶活性的多肽将6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化为1,6-己二醇。

在一些实施方案中,所述方法可包括将6-羟基己酸己酯,6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化为6-羟基己酸和/或1,6-己二醇。在一些实施方案中,具有酯酶活性的多肽将6-羟基己酸己酯,6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化成6-羟基己酸和/或1,6-己基二醇。

在一些实施方案中,该方法进一步包括将1,6-己二醇酶促转化为6-羟基己醛。在一些实施方案中,具有醇脱氢酶活性的多肽将1,6-己二醇酶促转化为6-羟基己醛。

在一些实施方案中,该方法还包括将6-羟基己醛酶促转化为6-羟基己酸。在一些实施方案中,具有醛脱氢酶活性的多肽将6-羟基己醛酶促转化为6-羟基己酸。

在一些实施方案中,所述方法还包括将6-羟基己酸甲酯酶促转化为6-羟基己酸。在一些实施方案中,具有脱甲基酶或酯酶活性的多肽将6-羟基己酸甲酯酶促转化为6-羟基己酸。

在一些实施方案中,所述方法还包括将6-羟基己酸酶促转化为选自下组的产物:己二酸,己二酸半醛,6-氨基己酸,六亚甲基二胺和1,6-己二醇。

在一些实施方案中,所述方法包括使用具有醇脱氢酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有单加氧酶活性的多肽将6-羟基己酸酶促转化为己二酸半醛。

在一些实施方案中,所述方法进一步使用具有5-氧代戊酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有7-氧代庚酸脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,或具有单加氧酶活性的多肽将己二酸半醛酶促转化为己二酸。

在一些实施方案中,所述方法还包括将己二酸半醛酶促转化为6-氨基己酸。在一些实施方案中,具有ω-转氨酶活性的多肽将己二酸半醛酶促转化为6-氨基己酸。

在一些实施方案中,所述方法还包括将6-氨基己酸酶促转化为六亚甲基二胺。在一些实施方案中,所述方法还包括将己二酸半醛酶促转化为六亚甲基二胺。在一些实施方案中,使用具有羧酸还原酶活性的多肽和/或具有ω-转氨酶活性的多肽和任选地具有N-乙酰转移酶活性的多肽,具有乙酰腐胺脱乙酰酶活性的多肽和具有醇脱氢酶活性的多肽中的一种或多种,将己二酸半醛或6-氨基己酸酶促转化成六亚甲基二胺。

在一些实施方案中,所述方法包括使用具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为1,6-己二醇。

在一些实施方案中,所述方法还包括将1,6-己二醇酶促转化为六亚甲基二胺。在一些实施方案中,具有醇脱氢酶活性的多肽和具有ω-转氨酶活性的多肽将1,6-己二醇酶促转化六亚甲基二胺。

在一些实施方案中,具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为六亚甲基二胺。

在一些实施方案中,具有ω-转氨酶活性的多肽与SEQ ID NO:7-12中所示的任一氨基酸序列具有至少70%的序列同一性。

在一些实施方案中,通过CoA依赖性碳链延长的两个循环从乙酰基-CoA产生己酰基-CoA。在一些实施方案中,所述CoA依赖性碳链延长的两个循环的每一个包括使用具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮脂酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,以从乙酰基-CoA形成己酰基-CoA。

将己酸或己酰基-CoA转化为6-羟基己酸的酶

如图7中描绘,可以使用具有脂肪酸O-甲基转移酶活性的多肽,如具有例如EC 2.1.1.15下分类的脂肪酸O-甲基转移酶活性的多肽从己酸形成己酸甲酯。例如,具有脂肪酸O-甲基转移酶活性的多肽可以获自海分枝杆菌(GenBank登录号ACC41782.1,SEQ ID NO:22);耻垢分枝杆菌(参见GenBank登录号ABK73223.1,SEQ ID NO:23)或恶臭假单胞菌(参见GenBank登录号CAA39234.1,SEQ ID NO:24)。

可以使用具有例如在EC 1.14.14.-或EC 1.14.15-(1,3)下分类的单加氧酶活性的多肽将己酸甲酯转化为6-羟基己酸甲酯。例如,具有单加氧酶活性可以是例如来自CYP153A家族(SEQ ID NO:13-15),CYP52A3家族(参见Genbank登录号:BAA00371.1,SEQ ID NO:28)或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(参见Genbank登录号CAB51047.1,SEQ ID NO:27)。参见图7。

可以使用具有例如在EC 2.1.1.-下分类的脱甲基酶活性的多肽,如ligM(参见GenBank登录号BAD61059.1;SEQ SEQ ID NO:30)或desA(GenBank登录号BAC79257.1;SEQ ID NO:31)的基因产物或使用具有例如在EC 3.1.1.-下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将6-羟基己酸甲酯转化为6-羟基己酸。

如图7中描绘,可以使用具有例如在EC 2.3.1.-(84)下分类的醇O-乙酰转移酶活性的多肽,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)将己酰基-CoA转化为己酸己酯。

可以使用具有例如在EC 1.14.14.-或EC 1.14.15-(1,3)下分类的单加氧酶活性的多肽将己酸己酯转化为6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3家族(Genbank登录号:BAA00371.1,SEQ ID NO:28)或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(Genbank登录号CAB51047.1,SEQ ID NO:27)。参见图7。

可以使用具有例如EC 3.1.1.-(1,6)下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将6-羟基己酸己酯和6-羟基己酸6-羟基己酯转化为6-羟基己酸。

例如,在例如EC 1.14.15.-(1,3)下分类的单加氧酶CYP153A家族是可溶的,并且对末端羟基化具有区域特异性,接受中等链长度底物(参见例如Koch等人,Appl.Environ.Microbiol.,2009,75(2),337-344;Funhoff等人,2006,J.Bacteriol.,188(44):5220–5227;Van Beilen&Funhoff,Current Opinion in Biotechnology,2005,16,308–314;Nieder and Shapiro,J.Bacteriol.,1975,122(1),93-98)。虽然在体外观察到CYP153A的非末端羟基化,但在体内仅发生1-羟基化(参见,Funhoff等人,2006,同上)。

已经通过成功地将CYP153A的链长度特异性降低到低于C8,拓宽了末端单加氧酶的底物特异性和活性(Koch等人,2009,同上)。

在一些实施方案中,可以使用归类在EC 3.1.2.-下的具有硫酯酶活性的多肽,如YciA的基因产物tesB(GenBank登录号AAA24665.1,SEQ ID NO:1),Acot13(Cantu等人,Protein Science,2010,19,1281–1295;Zhuang等人,Biochemistry,2008,47(9):2789–2796;Naggert等人,J.Biol.Chem.,1991,266(17):11044–11050),来自短乳杆菌(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌(GenBank登录号CCC78182.1,SEQ ID NO:SEQ ID NO:33)的酰基-[acp]硫酯酶从己酰基-CoA酶促形成己酸。此类酰基-[acp]硫酯酶具有C6-C8链长度特异性(参见例如Jing等人,2011,BMC Biochemistry,12(44))。参见图3。

在一些实施方案中,可以使用具有例如在EC 1.2.1.-如EC 1.2.1.10或EC 1.2.1.57下分类(参见例如GenBank登录号AAD39015,SEQ ID NO:29或GenBank登录号ABJ64680.1)的丁醛脱氢酶活性的多肽,如PduP或PduB的基因产物和分类在例如EC 1.2.1.-(例如EC 1.2.1.3或EC 1.2.1.4)下的醛脱氢酶从己酰基-CoA酶促形成己酸(参见Ho&Weiner,J.Bacteriol.,2005,187(3):1067–1073)。参见图3。

产生己酰基-CoA以转化成C6构件块的酶

如图1和图2中描绘,可以通过使用NADH或NADPH依赖性酶的经由两个循环的CoA依赖性碳链延长从乙酰基-CoA形成己酰基-CoA。

在一些实施方案中,CoA依赖性碳链延伸循环包括使用具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基CoA还原酶活性,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽。具有β-酮硫解酶活性的多肽可以将乙酰基-CoA转化为3-氧代丁酰基-CoA,并且可以将丁酰基-CoA转化为3-氧代己酰基-CoA。具有乙酰基-CoA羧化酶活性的多肽可以将乙酰基-CoA转化为丙二酰基-CoA。具有乙酰乙酰基-CoA合酶活性的多肽可以将丙二酰基-CoA转化为乙酰乙酰基-CoA。具有3-羟基丁酰基-CoA脱氢酶活性的多肽可以将3-氧代丁酰基-CoA转化为3-羟基丁酰基CoA。具有3-氧代酰基CoA还原酶/3-羟基酰基-CoA脱氢酶活性的多肽可以将3-氧代己酰基-CoA转化为3-羟基己酰基-CoA。具有烯酰基-CoA水合酶活性的多肽可以将3-羟基丁酰基-CoA转化为丁-2-烯酰基-CoA,并且可以将3-羟基己酰基-CoA转化为己-2-烯酰基-CoA。具有反式-2-烯酰基-CoA还原酶活性的多肽可将丁-2-烯酰基-CoA转化为丁酰基-CoA,并可将己-2-烯酰基-CoA转化为己酰基-CoA。参见图1和2。

在一些实施方案中,具有β-酮硫解酶活性的多肽可以在EC 2.3.1.16下分类,如bktB的基因产物(参见例如Genbank登录号AAC38322.1)。由来自钩虫贪铜菌的bktB编码的具有β-酮硫解酶活性的多肽接受丁酰基-CoA作为底物。当丁酰基-CoA是底物时,产生CoA-活化的C6脂肪族主链(3-氧代己酰基-CoA)(参见例如Haywood等人,FEMS Microbiology Letters,1988,52:91-96;Slater等人,J.Bacteriol.,1998,180(8):1979-1987)。由paaJ(参见例如Genbank登录号AAC74479.1),catF和pcaF编码的具有β-酮硫解酶活性的多肽可以分类在例如EC 2.3.1.174下。由paaJ编码的具有β-酮硫解酶活性的多肽将乙酰基-CoA和琥珀酰基-CoA缩合成3-氧代己二酰基-CoA(参见例如Fuchs等人,2011,Nature Reviews Microbiology,9,803–816;等人,2002,J.Bacteriol.,184(1),216–223)。参见图1和2。

在一些实施方案中,具有乙酰基-CoA羧化酶活性的多肽可以例如在EC 6.4.1.2下分类。在一些实施方案中,具有β-酮脂酰基-[acp]合酶活性的多肽可以分类在例如2.3.1.180下,如来自黄色葡萄球菌的FabH的基因产物(Qiu等人,2005,Protein Science,14:2087–2094)。参见图1和2。

在一些实施方案中,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA脱氢酶活性的多肽可以分类在EC 1.1.1.-下。例如,具有3-羟基酰基-CoA脱氢酶活性的多肽可以在EC 1.1.1.35下分类,如fadB的基因产物(图1);分类在EC 1.1.1.157下,如hbd的基因产物(可以称为3-羟基丁酰基-CoA脱氢酶)(图1);或归类在EC1.1.1.36下,如phaB的乙酰乙酰基-CoA还原酶基因产物(Liu&Chen,Appl.Microbiol.Biotechnol.,2007,76(5):1153–1159;Shen等人,Appl.Environ.Microbiol.,2011,77(9):2905–2915;Budde等人,J.Bacteriol.,2010,192(20):5319–5328)(图2)。

在一些实施方案中,具有3-氧代酰基-CoA还原酶活性的多肽可以分类在EC 1.1.1.100下,如fabG的基因产物(Budde等人,J.Bacteriol.,2010,192(20):5319–5328;Nomura等人,Appl.Environ.Microbiol.,2005,71(8):4297–4306)。图2。

在一些实施方案中,具有烯酰基-CoA水合酶活性的多肽可以在EC4.2.1.17下分类,例如crt的基因产物(Genbank登录号AAA95967.1)(图1)或在EC 4.2.1.119下分类,如phaJ的基因产物(Genbank登录号BAA21816.1)(图2)(Shen等人,2011,同上;Fukui等人,J.Bacteriol.,1998,180(3):667–673)。

在一些实施方案中,具有反式-2-烯酰基-CoA还原酶活性的多肽可以在EC 1.3.1.38(图2),EC 1.3.1.8(图2)或EC 1.3.1.44(图1)下分类,如ter(Genbank登录号AAW66853.1)(Nishimaki等人,J.Biochem.,1984,95:1315–1321;Shen等人,2011,同上)或tdter(Genbank登录号AAS11092.1)(Bond-Watts等人,Biochemistry,2012,51:6827–6837)的基因产物。

在C6构件块的生物合成中产生末端羧基的酶

如图4、5和7中描绘,可以使用具有硫酯酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代庚酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-氧代戊酸脱氢酶活性的多肽,具有单加氧酶活性的多肽,具有酯酶活性的多肽或具有脱甲基酶活性的多肽酶促形成末端羧基基团。

在一些实施方案中,第一末端羧基由具有归类在EC2.1.1.-下的丁香酸O-脱甲基酶活性的多肽,如ligM(参见GenBank登录号BAD61059.1;SEQ ID NO:30)或desA(GenBank登录号BAC79257.1;SEQ ID NO:31)的基因产物或具有在EC 3.1.1.-下分类的酯酶活性的多肽,如EstC的基因产物(参见例如GenBank登录号AAC60471.2,SEQ ID NO:26)酶促形成。参见例如图7。

在一些实施方案中,第一末端羧基由具有例如在EC 1.2.1.3或EC 1.2.1.4下分类的醛脱氢酶活性的多肽酶促形成。

在一些实施方案中,导致合成己二酸的第二末端羧基由具有例如在EC 1.2.1.3下分类的醛脱氢酶活性的多肽酶促形成(参见Guerrillot&Vandecasteele,Eur.J.Biochem.,1977,81,185–192)。参见图4。

在一些实施方案中,导致合成己二酸的第二末端羧基由具有归类在EC 1.2.1.-下的具有脱氢酶活性的多肽酶促形成,如具有5-氧代戊酸脱氢酶活性的多肽(例如,CpnE的基因产物),具有6-氧代己酸脱氢酶活性的多肽(例如,来自不动杆菌属物种的ChnE的基因产物),具有7-氧代庚酸脱氢酶活性的多肽(例如来自Sphingomonas macrogolitabida的ThnG的基因产物)(Iwaki等人,Appl.Environ.Microbiol.,1999,65(11),5158–5162;López-Sánchez等人,Appl.Environ.Microbiol.,2010,76(1),110-118)。例如,具有5-氧代戊酸脱氢酶活性的多肽可以在EC 1.2.1.20下分类。例如,具有6-氧代己酸脱氢酶活性的多肽可以在EC 1.2.1.63下分类。例如,具有7-氧代庚酸脱氢酶活性的多肽可以在EC 1.2.1.-下分类。参见图4。

在一些实施方案中,导致合成己二酸的第二末端羧基通过在细胞色素P450家族中具有单加氧酶活性的多肽如CYP4F3B酶促形成(参见例如Sanders等人,J.Lipid Research,2005,46(5):1001-1008;Sanders等人,The FASEB Journal,2008,22(6):2064–2071)。参见图4。

ω-氧化在将羧基引入到烷中的用途已经在酵母热带假丝酵母(Candida tropicalis)中证实,导致己二酸的合成(Okuhara等人,Agr.Biol.Chem.,1971,35(9),1376–1380)。

在C6构件块的生物合成中产生末端胺基团的酶

如图5和图6中描绘,可以使用具有ω-转氨酶活性的多肽或具有脱乙酰酶活性的多肽来酶促形成末端胺基。

在一些实施方案中,导致6-氨基己酸,6-氨基己醛或6-氨基己醇的合成的第一末端胺基团由分类在例如EC 2.6.1.-下的ω-转氨酶酶促形成,如EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82,如获自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(Genbank登录号ABA81135.1,SEQ ID NO:10),河流弧菌(Genbank登录号AAA57874.1,SEQ ID NO:12),灰色链霉菌或Clostridium viride。在本文所述的方法和宿主中可以使用具有ω-转氨酶活性的另外的多肽来自大肠杆菌(Genbank登录号AAA57874.1,SEQ ID NO:11)。例如具有在EC 2.6.1.29或EC 2.6.1.82下分类的ω-转氨酶活性的一些多肽是具有二胺ω-转氨酶活性的多肽(例如,SEQ ID NO:11)。参见例如图5和6。

来自紫色色杆菌(Chromobacterium violaceum)的具有ω-转氨酶活性的可逆多肽(Genbank登录号AAQ59697.1,SEQ ID NO:7)已经证明类似的活性,其接受6-氨基己酸作为氨基供体,从而形成己二酸半醛中的第一末端胺基(Kaulmann等人,Enzyme and Microbial Technology,2007,41,628–637)。

来自灰色链霉菌的具有4-氨基丁酸:2-酮戊二酸转氨酶活性的可逆性多肽已经证明了将6-氨基己酸转化为己二酸半醛的类似活性(Yonaha等人,Eur.J.Biochem.,1985,146,101-106)。

来自Clostridium viride的具有5-氨基戊酸转氨酶活性的可逆性多肽已经证明了将6-氨基己酸转化为己二酸半醛的类似活性(Barker等人,J.Biol.Chem.,1987,262(19),8994–9003)。

在一些实施方案中,导致六亚甲基二胺合成的第二末端胺基团由具有二胺转氨酶活性的多肽酶促形成。例如,第二末端氨基可以由具有二胺转氨酶活性的多肽酶促形成,例如在EC 2.6.1.-,例如EC 2.6.1.29下分类,或例如在EC 2.6.1.82下分类,如来自大肠杆菌的YgjG的基因产物(Genbank登录号AAA57874.1,SEQ ID NO:12)。参见图6。

ygjG的基因产物接受宽范围的二胺碳链长度底物,如腐胺,尸胺和亚精胺(Samsonova等人,BMC Microbiology,2003,3:2)。

来自大肠杆菌菌株B的具有二胺转氨酶活性的多肽已经证明了对1,7二氨基庚烷的活性(Kim,The Journal of Chemistry,1964,239(3),783–786)。

在一些实施方案中,导致六亚甲基二胺合成的第二末端胺基团由具有脱乙酰酶活性的多肽酶促形成,例如在EC 3.5.1.62下分类,如具有乙酰腐胺脱乙酰酶活性的多肽。来自藤黄微球菌(Micrococcus luteus)K-11的具有乙酰腐胺脱乙酰酶活性的多肽接受宽范围的碳链长度底物,如乙酰腐胺,乙酰尸胺和N8-乙酰基精胺(参见例如Suzuki等人,1986,BBA–General Subjects,882(1):140–142)。

在C6构件块的生物合成中产生末端羟基的酶

如图8中描绘,可以使用具有醇脱氢酶活性的多肽酶促形成末端羟基。例如,导致1,6己二醇合成的第二末端羟基可以通过分类在EC 1.1.1.-(例如,EC 1.1.1.1,1.1.1.2,1.1.1.21或1.1.1.184)下的具有醇脱氢酶活性的多肽酶促形成。第一末端羟基可以用具有单加氧酶活性的多肽酶促形成,如上文关于图7中6-羟基己酸甲酯的形成所讨论的。

如图8中描绘,可以使用例如在EC 2.3.1.-(84)下分类的具有醇O-乙酰转移酶活性的多肽将己酰基-CoA转化为己酸己酯,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)。

可以使用例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的具有单加氧酶活性的多肽将己酸己酯转化为6-羟基己酸6-羟基己酯。可以使用例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的具有单加氧酶活性的多肽将己酸己酯转化为己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3家族或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物。参见图7。

可以使用例如在EC 3.1.1.-(例如EC 3.1.1.1或EC 3.1.1.6)下分类的具有酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将己酸6-羟基己酯和6-羟基己酸6-羟基己酯转化为1,6-己二醇。

生化途径

到作为C6构件块的中心前体的己酰基-CoA的途径

在一些实施方案中,如下从乙酰基-CoA合成己酰基-CoA:通过具有例如在EC 2.3.1.9下分类的β-酮硫解酶活性的多肽,如phaA或atoB的基因产物将乙酰基-CoA转化为3-氧代丁酰基-CoA;然后通过具有例如在EC 1.1.1.35下分类(如fadB的基因产物)或在例如EC 1.1.1.157下分类(如hbd的基因产物)的3-羟基酰基-CoA脱氢酶活性的多肽将3-氧代丁酰基-CoA转化为(S)3-羟基丁酰基-CoA;然后通过例如在EC 4.2.1.17下分类的具有烯酰基-CoA水合酶活性的多肽,如crt的基因产物(Genbank登录号AAA95967.1)将(S)3-羟基丁酰基-CoA转化为丁-2-烯酰基-CoA;然后通过具有例如在EC 1.3.1.44下分类的反式-2-烯酰基-CoA还原酶活性的多肽,如ter(Genbank登录号AAW66853.1)或tdter(Genbank登录号AAS11092.1)的基因产物将丁-2-烯酰基-CoA转化为丁酰基-CoA;然后通过具有例如在EC 2.3.1.16下分类的(如bktB的基因产物(Genbank登录号AAC38322.1))或在例如EC 2.3.1.174下分类的(如paaJ的基因产物(Genbank登录号AAC74479.1))的β-酮硫解酶活性的多肽将丁酰基-CoA转化为3-氧代-己酰基-CoA;然后通过具有例如在EC 1.1.1.35下分类的3-羟基酰基-CoA脱氢酶活性的多肽,如fadB的基因产物或通过具有例如在EC 1.1.1.157下分类的3-羟基酰基-CoA脱氢酶活性的多肽,如hbd的基因产物将3-氧代-己酰基-CoA转化为(S)3-羟基己酰基-CoA;然后通过具有例如在EC 4.2.1.17下分类的烯酰基-CoA水合酶活性的多肽,如crt的基因产物(Genbank登录号AAA95967.1)将(S)3-羟基己酰基-CoA转化为己-2-烯酰基-CoA;随后通过具有例如在EC 1.3.1.44下分类的反式-2-烯酰基-CoA还原酶活性的多肽,如ter(Genbank登录号AAW66853.1)或tdter(Genbank登录号AAS11092.1)的基因产物将己-2-烯酰基-CoA转化为己酰基-CoA。参见图1。

在一些实施方案中,如下从中心代谢物乙酰基-CoA合成己酰基-CoA:通过具有例如在EC 2.3.1.9下分类的β-酮硫解酶活性的多肽,如phaA或atoB的基因产物将乙酰基-CoA转化为3-氧代丁酰基-CoA;然后通过具有例如在EC1.1.1.1.100下分类的3-氧代酰基-CoA还原酶活性的多肽(如fadG的基因产物)或通过具有例如在EC 1.1.1.36下分类的乙酰乙酰基-CoA还原酶活性的多肽,如phaB的基因产物将3-氧代丁酰基-CoA转化为(R)3-羟基丁酰基-CoA;然后通过具有例如在EC 4.2.1.119下分类的烯酰基-CoA水合酶活性的多肽,如phaJ的基因产物(Genbank登录号BAA21816.1)将(R)3-羟基丁酰基-CoA转化为丁-2-烯酰基-CoA;然后通过具有例如在EC 1.3.1.38下分类的反式-2-烯酰基-CoA还原酶活性的多肽或具有在例如EC 1.3.1.8下分类的酰基CoA脱氢酶活性的多肽将丁-2烯酰基-CoA转化为丁烯酰基-CoA;然后通过具有例如在EC 2.3.1.16下分类(如bktB的基因产物(Genbank登录号AAC38322.1))或在例如EC 2.3.1.174下分类(如paaJ的基因产物(Genbank登录号AAC74479.1))的β-酮硫解酶活性的多肽将丁酰基-CoA转化为3-氧代-己酰基-CoA;然后通过具有例如在EC 1.1.1.100下分类的3-氧代酰基-CoA还原酶活性的多肽,如fabG的基因产物将3-氧代-己酰基-CoA转化为(R)3-羟基己酰基-CoA;然后通过具有例如在EC 4.2.1.119下分类的烯酰基-CoA水合酶活性的多肽,如phaJ的基因产物(Genbank登录号BAA21816.1)将(R)3-羟基己酰基-CoA转化为己-2-烯酰基-CoA;然后通过具有例如在EC 1.3.1.38下分类的反式-2-烯酰基-CoA还原酶活性的多肽或在具有例如EC 1.3.1.8下分类的酰基-CoA脱氢酶活性的多肽将己-2-烯酰基-CoA转化为己酰基-CoA。参见图2。

在一些实施方案中,可以从乙酰基-CoA合成3-氧代丁酰基-CoA。可以使用具有例如在EC 6.4.1.2下分类的乙酰基-CoA羧化酶活性的多肽将乙酰基-CoA转化为丙二酰基-CoA,其可以使用具有例如在EC 2.3.1.194下分类的乙酰乙酰基-CoA合酶活性的多肽,如fabH的基因产物转化为3-氧代丁酰基-CoA。参见图1和图2。

使用己酰基-CoA产生中心前体己酸的途径

在一些实施方案中,通过具有例如在EC 3.1.2.-下分类的硫酯酶活性的多肽,如YciA,tesB,Acot13基因产物,短乳杆菌酰基-[acp]硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌酰基-[acp]硫酯酶(GenBank登录号CCC78182.1,SEQ ID NO:33)将己酰基-CoA转化为己酸从己酰基-CoA合成己酸。参见图3。

在一些实施方案中,通过具有例如在EC 1.2.1.57(参见例如GenBank登录号AAD39015,SEQ ID NO:29)或EC 1.2.1.10下分类的丁醛脱氢酶活性的多肽或PduP或PduB的基因产物将己酰基-CoA转化为己醛;然后通过具有例如在EC 1.2.1.4或EC 1.2.1.3下分类的醛脱氢酶活性的多肽将己醛转化为己酸。参见图3。

已经使用NADH和NADPH作为辅因子证明己酰基-CoA至己醛的转化(参见Palosaari and Rogers,J.Bacteriol.,1988,170(7):2971–2976)。

使用己酰基-CoA产生中心前体己醇的途径

在一些实施方案中,如下从己酰基-CoA合成己酸:通过具有例如在EC 3.1.2.-下分类的硫酯酶活性的多肽,如YciA,tesB或Acot13的基因产物,乳杆菌[acp]硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌酰基-[acp]硫酯酶(GenBank登录号CCC78182.1,SEQ ID NO:33)将己酰基-CoA转化为己酸;然后通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如通过sfp的基因产物增强的car的基因产物将己酸转化成己醛;然后通过具有例如在EC 1.1.1.-如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(参见例如Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;或Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白质(来自嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus))将己醛转化为己醇。参见图3。

在一些实施方案中,通过具有例如在EC 1.2.1.57(参见例如GenBank登录号BAD61059.1,SEQ ID NO:30)下分类的丁醛脱氢酶活性的多肽将己酰CoA转化为己醛;然后通过具有例如在EC 1.1.1.-,如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(参见例如Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;或Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612的蛋白质(来自嗜热脂肪土芽孢杆菌)将己醛转化为己醇。参见图3。

使用己酸或己酰基-CoA作为中心前体到6-羟基己酸的的途径

在一些实施方案中,如下从中心前体己酸合成6-羟基己酸:通过使用具有例如在EC 2.1.1.15下分类的脂肪酸O-甲基转移酶活性的多肽(例如,来自海分枝杆菌(GenBank登录号ACC41782.1,SEQ ID NO:22),耻垢分枝杆菌(参见GenBank登录号ABK73223.1,SEQ ID NO:23)或恶臭假单胞菌(参见GenBank登录号CAA39234.1,SEQ ID NO:24)的脂肪酸O-甲基转移酶)将己酸转化成己酸甲酯;然后使用具有例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的单加氧酶活性的多肽,如具有CYP153A,CYP52A3家族或alkB家族中单加氧酶活性的多肽转化为6-羟基己酸甲酯;然后使用具有在EC 2.1.1.-下分类的丁香酸O-脱甲基酶活性的多肽,如ligM(参见GenBank登录号BAD61059.1;SEQ ID NO:30)或desA(GenBank登录号BAC79257.1;SEQ ID NO:31)的基因产物或使用具有在EC 3.1.1.-下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)(Kim等人,1994,Biosci.Biotech.Biochem,58(1),111-116)转化为6-羟基己酸。

在一些实施方案中,可以通过具有单加氧酶活性的多肽(分类在例如EC 1.14.14.-或EC 1.14.15.-下(例如,EC 1.14.15.1或EC 1.14.15.3),如CYP153A,CYP52A3家族或/和alkB家族中的单加氧酶)将己酸酶促转化为6-羟基己酸。

在一些实施方案中,可以使用具有例如在EC 2.3.1.-(84)下分类的醇O-乙酰转移酶活性的多肽,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)将己酰基-CoA转化成己酸己酯;然后使用具有例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的单加氧酶活性的多肽转化为6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3家族(Genbank登录号:BAA00371.1,SEQ ID NO:28)或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(Genbank登录号:CAB51047.1,SEQ ID NO:27);然后使用具有例如在EC 3.1.1.-(1,6)下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)(Kim等人,1994,Biosci.Biotech.Biochem,58(1),111-116)将6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯转化为6-羟基己酸。参见图7。

使用6-羟基己酸作为中心前体到己二酸的途径

可以通过将6-羟基己酸酶促转化为己二酸半醛合成己二酸半醛,其使用例如在EC 1.1.1.-下分类的具有醇脱氢酶活性的多肽,如YMR318C的基因产物(分类在例如EC 1.1.1.2下,参见GenBank登录号CAA90836.1)(Larroy等人,2002,Biochem J.,361(Pt 1),163–172),cpnD(Iwaki等人,2002,Appl.Environ.Microbiol.,68(11):5671–5684)或gabD(Lütke-Eversloh&Steinbüchel,1999,FEMS Microbiology Letters,181(1):63–71),例如在EC 1.1.1.258下分类的具有6-羟基己酸脱氢酶活性的多肽,如ChnD的基因产物(Iwaki等人,Appl.Environ.Microbiol.,1999,65(11):5158-5162),或具有细胞色素P450活性的多肽(Sanders等人,J.Lipid Research,2005,46(5),1001-1008;Sanders等人,The FASEB Journal,2008,22(6),2064–2071)。参见图4。由YMR318C编码的具有醇脱氢酶活性的多肽具有广泛的底物特异性,包括C6醇的氧化。

可以使用具有例如在EC 1.2.1.-(3、16、20、63、79)下分类的醛脱氢酶活性的多肽,如具有7-氧代庚酸脱氢酶活性的多肽(例如,ThnG的基因产物),具有6-氧代己酸脱氢酶活性的多肽(例如ChnE的基因产物)将己二酸半醛酶促转化为己二酸。参见图4。

使用6-羟基己酸作为中心前体到6-氨基己酸的途径

在一些实施方案中,如下从6-羟基己酸合成6-氨基己酸:通过使用具有例如在EC 1.1.1下分类的醇脱氢酶活性的多肽,如YMR318C的基因产物(分类在例如EC 1.1.1.2下,参见GenBank登录号CAA90836.1)(Larroy等人,2002,Biochem J.,361(Pt 1),163–172),cpnD(Iwaki等人,2002,Appl.Environ.Microbiol.,68(11):5671–5684)或gabD(Lütke-Eversloh&Steinbüchel,1999,FEMS Microbiology Letters,181(1):63–71)或分类在例如EC 1.1.1.258下的6-羟基己酸脱氢酶,如ChnD的基因产物(Iwaki等人,Appl.Environ.Microbiol.,1999,65(11):5158-5162)将6-羟基己酸转化为己二酸半醛;然后通过具有例如在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48,EC 2.6.1.82下分类的ω-转氨酶活性的多肽转化为6-氨基己酸,例如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图5。

使用6-氨基己酸,6-羟基己酸或己二酸半醛作为中心前体到六亚甲基二胺的的途径

在一些实施方案中,如下从中心前体6-氨基己酸合成六亚甲基二胺:通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如car的基因产物,与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因或来自诺卡氏菌的npt基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将6-氨基己酸转化为6-氨基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽将6-氨基己醛转化为六亚甲基二胺,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图6。

由car的基因产物编码的具有羧酸还原酶活性的多肽和增强剂npt或sfp具有广泛的底物特异性,包括末端双官能的C4和C5羧酸(Venkitasubramanian等人,Enzyme and Microbial Technology,2008,42,130–137)。

在一些实施方案中,如下从中心前体6-羟基己酸(其可以如图7所述制备)合成六亚甲基二胺:通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如来自海分枝杆菌(Genbank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌(Genbank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus(Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(Genbank登录号EIV11143.1,SEQ ID NO:5)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将6-羟基己酸转化为6-羟基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)将6-氧代己醇转化为6-氨基己醇;然后通过具有例如在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184)下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白转化为6-氨基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽转化为六亚甲基二胺,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图6。

在一些实施方案中,如下从中心前体6-氨基己酸合成六亚甲基二胺:通过具有N-乙酰基转移酶活性的多肽,如具有归类于例如EC 2.3.1.32下的赖氨酸N-乙酰转移酶活性的多肽将6-氨基己酸转化成N6-乙酰基-6-氨基己酸;然后通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如来自Segniliparus rugosus(Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(Genbank登录号EIV11143.1,SEQ ID NO:5)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,转化为N6-乙酰基-6-氨基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48,或EC 2.6.1.82下分类的ω-转氨酶活性的多肽,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)转化为N6-乙酰基-1,6-二氨基己烷;然后通过具有例如在EC 3.5.1.17或EC 3.5.1.62下分类的乙酰腐胺脱乙酰基酶活性的多肽转化为六亚甲基二胺。参见图6。

在一些实施方案中,如下从中心前体己二酸半醛合成六亚甲基二胺:通过具有例如在EC 1.2.99.6下分类的羧酸还原活性的多肽,如来自Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将己二酸半醛转化为己二醛;然后通过具有例如在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽转化为6-氨基己醛;然后通过例如在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的活性ω-转氨酶如SEQ ID NO:7-12转化为六亚甲基二胺。参见图6。

在一些实施方案中,如下从中心前体1,6-己二醇合成六亚甲基二胺:通过具有例如在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21,或EC1.1.1.184)下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)的基因产物或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白将1,6-己二醇转化为6-羟基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)将6-氧代己醛转化为6-氨基己醇;然后通过具有例如在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184)下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白将6-氧代己醛转化为6-氨基己醛;随后转化为六亚甲基二胺,例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图6。

使用6-羟基己酸和己酰基-CoA作为中心前体到1,6-己二醇的途径

在一些实施方案中,如下从中心前体6-羟基己酸合成1,6己二醇:通过具有例如在EC 1.2.99.6下分类的羧酸还原活性的多肽如来自海分枝杆菌(Genbank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌(Genbank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus(Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(Genbank登录号EIV11143.1,SEQ ID NO:5)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将6-羟基己酸转化为6-羟基己醛;然后通过具有例如在EC 1.1.1.-如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(参见例如Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;或Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白质(来自嗜热脂肪土芽孢杆菌)将7-羟基己醛转化为1,6己二醇。参见图8。

在一些实施方案中,可以使用具有例如在EC 2.3.1.-(84)下分类的醇O-乙酰转移酶活性的多肽,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)将己酰基-CoA转化成己酸己酯;然后使用在具有例如EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的单加氧酶活性的多肽转化为己酸6-羟基己酯和/或6-羟基己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3(Genbank登录号:BAA00371.1,SEQ ID NO:28)家族或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(Genbank登录号:CAB51047.1,SEQ ID NO:27);然后使用具有例如在EC 3.1.1.-(1,6)下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将己酸6-羟基己酯和/或6-羟基己酸6-羟基己酯转化为1,6-己二醇。参见图8。

培养策略

在一些实施方案中,培养策略需要实现需氧、厌氧、微需氧、或混合氧/反硝化培养条件。体外表征为氧敏感性的酶需要维持极低溶解氧浓度的微需氧培养策略(参见例如,Chayabatra&Lu-Kwang,Appl.Environ.Microbiol.,2000,66(2),493 0 498;Wilson and Bouwer,1997,Journal of Industrial Microbiology and Biotechnology,18(2-3),116-130)。

在一些实施方案中,培养策略需要营养限制,如氮,磷酸盐或氧限制。

在一些实施方案中,可以利用除了氧以外的最终电子受体诸如硝酸盐。在一些实施方案中,可以采用使用例如陶瓷膜的细胞保留策略来实现并维持补料分批或连续发酵期间的高细胞密度。

在一些实施方案中,在一种或多种C6构件块合成中对发酵补料的主要碳源可以源自生物或非生物原料。

在一些实施方案中,所述生物原料可以是或可以源自单糖,二糖,木质纤维素、半纤维素、纤维素、木质素、乙酰丙酸和甲酸、甘油三酯、甘油、脂肪酸、农业废物、浓缩酒糟(condensed distillers'solubles)或城市废物。

已经在几种微生物(诸如大肠杆菌、钩虫贪铜菌、食油假单胞菌、恶臭假单胞菌和解脂耶罗维亚酵母)中证明了源自生物柴油生产的粗制甘油的有效分解代谢(Lee等人,Appl.Biochem.Biotechnol.,2012,166:1801–1813;Yang等人,Biotechnology for Biofuels,2012,5:13;Meijnen等人,Appl.Microbiol.Biotechnol.,2011,90:885-893)。

已经在几种生物体(诸如钩虫贪铜菌和恶臭假单胞菌)中证明了在经由前体丙酰基-CoA的3-羟基戊酸的合成中对木质纤维素衍生的乙酰丙酸的有效分解代谢(Jaremko and Yu,2011,见上文;Martin and Prather,J.Biotechnol.,2009,139:61–67)。

已经在几种微生物(诸如恶臭假单胞菌、钩虫贪铜菌)中证明了木质素衍生的芳香族化合物诸如苯甲酸类似物的有效分解代谢(Bugg等人,Current Opinion in Biotechnology,2011,22,394–400;Pérez-Pantoja等人,FEMS Microbiol.Rev.,2008,32,736–794)。

已经在几种微生物(包括解脂耶罗维亚酵母)中证明了农业废物(诸如橄榄磨坊废水)的有效利用(Papanikolaou等人,Bioresour.Technol.,2008,99(7):2419-2428)。

已经针对几种微生物(诸如大肠杆菌、谷氨酸棒状杆菌和德氏乳杆菌和乳酸乳球菌)证明了可发酵糖类(诸如源自纤维素、半纤维素、甘蔗和甜菜糖蜜、木薯、玉米和其它农业来源的单糖和二糖)的有效利用(参见,例如Hermann et al,J.Biotechnol.,2003,104:155–172;Wee等人,Food Technol.Biotechnol.,2006,44(2):163–172;Ohashi等人,J.Bioscience and Bioengineering,1999,87(5):647-654)。

已经针对钩虫贪铜菌证明了源自多种农业木质纤维素来源的糠醛的有效利用(Li等人,Biodegradation,2011,22:1215–1225)。

在一些实施方案中,所述非生物原料可以是或可以源自天然气、合成气、CO2/H2、甲醇、乙醇、苯甲酸盐、非挥发性残留物(NVR)或来自环己烷氧化过程的碱洗液(caustic wash)废物流、或对苯二甲酸/异酞酸混合物废物流。

已经针对甲基营养型酵母巴斯德毕赤酵母证明了甲醇的有效分解代谢。

已经针对克鲁佛梭菌证明了乙醇的有效分解代谢(Seedorf等人,Proc.Natl.Acad.Sci.USA,2008,105(6)2128-2133)。

已经针对钩虫贪铜菌证明了CO2和H2(其可以源自天然气和其它化学和石油化学来源)的有效分解代谢(Prybylski等人,Energy,Sustainability and Society,2012,2:11)。

已经针对多种微生物(诸如杨氏梭菌和自产乙醇梭菌)证明了合成气的有效分解代谢(等人,Applied and Environmental Microbiology,2011,77(15):5467–5475)。

已经针对多种微生物(诸如食酸代尔夫特菌和钩虫贪铜菌)证明了来自环己烷过程的非挥发性残留物废物流的有效分解代谢(Ramsay等人,Applied and Environmental Microbiology,1986,52(1):152–156)。

在一些实施方案中,所述宿主微生物是原核生物。例如,所述原核生物可以是细菌,来自埃希氏菌属(Escherichia)如大肠杆菌(Escherichia coli);来自梭菌属(Clostridia)如杨氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)或者克鲁佛梭菌(Clostridium kluyveri);来自棒状杆菌属(Corynebacteria)如谷氨酸棒状杆菌(Corynebacterium glutamicum);来自贪铜菌属(Cupriavidus)如钩虫贪铜菌(Cupriavidus necator)或者耐金属贪铜菌(Cupriavidus metallidurans);来自假单胞菌属(Pseudomonas)如荧光假单胞菌(Pseudomonas fluorescens)、恶臭假单胞菌(Pseudomonas putida)或者食油假单胞菌(Pseudomonas oleavorans);来自代尔夫特菌属(Delftia),如食酸代尔夫特菌(Delftia acidovorans);来自芽孢杆菌属(Bacillus)如枯草芽胞杆菌(Bacillus subtillis);来自乳杆菌属(Lactobacillus)如德氏乳杆菌(Lactobacillus delbrueckii);或者来自乳球菌属(Lactococcus)如乳酸乳球菌(Lactococcus lactis)。该原核生物还可以是基因的来源以构建本文中所述的能够生成一种或多种C6构件块的重组宿主细胞。

在一些实施方案中,宿主微生物是真核生物。例如,真核生物可以丝状真菌,例如来自曲霉属(Aspergillus)如黑曲霉(Aspergillus niger)。或者,真核生物可以是酵母,例如来自酵母属(Saccharomyces)如酿酒酵母(Saccharomyces cerevisiae);来自毕赤氏酵属(Pichia)如巴斯德毕赤酵母(Pichia pastoris);或来自耶罗维亚酵母属(Yarrowia)如解脂耶罗维亚酵母(Yarrowia lipolytica);来自伊萨酵母属(Issatchenkia)如东方伊萨酵母(Issathenkia orientalis);来自德巴利酵母属(Debaryomyces)如汉逊德巴利酵母(Debaryomyces hansenii);来自Arxula属如Arxula adenoinivorans;或者来自克鲁维酵母菌属(Kluyveromyces)如乳酸克鲁维酵母菌(Kluyveromyces lactis)。该真核生物还可以是基因的来源以构建本文中所述的能够生成一种或多种C6构件块的重组宿主。

代谢工程

本文件提供方法,所述方法涉及少于针对所有上述途径描述的所有步骤的步骤。这种方法可涉及例如此类步骤中的1、2、3、4、5、6、7、8、9、10、11、12或者更多个。在这种方法包含少于所有步骤的情况下,第一个,且在一些实施方案中唯一的步骤可为所列步骤中的任何步骤。

此外,本文中描述的重组宿主可以包括上述酶中的任何组合,使得所述步骤中的一个或者多个,例如此类步骤中的1、2、3、4、5、6、7、8、9、10或者更多个可以在重组宿主内实施。本文件提供所列出的和遗传工程化以表达本文件中列举的任何酶的一种或者多种(例如,2、3、4、5、6、7、8、9、10、11、12或者更多种)重组形式的任何属和种的宿主细胞。如此,例如,宿主细胞可含有外源核酸,其编码催化本文中描述的任何途径的一个或者多个步骤的酶。

另外,本文件认识到,在酶已经被描述为接受CoA活化的底物的情况下,存在与[acp]结合底物相关的相似的酶活性,其不一定为相同的酶种类。

此外,本文件认识到,在酶已经被描述为接受底物的(R)-对映异构体的情况下,存在与底物的(S)-对映异构体相关的相似的酶活性,其不一定为相同的酶种类。

本文件还认识到,在已经显示酶接受特定辅因子如NADPH或者共底物如乙酰基-CoA的情况下,许多酶在催化特定酶活性中在接受大量不同辅因子或者共底物方面是泛宿主性的(promiscuous)。此外,本文件认识到,在酶对例如特定辅助因子如NADH具有高特异性的情况下,对辅助因子NADPH具有高特异性的具有相似或者相同活性的酶可为不同的酶种类。此外,需要特定辅因子的途径中的酶可以用对不同辅因子具有相似或相同活性和特异性的酶替代。例如,使用对NADH具有特异性的酶的途径中的一个或多个步骤可以用对NADPH具有相似或相同活性和特异性的酶替代。类似地,使用对NADPH具有特异性的酶的途径中的一个或多个步骤可以用对NADH具有相似或相同活性和特异性的酶替代。

在一些实施方案中,本文中概述的途径中的酶是经由非直接或者合理酶设计方法的酶工程的结果,目的在于改善活性、改善特异性、降低反馈抑制、降低阻抑、改善酶溶解度、改变立体特异性,或者改变辅因子特异性。

在一些实施方案中,可以经由附加型或者染色体整合方法将本文概述的途径中的酶基因投入(gene dose)至所得的遗传修饰的生物体中(即,过表达)。

在一些实施方案中,可以利用基因组级别(genome-scale)系统生物学技术如通量平衡分析(Flux Balance Analysis)来设计用于将碳流量引导至C6构件块的基因组级别的减弱或者敲除策略。

减弱策略包括但不限于使用转座子、同源重组(双交叉方法)、诱变、酶抑制剂和RNAi干扰。

在一些实施方案中,可以利用通量组(fluxomic)、代谢物组(metabolomic)和转录物组(transcriptomal)数据来告知或者支持基因组级别的系统生物学技术,由此在将碳流量导向C6构件块的过程中设计基因组级别的减弱或者敲除策略。

在一些实施方案中,可以经由在选择性环境中的连续培养改善宿主微生物对高浓度的C6构件块的耐受性。

在一些实施方案中,可以减弱或提升宿主微生物的内源生物化学网络以(1)确保乙酰基-CoA的胞内利用度,(2)创建NADH或NADPH不平衡,其可以经由一种或多种C6构件块的形成平衡,(3)阻止导致并且包含一种或多种C6构件块的中心代谢物,中心前体的降解和/或(4)确保从细胞的有效流出。

在需要乙酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以在宿主生物体中减弱催化丙酰基-CoA和乙酰基-CoA水解的内源酶,如具有硫酯酶活性的短链多肽。

在需要乙酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱具有产生乙酸的磷酸转乙酰酶活性的内源多肽,如pta(Shen等人,Appl.Environ.Microbiol.,2011,77(9):2905–2915)。

在需要乙酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱在乙酸合成途径中编码具有乙酸激酶活性的多肽的的内源基因,如ack。

在需要乙酰基-CoA和NADH的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱编码催化丙酮酸降解为乳酸的酶(如由ldhA编码的具有乳酸脱氢酶活性的多肽)的内源基因(Shen等人,2011,同上)。

在需要乙酰基-CoA和NADH的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱编码催化磷酸烯醇丙酮酸降解为琥珀酸的酶,如具有menaquinol-延胡索酸氧化还原酶活性的多肽的内源基因,如frdBC(参见例如Shen等人,2011,同上)。

在需要乙酰基-CoA和NADH的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱编码催化乙酰CoA降解为乙醇的酶的内源基因,如由adhE编码的具有醇脱氢酶活性的多肽(Shen等人,2011,同上)。

在一些实施方案中,其中途径需要过量NADH辅因子用于C6构件块合成,可以在宿主生物中过表达具有甲酸脱氢酶活性基因的重组多肽(Shen等人,2011,同上)。

在一些实施方案中,其中途径需要过量的NADH或NADPH辅因子用于C6构件块合成,可以减弱具有消散辅因子不平衡的转氢酶活性的多肽。

在一些实施方案中,可以减弱编码催化丙酮酸降解为乙醇的酶的内源基因,如具有丙酮酸脱羧酶活性的多肽。

在一些实施方案中,可以减弱编码催化异丁醇生成的酶的内源基因,如具有2-酮酸脱羧酶活性的多肽。

在需要乙酰CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以在微生物中过表达具有乙酰CoA合成酶活性的重组多肽如acs的基因产物(Satoh等人,J.Bioscience and Bioengineering,2003,95(4):335–341)。

在一些实施方案中,可以通过减弱具有葡萄糖-6-磷酸异构酶活性(EC5.3.1.9)的内源多肽将碳流量定向到丁糖(butose)磷酸循环中以提高NADPH的供应。

在一些实施方案中,可以通过过表达具有6-磷酸葡萄糖酸脱氢酶活性的多肽和/或具有转酮醇酶活性的多肽将碳流量重定向到戊糖磷酸循环中以提高NADPH的供应(Lee等人,2003,Biotechnology Progress,19(5),1444–1449)。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达基因诸如编码具有吡啶核苷酸转氢酶活性的多肽的UdhA(Brigham等人,Advanced Biofuels and Bioproducts,2012,Chapter 39,1065-1090)。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有甘油醛-3-磷酸-脱氢酶活性基因诸如GapN的重组多肽(Brigham等人,2012,见上文)。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况中,可以在宿主生物体中过表达重组苹果酸酶(苹果酸酶)基因诸如maeA或maeB(Brigham等人,2012,见上文)。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有葡萄糖-6-磷酸脱氢酶活性基因诸如zwf的重组多肽(Lim等人,J.Bioscience and Bioengineering,2002,93(6),543-549)。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有果糖1,6二磷酸酶活性诸如fbp的重组多肽(Becker等人,J.Biotechnol.,2007,132:99-109)。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以减弱具有丙糖磷酸异构酶活性(EC 5.3.1.1)的内源多肽。

在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有葡萄糖脱氢酶活性的重组多肽诸如gdh的基因产物(Satoh等人,J.Bioscience and Bioengineering,2003,95(4):335–341)。

在一些实施方案中,可以减弱促进NADPH转化成NADH的内源酶,所述转化诸如NADH产生循环,其可以经由具有EC 1.4.1.2(NADH-特异性)和EC 1.4.1.4(NADPH-特异性)下分类的谷氨酸脱氢酶活性的多肽的互变产生。

在一些实施方案中,可以减弱利用NADH和NADPH两者作为辅因子的具有谷氨酸脱氢酶活性(EC 1.4.1.3)的内源多肽。

在一些实施方案中,可以通过仅表达胞质域而不是锚定P450到内质网的N端区域溶解具有细胞色素P450活性如CYP4F3B的膜结合多肽(参见例如Scheller等人,J.Biol.Chem.,1994,269(17):12779-12783)。

在一些实施方案中,可以通过作为与小的可溶性蛋白如麦芽糖结合蛋白的融合蛋白的表达溶解具有烯酰CoA还原酶活性的膜结合多肽(Gloerich等人,FEBS Letters,2006,580,2092–2096)。

在使用天然累积聚羟基链烷酸的宿主的一些实施方案中,可以在宿主菌株中减弱具有聚羟基链烷酸合酶活性的内源多肽。

在需要丁酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以在微生物中过表达具有丙酰CoA合成酶活性的重组多肽如PrpE-RS的基因产物(Rajashekhara&Watanabe,FEBS Letters,2004,556:143–147)。

在一些实施方案中,可以在宿主中过表达具有L-丙氨酸脱氢酶活性的多肽以从作为氨基供体的丙酮酸再生L-丙氨酸用于ω-转氨酶反应。

在一些实施方案中,可以在宿主中过表达具有L-谷氨酸脱氢酶活性的多肽,具有L-谷氨酰胺合成酶活性的多肽或具有谷氨酸合酶活性的多肽,以从2-酮戊二酸作为氨基供体再生L-谷氨酸用于ω-转氨酶反应。

在一些实施方案中,可以减弱酶如具有分类在EC 1.3.1.62下的庚二酰CoA脱氢酶活性的多肽;例如具有在EC 1.3.8.7或EC 1.3.8.1下分类的酰基-CoA脱氢酶活性的多肽;和/或例如具有在EC 1.3.8.6下分类的戊二酰基-CoA脱氢酶活性的多肽,其降解导致并包括C6构件块的中心代谢物和中心前体。

在一些实施方案中,可以减弱经由CoA酯化活化C6构件块的内源酶,诸如例如,具有EC 6.2.1.14下分类的CoA-连接酶活性的多肽(例如庚二酰基-CoA合成酶)。

在一些实施方案中,可以通过对细胞膜遗传工程化结构修饰或提高C6构件块的任何关联转运蛋白活性增强或放大C5构件块穿过细胞膜到胞外培养基的流出。

可以通过过表达宽底物范围多药物转运蛋白,诸如来自枯草芽孢杆菌的Blt(Woolridge等人,1997,J.Biol.Chem.,272(14):8864–8866);来自大肠杆菌的AcrB和AcrD(Elkins&Nikaido,2002,J.Bacteriol.,184(23),6490–6499),来自金黄色葡萄球菌(Staphylococcus aereus)的NorA(Ng等人,1994,Antimicrob Agents Chemother,38(6),1345–1355),或来自枯草芽孢杆菌的Bmr(Neyfakh,1992,Antimicrob Agents Chemother,36(2),484–485)增强或放大六亚甲基二胺的流出。

可以通过过表达溶质转运蛋白诸如来自谷氨酸棒杆菌(Corynebacterium glutamicum)的lysE转运蛋白增强或放大5-氨基己酸和六亚甲基二胺的流出(Bellmann等人,2001,Microbiology,147,1765–1774)。

通过过表达二羧酸转运蛋白诸如来自谷氨酸棒杆菌的SucE转运蛋白增强或放大己二酸的流出(Huhn等人,Appl.Microbiol.&Biotech.,89(2),327–335)。

使用重组宿主生产C6构件块

通常,可以通过提供宿主微生物,并且用含有如上文描述的合适的碳源的培养基培养提供的微生物生成一种或多种C6构件块。一般地,培养基和/或培养可以使得微生物生长到足够的密度并且有效产生C6构件块。对于大规模生产过程,可以使用任何方法,诸如别处描述的(Manual of Industrial Microbiology and Biotechnology,2nd Edition,Editors:A.L.Demain and J.E.Davies,ASM Press;和Principles of Fermentation Technology,P.F.Stanbury and A.Whitaker,Pergamon)。简言之,用特定微生物接种含有合适的培养基的大罐(例如,100加仑、200加仑、500加仑、或更多的罐)。在接种后,培养微生物以容许产生生物量。一旦达到期望的生物量,可以将含有微生物的培养基转移到第二个罐。此第二个罐可以是任何大小。例如,第二个罐可以是较大的,较小的,或者与第一个罐相同大小的。通常,第二个罐大于第一个,使得可以对来自第一个罐的培养基添加额外的培养基。另外,此第二个罐内的培养基可以与第一个罐中使用的培养基相同或不同。

一旦转移,可以温育微生物以容许生成C6构件块。一旦生成,可以使用任何方法来分离C6构件块。例如,可以经由吸附方法从发酵液选择性回收C6构件块。在己二酸和6-氨基己酸的情况下,可以经由蒸发进一步浓缩所得的洗脱液,经由蒸发和/或冷却结晶来结晶,并且经由离心回收晶体。在六亚亚基二胺和1,6-己二醇的情况下,可以采用蒸馏实现期望的产物纯度。

本发明在以下实施例中进一步描述,实施例不限制权利要求书中描述的本发明的范围。

实施例

实施例1

使用己二酸半醛作为底物并且形成6-氨基己酸的ω-转氨酶的酶活性

将编码His标签的核苷酸序列添加至分别编码SEQ ID NO:7、8、9、10、和12的ω-转氨酶的来自紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、和河流弧菌的基因(见图9),使得可以产生N-末端有HIS标签的ω-转氨酶。将每种所得的经修饰基因克隆到pET21a表达载体中在T7启动子的控制下,并且将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。将所得重组大肠杆菌菌株在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在37℃下培养,以230rpm振荡。使用1mM IPTG于16℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒粒并经由超声处理裂解。经由离心分开细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。

在缓冲液中实施逆向(即6-氨基己酸至己二酸半醛)的酶活性测定法,所述缓冲液由终浓度为50mM HEPES缓冲液(pH=7.5)、10mM 6-氨基己酸、10mM丙酮酸和100μM吡哆(pyridoxyl)5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有6-氨基己酸的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育24小时。经由RP-HPLC量化从丙酮酸形成L-丙氨酸。

每种没有6-氨基庚酸的仅酶对照表明丙酮酸至L-丙氨酸的低基线转化。参见图16。如相对于空载体对照所确认的,SEQ ID NO 7、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的基因产物接受6-氨基己酸作为底物。见图17。

对SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的转氨酶确认正向(即己二酸半醛至6-氨基己酸)的酶反应。在缓冲液中实施酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM己二酸半醛、10mM L-丙氨酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有己二酸半醛的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化丙酮酸的形成。

如相对于空载体对照所确认的,SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的基因产物接受己二酸半醛作为底物。参见图18。确认了ω-转氨酶活性的可逆性,证明了SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的ω-转氨酶接受己二酸半醛作为底物,并且合成6-氨基己酸作为反应产物。

实施例2

羧酸还原酶使用己二酸作为底物并形成己二酸半醛的酶活性

将编码HIS标签的序列添加至分别编码SEQ ID NO:4和6的羧酸还原酶的来自Segniliparus rugosus和Segniliparus rotundus的基因(参见图9),使得可以生成N-末端有HIS标签的羧酸还原酶。将每种经修饰的基因与编码有HIS标签的来自枯草芽孢杆菌的磷酸泛酰巯基乙胺基转移酶的sfp基因一起克隆入pET Duet表达载体中,两者都在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主,并且于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养所得的重组大肠杆菌菌株。使用自诱导培养基于37℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒和经由超声处理裂解,并经由离心分离细胞碎片与上清液。使用Ni-亲和层析从上清液中纯化羧酸还原酶和磷酸泛酰巯基乙胺基转移酶,以10倍稀释入50mM HEPES缓冲液(pH=7.5)中,并经由超滤浓缩。

在缓冲液中一式三份实施酶活性测定法(即从己二酸至己二酸半醛),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM己二酸、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶基因产物或空载体对照至含有己二酸的测定缓冲液起始每个酶活性测定反应,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有己二酸的仅酶对照表明NADPH的低基线消耗。见图11。

如相对于空载体对照所确认的,SEQ ID NO 4和SEQ ID NO 6的基因产物,由sfp的基因产物增强,接受己二酸作为底物(参见图12),并且合成己二酸半醛。

实施例3

羧酸还原酶使用6-羟基己酸作为底物并形成6-羟基己醛的酶活性

将编码His标签的序列添加至分别编码SEQ ID NO:2-6的羧酸还原酶的来自海分枝杆菌、耻垢分枝杆菌、Segniliparus rugosus、马赛分枝杆菌和Segniliparus rotundus的基因(见图9),使得可以生成N-末端有HIS标签的羧酸还原酶。将每种经修饰的基因与编码有His标签的来自枯草芽孢杆菌的磷酸泛酰巯基乙胺基转移酶的sfp基因一起克隆入pET Duet表达载体中,两者都在T7启动子下。将每种表达载体与来自实施例1的表达载体一起转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养所得的每种重组大肠杆菌菌株。使用自诱导培养基于37℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液。使用Ni-亲和层析从上清液中纯化羧酸还原酶和磷酸泛酰巯基乙胺基转移酶,以10倍稀释入50mM HEPES缓冲液(pH=7.5)中,并经由超滤浓缩。

在缓冲液中一式三份实施酶活性(即从6-羟基己酸至6-羟基己醛)测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM 6-羟基己醛、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有6-羟基己酸的测定缓冲液启动每个酶活性测定反应,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有6-羟基己酸的仅酶对照表明NADPH的低基线消耗。参见图11。

如相对于空载体对照确认的,SEQ ID NO 2-6的基因产物,由sfp的基因产物增强,接受6-羟基己酸作为底物(参见图13),并合成6-羟基己醛。

实施例4

ω-转氨酶对于6-氨基己醇,形成6-氧代己醇的酶活性

将编码N-末端His标签的序列添加至分别编码SEQ ID NO:7-12的ω-转氨酶的来自紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、大肠杆菌和河流弧菌基因(参见图9),使得可以产生N-末端有HIS标签的ω-转氨酶。将经修饰基因克隆至pET21a表达载体中,在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养每种所得的重组大肠杆菌菌株。使用1mM IPTG于16℃诱导每种培养物过夜。

经由离心收获来自每种经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。

在缓冲液中实施逆向(即6-氨基己醇至6-氧代己醇)的酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM 6-氨基己醇、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有6-氨基己醇的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化L-丙氨酸形成。

每个没有6-氨基己醇的仅酶对照具有丙酮酸至L-丙氨酸的低基线转化。参见图16。

如相对于空载体对照所确认的,SEQ ID NO:7-12的基因产物接受6-氨基己醇作为底物(参见图21),并合成6-氧代己醇作为反应产物。鉴于ω-转氨酶活性的可逆性(参见实施例2),可以推断SEQ ID NO:7-12的基因产物接受6-氨基己醇作为底物,并形成6-氧代己醇。

实施例5

ω-转氨酶使用六亚甲基二胺作为底物并形成6-氨基己醛的酶活性

将编码N-末端His标签的序列添加至分别编码SEQ ID NO:7-12的ω-转氨酶的紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、大肠杆菌、和河流弧菌基因(参见图9),使得可以产生N-末端有HIS标签的ω-转氨酶。将经修饰的基因克隆至pET21a表达载体中,在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养每种所得的重组大肠杆菌菌株。使用1mM IPTG于16℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。

在缓冲液中实施逆向(即六亚甲基二胺至6-氨基己醛)的酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM六亚甲基二胺、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有六亚甲基二胺的测定缓冲液起始每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化L-丙氨酸的形成。

每个没有六亚甲基二胺的仅酶对照具有丙酮酸至L-丙氨酸的低基线转化。参见图16。

如相对于空载体对照所确认的,SEQ ID NO:7-12的基因产物接受六亚甲基二胺作为底物(参见图19),并合成6-氨基己醛作为反应产物。鉴于ω-转氨酶活性的可逆性(参见实施例2),可以推断SEQ ID NO:7-12的基因产物接受6-氨基己醛作为底物,并形成六亚甲基二胺。

实施例6

羧酸还原酶对于N6-乙酰-6-氨基己酸,形成N6-乙酰-6-氨基己醛的酶活性

一式三份在缓冲液中测定用于将N6-乙酰-6-氨基己酸转化成N6-乙酰-6-氨基己醛的N末端有His标签的SEQ ID NO:4-6的羧酸还原酶的活性(参见实施例2和3,和图9),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM N6-乙酰-6-氨基己酸、10mM MgCl2、1mM ATP、和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有N6-乙酰-6-氨基己酸的测定缓冲液起始测定,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有N6-乙酰-6-氨基己酸的仅酶对照表明NADPH的低基线消耗。参见图11。

如相对于空载体对照所确认的,SEQ ID NO 4-6的基因产物,由sfp的基因产物增强,接受N6-乙酰-6-氨基己酸作为底物(参见图14),并合成N6-乙酰-6-氨基己醛。

实施例7

ω-转氨酶使用N6-乙酰-1,6-二氨基己烷并形成N6-乙酰-6-氨基己醛的酶活性

在缓冲液中测定用于将N6-乙酰-1,6-二氨基己烷转化成N6-乙酰-6-氨基己醛的N末端有His标签的SEQ ID NO:7-12的ω-转氨酶的活性(参见实施例4,及图9),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM N6-乙酰-1,6-二氨基己烷、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶或空载体对照的无细胞提取物至含有N6-乙酰-1,6-二氨基己烷的测定缓冲液起始每个酶活性测定反应,然后在250rpm振荡的情况下于25℃温育4h。经由RP-HPLC量化L-丙氨酸的形成。

每个没有N6-乙酰-1,6-二氨基己烷的仅酶对照表明丙酮酸至L-丙氨酸的低基线转化。参见图14。

如相对于空载体对照所确认的,SEQ ID NO:7-12的基因产物接受N6-乙酰-1,6-二氨基己烷作为底物(参见图20),并合成N6-乙酰-6-氨基己醛作为反应产物。

鉴于ω-转氨酶活性的可逆性(参见实施例2),SEQ ID NO:7-12的基因产物接受N6-乙酰-6-氨基己醛作为底物,形成N6-乙酰-1,6-二氨基己烷。

实施例8:羧酸还原酶使用己二酸半醛作为底物并形成己二醛的酶活性

使用己二酸半醛作为底物测定N-末端有His标签的SEQ ID NO 6的羧酸还原酶(参见实施例2,实施例3和图9)。一式三份在缓冲液中实施酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM己二酸半醛、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有己二酸半醛的测定缓冲液起始测定,然后于室温温育20分钟。通过340nm的吸光度监测NADPH的消耗。每种没有己二酸半醛的仅酶对照表明NADPH的低基线消耗。参见图11。

如相对于空载体对照所确认的,SEQ ID NO:6的基因产物,由sfp的基因产物增强,接受己二酸半醛作为底物(参见图15),并合成己二醛。

实施例9

在形成6-羟基己酸中使用己酸作为底物的CYP153单加氧酶的酶活性

将编码HIS标签的序列添加到极胞菌属物种JS666、分枝杆菌物种HXN-1500和南非分枝杆菌基因,其分别编码(1)单加氧酶(SEQ ID NO:13–15),(2)关联的铁氧化还原蛋白还原酶配偶体(SEQ ID NO:16-17)和该物种的铁氧化还原蛋白(SEQ ID NO:18-19)。对于南非分枝杆菌单加氧酶,使用分枝杆菌物种HXN-1500氧化还原酶和铁氧化还原蛋白配偶体。将三种经修饰的蛋白质配偶体在杂合pTac启动子下克隆到pgBlue表达载体中。将每种表达载体转化到BL21[DE3]大肠杆菌宿主中。在含有50mL LB培养基和抗生素选择压力的500mL摇瓶培养物中在37℃培养每种所得的重组大肠杆菌菌株。在28℃使用1mM IPTG将每种培养物诱导24h。

经由离心收获来自每个诱导的摇瓶培养物的团粒。重悬每种团粒,并且在室温在Y-perTM溶液(ThermoScientific,Rockford,IL)中使细胞变得能透过达20分钟。在0℃在Y-perTM溶液中保持透化的细胞。

在由终浓度25mM磷酸钾缓冲液(pH=7.8),1.7mM MgSO4,2.5mM NADPH和30mM己酸组成的缓冲液中进行酶活性测定法。通过将Y-perTM溶液中悬浮的透化细胞的湿细胞重量的固定质量添加到含有庚酸的测定缓冲液启动每个酶活性测定反应,然后,在加热块摇动器中以1400rpm摇动的情况下在28℃温育24h。经由LC-MS量化7-羟基庚酸的形成。

与还原酶和铁氧化还原蛋白配偶体一起的SEQ ID NO 13-15的单加氧酶基因产物接受己酸作为底物,如相对于空载体对照确认(参见图22),并且合成6-羟基己酸作为反应产物。

其它实施方案

应当理解,虽然已经结合其详细描述描述了本发明,但是前面的描述旨在说明而不是限制由所附权利要求书的范围限定的本发明的范围。其它方面,优点和修改在所附权利要求书的范围内。

序列表

<110> 英威达技术有限责任公司

<120> 用于生物合成化合物的方法,试剂和细胞

<130> 35643-0066WO1

<150> US 62/012,666

<151> 2014-06-16

<150> US 62/012,659

<151> 2014-06-16

<150> US 62/012,604

<151> 2014-06-16

<160> 33

<170> FastSEQ for Windows Version 4.0

<210> 1

<211> 286

<212> PRT

<213> 大肠杆菌

<400> 1

Met Ser Gln Ala Leu Lys Asn Leu Leu Thr Leu Leu Asn Leu Glu Lys

1 5 10 15

Ile Glu Glu Gly Leu Phe Arg Gly Gln Ser Glu Asp Leu Gly Leu Arg

20 25 30

Gln Val Phe Gly Gly Gln Val Val Gly Gln Ala Leu Tyr Ala Ala Lys

35 40 45

Glu Thr Val Pro Glu Glu Arg Leu Val His Ser Phe His Ser Tyr Phe

50 55 60

Leu Arg Pro Gly Asp Ser Lys Lys Pro Ile Ile Tyr Asp Val Glu Thr

65 70 75 80

Leu Arg Asp Gly Asn Ser Phe Ser Ala Arg Arg Val Ala Ala Ile Gln

85 90 95

Asn Gly Lys Pro Ile Phe Tyr Met Thr Ala Ser Phe Gln Ala Pro Glu

100 105 110

Ala Gly Phe Glu His Gln Lys Thr Met Pro Ser Ala Pro Ala Pro Asp

115 120 125

Gly Leu Pro Ser Glu Thr Gln Ile Ala Gln Ser Leu Ala His Leu Leu

130 135 140

Pro Pro Val Leu Lys Asp Lys Phe Ile Cys Asp Arg Pro Leu Glu Val

145 150 155 160

Arg Pro Val Glu Phe His Asn Pro Leu Lys Gly His Val Ala Glu Pro

165 170 175

His Arg Gln Val Trp Ile Arg Ala Asn Gly Ser Val Pro Asp Asp Leu

180 185 190

Arg Val His Gln Tyr Leu Leu Gly Tyr Ala Ser Asp Leu Asn Phe Leu

195 200 205

Pro Val Ala Leu Gln Pro His Gly Ile Gly Phe Leu Glu Pro Gly Ile

210 215 220

Gln Ile Ala Thr Ile Asp His Ser Met Trp Phe His Arg Pro Phe Asn

225 230 235 240

Leu Asn Glu Trp Leu Leu Tyr Ser Val Glu Ser Thr Ser Ala Ser Ser

245 250 255

Ala Arg Gly Phe Val Arg Gly Glu Phe Tyr Thr Gln Asp Gly Val Leu

260 265 270

Val Ala Ser Thr Val Gln Glu Gly Val Met Arg Asn His Asn

275 280 285

<210> 2

<211> 1174

<212> PRT

<213> 海分枝杆菌

<400> 2

Met Ser Pro Ile Thr Arg Glu Glu Arg Leu Glu Arg Arg Ile Gln Asp

1 5 10 15

Leu Tyr Ala Asn Asp Pro Gln Phe Ala Ala Ala Lys Pro Ala Thr Ala

20 25 30

Ile Thr Ala Ala Ile Glu Arg Pro Gly Leu Pro Leu Pro Gln Ile Ile

35 40 45

Glu Thr Val Met Thr Gly Tyr Ala Asp Arg Pro Ala Leu Ala Gln Arg

50 55 60

Ser Val Glu Phe Val Thr Asp Ala Gly Thr Gly His Thr Thr Leu Arg

65 70 75 80

Leu Leu Pro His Phe Glu Thr Ile Ser Tyr Gly Glu Leu Trp Asp Arg

85 90 95

Ile Ser Ala Leu Ala Asp Val Leu Ser Thr Glu Gln Thr Val Lys Pro

100 105 110

Gly Asp Arg Val Cys Leu Leu Gly Phe Asn Ser Val Asp Tyr Ala Thr

115 120 125

Ile Asp Met Thr Leu Ala Arg Leu Gly Ala Val Ala Val Pro Leu Gln

130 135 140

Thr Ser Ala Ala Ile Thr Gln Leu Gln Pro Ile Val Ala Glu Thr Gln

145 150 155 160

Pro Thr Met Ile Ala Ala Ser Val Asp Ala Leu Ala Asp Ala Thr Glu

165 170 175

Leu Ala Leu Ser Gly Gln Thr Ala Thr Arg Val Leu Val Phe Asp His

180 185 190

His Arg Gln Val Asp Ala His Arg Ala Ala Val Glu Ser Ala Arg Glu

195 200 205

Arg Leu Ala Gly Ser Ala Val Val Glu Thr Leu Ala Glu Ala Ile Ala

210 215 220

Arg Gly Asp Val Pro Arg Gly Ala Ser Ala Gly Ser Ala Pro Gly Thr

225 230 235 240

Asp Val Ser Asp Asp Ser Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser

245 250 255

Thr Gly Ala Pro Lys Gly Ala Met Tyr Pro Arg Arg Asn Val Ala Thr

260 265 270

Phe Trp Arg Lys Arg Thr Trp Phe Glu Gly Gly Tyr Glu Pro Ser Ile

275 280 285

Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gln Ile Leu

290 295 300

Tyr Gly Thr Leu Cys Asn Gly Gly Thr Ala Tyr Phe Val Ala Lys Ser

305 310 315 320

Asp Leu Ser Thr Leu Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu

325 330 335

Leu Thr Phe Val Pro Arg Val Trp Asp Met Val Phe Asp Glu Phe Gln

340 345 350

Ser Glu Val Asp Arg Arg Leu Val Asp Gly Ala Asp Arg Val Ala Leu

355 360 365

Glu Ala Gln Val Lys Ala Glu Ile Arg Asn Asp Val Leu Gly Gly Arg

370 375 380

Tyr Thr Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Asp Glu Met Lys

385 390 395 400

Ala Trp Val Glu Glu Leu Leu Asp Met His Leu Val Glu Gly Tyr Gly

405 410 415

Ser Thr Glu Ala Gly Met Ile Leu Ile Asp Gly Ala Ile Arg Arg Pro

420 425 430

Ala Val Leu Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe

435 440 445

Leu Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp

450 455 460

Ser Leu Phe Pro Gly Tyr Tyr Gln Arg Ala Glu Val Thr Ala Asp Val

465 470 475 480

Phe Asp Ala Asp Gly Phe Tyr Arg Thr Gly Asp Ile Met Ala Glu Val

485 490 495

Gly Pro Glu Gln Phe Val Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys

500 505 510

Leu Ser Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe

515 520 525

Gly Asp Ser Pro Leu Val Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Ala

530 535 540

Arg Ala Tyr Leu Leu Ala Val Ile Val Pro Thr Gln Glu Ala Leu Asp

545 550 555 560

Ala Val Pro Val Glu Glu Leu Lys Ala Arg Leu Gly Asp Ser Leu Gln

565 570 575

Glu Val Ala Lys Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp

580 585 590

Phe Ile Ile Glu Thr Thr Pro Trp Thr Leu Glu Asn Gly Leu Leu Thr

595 600 605

Gly Ile Arg Lys Leu Ala Arg Pro Gln Leu Lys Lys His Tyr Gly Glu

610 615 620

Leu Leu Glu Gln Ile Tyr Thr Asp Leu Ala His Gly Gln Ala Asp Glu

625 630 635 640

Leu Arg Ser Leu Arg Gln Ser Gly Ala Asp Ala Pro Val Leu Val Thr

645 650 655

Val Cys Arg Ala Ala Ala Ala Leu Leu Gly Gly Ser Ala Ser Asp Val

660 665 670

Gln Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala

675 680 685

Leu Ser Phe Thr Asn Leu Leu His Glu Ile Phe Asp Ile Glu Val Pro

690 695 700

Val Gly Val Ile Val Ser Pro Ala Asn Asp Leu Gln Ala Leu Ala Asp

705 710 715 720

Tyr Val Glu Ala Ala Arg Lys Pro Gly Ser Ser Arg Pro Thr Phe Ala

725 730 735

Ser Val His Gly Ala Ser Asn Gly Gln Val Thr Glu Val His Ala Gly

740 745 750

Asp Leu Ser Leu Asp Lys Phe Ile Asp Ala Ala Thr Leu Ala Glu Ala

755 760 765

Pro Arg Leu Pro Ala Ala Asn Thr Gln Val Arg Thr Val Leu Leu Thr

770 775 780

Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu

785 790 795 800

Arg Met Asp Leu Val Asp Gly Lys Leu Ile Cys Leu Val Arg Ala Lys

805 810 815

Ser Asp Thr Glu Ala Arg Ala Arg Leu Asp Lys Thr Phe Asp Ser Gly

820 825 830

Asp Pro Glu Leu Leu Ala His Tyr Arg Ala Leu Ala Gly Asp His Leu

835 840 845

Glu Val Leu Ala Gly Asp Lys Gly Glu Ala Asp Leu Gly Leu Asp Arg

850 855 860

Gln Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Leu Ile Val Asp Pro

865 870 875 880

Ala Ala Leu Val Asn His Val Leu Pro Tyr Ser Gln Leu Phe Gly Pro

885 890 895

Asn Ala Leu Gly Thr Ala Glu Leu Leu Arg Leu Ala Leu Thr Ser Lys

900 905 910

Ile Lys Pro Tyr Ser Tyr Thr Ser Thr Ile Gly Val Ala Asp Gln Ile

915 920 925

Pro Pro Ser Ala Phe Thr Glu Asp Ala Asp Ile Arg Val Ile Ser Ala

930 935 940

Thr Arg Ala Val Asp Asp Ser Tyr Ala Asn Gly Tyr Ser Asn Ser Lys

945 950 955 960

Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu

965 970 975

Pro Val Ala Val Phe Arg Cys Asp Met Ile Leu Ala Asp Thr Thr Trp

980 985 990

Ala Gly Gln Leu Asn Val Pro Asp Met Phe Thr Arg Met Ile Leu Ser

995 1000 1005

Leu Ala Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Glu Leu Ala Ala

1010 1015 1020

Asp Gly Ala Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe

1025 1030 1035 1040

Ile Ala Glu Ala Ile Ser Thr Leu Gly Ala Gln Ser Gln Asp Gly Phe

1045 1050 1055

His Thr Tyr His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp

1060 1065 1070

Glu Phe Val Asp Trp Leu Asn Glu Ser Gly Cys Pro Ile Gln Arg Ile

1075 1080 1085

Ala Asp Tyr Gly Asp Trp Leu Gln Arg Phe Glu Thr Ala Leu Arg Ala

1090 1095 1100

Leu Pro Asp Arg Gln Arg His Ser Ser Leu Leu Pro Leu Leu His Asn

1105 1110 1115 1120

Tyr Arg Gln Pro Glu Arg Pro Val Arg Gly Ser Ile Ala Pro Thr Asp

1125 1130 1135

Arg Phe Arg Ala Ala Val Gln Glu Ala Lys Ile Gly Pro Asp Lys Asp

1140 1145 1150

Ile Pro His Val Gly Ala Pro Ile Ile Val Lys Tyr Val Ser Asp Leu

1155 1160 1165

Arg Leu Leu Gly Leu Leu

1170

<210> 3

<211> 1173

<212> PRT

<213> 耻垢分枝杆菌

<400> 3

Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala

1 5 10 15

Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr

20 25 30

Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala

35 40 45

Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe

50 55 60

Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu

65 70 75 80

Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe

85 90 95

Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala

100 105 110

Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala

115 120 125

Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu

130 135 140

Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala

145 150 155 160

Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile

165 170 175

Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg

180 185 190

Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu

195 200 205

Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala

210 215 220

Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly

225 230 235 240

Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg

245 250 255

Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly

260 265 270

Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe

275 280 285

Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu

290 295 300

Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly

305 310 315 320

Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu

325 330 335

Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val

340 345 350

Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val

355 360 365

Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu

370 375 380

Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser

385 390 395 400

Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu

405 410 415

Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val

420 425 430

Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu

435 440 445

Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro

450 455 460

Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr

465 470 475 480

Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr

485 490 495

His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr

500 505 510

Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val

515 520 525

Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg

530 535 540

Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val

545 550 555 560

Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu

565 570 575

Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu

580 585 590

Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro

595 600 605

Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg

610 615 620

Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala

625 630 635 640

Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala

645 650 655

Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr

660 665 670

Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp

675 680 685

Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser

690 695 700

Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala

705 710 715 720

Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala

725 730 735

Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr

740 745 750

Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu

755 760 765

Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg

770 775 780

Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr

785 790 795 800

Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr

805 810 815

Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln

820 825 830

Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala

835 840 845

Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu

850 855 860

Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu

865 870 875 880

Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln

885 890 895

Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala

900 905 910

Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val

915 920 925

Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val

930 935 940

Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn

945 950 955 960

Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys

965 970 975

Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro

980 985 990

Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu

995 1000 1005

Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile Gly

1010 1015 1020

Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val Asp Phe

1025 1030 1035 1040

Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg Glu Gly Tyr

1045 1050 1055

Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly Ile Ser Leu Asp

1060 1065 1070

Val Phe Val Asp Trp Leu Ile Arg Ala Gly His Pro Ile Asp Arg Val

1075 1080 1085

Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe Glu Thr Ala Leu Thr Ala

1090 1095 1100

Leu Pro Glu Lys Arg Arg Ala Gln Thr Val Leu Pro Leu Leu His Ala

1105 1110 1115 1120

Phe Arg Ala Pro Gln Ala Pro Leu Arg Gly Ala Pro Glu Pro Thr Glu

1125 1130 1135

Val Phe His Ala Ala Val Arg Thr Ala Lys Val Gly Pro Gly Asp Ile

1140 1145 1150

Pro His Leu Asp Glu Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg

1155 1160 1165

Glu Phe Gly Leu Ile

1170

<210> 4

<211> 1148

<212> PRT

<213> Segniliparus rugosus

<400> 4

Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly

1 5 10 15

Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro

20 25 30

Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr

35 40 45

Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His

50 55 60

Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala

65 70 75 80

Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro

85 90 95

Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala

100 105 110

Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln

115 120 125

Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu

130 135 140

Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala

145 150 155 160

Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu

165 170 175

Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala

180 185 190

Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val

195 200 205

Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu

210 215 220

Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu

225 230 235 240

Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser

245 250 255

Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly

260 265 270

Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly

275 280 285

Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe

290 295 300

Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala

305 310 315 320

Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe

325 330 335

Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val

340 345 350

Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser

355 360 365

Pro Glu Met Arg Ala Phe Met Glu Glu Val Leu Gly Phe Pro Leu Leu

370 375 380

Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile

385 390 395 400

Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu

405 410 415

Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys

420 425 430

Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile

435 440 445

Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val

450 455 460

Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys

465 470 475 480

Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu

485 490 495

Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr

500 505 510

Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala

515 520 525

Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala

530 535 540

Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu

545 550 555 560

Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn

565 570 575

Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala

580 585 590

Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly

595 600 605

Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Gly Ala Gly Gln Arg Pro

610 615 620

Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu

625 630 635 640

Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp

645 650 655

Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu

660 665 670

Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala

675 680 685

Gly Ile Ala Lys His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro

690 695 700

Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser

705 710 715 720

Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala

725 730 735

Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly

740 745 750

Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg

755 760 765

Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg

770 775 780

Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly

785 790 795 800

Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg

805 810 815

Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp

820 825 830

Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His

835 840 845

Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly

850 855 860

Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala

865 870 875 880

Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly

885 890 895

Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val

900 905 910

Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser

915 920 925

Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly

930 935 940

Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg

945 950 955 960

Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu

965 970 975

Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly

980 985 990

Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp

995 1000 1005

Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp Phe

1010 1015 1020

Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro His His

1025 1030 1035 1040

Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile Glu Ala Gly

1045 1050 1055

His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp Phe Ala Arg Phe

1060 1065 1070

Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln Arg Gln His Ser Leu

1075 1080 1085

Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro His Pro Pro Val Asp Gly

1090 1095 1100

Ser Val Tyr Pro Thr Gly Lys Phe Gln Gly Ala Val Lys Ala Ala Gln

1105 1110 1115 1120

Val Gly Ser Asp His Asp Val Pro His Leu Gly Lys Ala Leu Ile Val

1125 1130 1135

Lys Tyr Ala Asp Asp Leu Lys Ala Leu Gly Leu Leu

1140 1145

<210> 5

<211> 1185

<212> PRT

<213> 马赛分枝杆菌

<400> 5

Met Thr Asn Glu Thr Asn Pro Gln Gln Glu Gln Leu Ser Arg Arg Ile

1 5 10 15

Glu Ser Leu Arg Glu Ser Asp Pro Gln Phe Arg Ala Ala Gln Pro Asp

20 25 30

Pro Ala Val Ala Glu Gln Val Leu Arg Pro Gly Leu His Leu Ser Glu

35 40 45

Ala Ile Ala Ala Leu Met Thr Gly Tyr Ala Glu Arg Pro Ala Leu Gly

50 55 60

Glu Arg Ala Arg Glu Leu Val Ile Asp Gln Asp Gly Arg Thr Thr Leu

65 70 75 80

Arg Leu Leu Pro Arg Phe Asp Thr Thr Thr Tyr Gly Glu Leu Trp Ser

85 90 95

Arg Thr Thr Ser Val Ala Ala Ala Trp His His Asp Ala Thr His Pro

100 105 110

Val Lys Ala Gly Asp Leu Val Ala Thr Leu Gly Phe Thr Ser Ile Asp

115 120 125

Tyr Thr Val Leu Asp Leu Ala Ile Met Ile Leu Gly Gly Val Ala Val

130 135 140

Pro Leu Gln Thr Ser Ala Pro Ala Ser Gln Trp Thr Thr Ile Leu Ala

145 150 155 160

Glu Ala Glu Pro Asn Thr Leu Ala Val Ser Ile Glu Leu Ile Gly Ala

165 170 175

Ala Met Glu Ser Val Arg Ala Thr Pro Ser Ile Lys Gln Val Val Val

180 185 190

Phe Asp Tyr Thr Pro Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala

195 200 205

Ala Ser Thr Gln Leu Ala Gly Thr Gly Ile Ala Leu Glu Thr Leu Asp

210 215 220

Ala Val Ile Ala Arg Gly Ala Ala Leu Pro Ala Ala Pro Leu Tyr Ala

225 230 235 240

Pro Ser Ala Gly Asp Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly

245 250 255

Ser Thr Gly Ala Pro Lys Gly Ala Met His Ser Glu Asn Ile Val Arg

260 265 270

Arg Trp Trp Ile Arg Glu Asp Val Met Ala Gly Thr Glu Asn Leu Pro

275 280 285

Met Ile Gly Leu Asn Phe Met Pro Met Ser His Ile Met Gly Arg Gly

290 295 300

Thr Leu Thr Ser Thr Leu Ser Thr Gly Gly Thr Gly Tyr Phe Ala Ala

305 310 315 320

Ser Ser Asp Met Ser Thr Leu Phe Glu Asp Met Glu Leu Ile Arg Pro

325 330 335

Thr Ala Leu Ala Leu Val Pro Arg Val Cys Asp Met Val Phe Gln Arg

340 345 350

Phe Gln Thr Glu Val Asp Arg Arg Leu Ala Ser Gly Asp Thr Ala Ser

355 360 365

Ala Glu Ala Val Ala Ala Glu Val Lys Ala Asp Ile Arg Asp Asn Leu

370 375 380

Phe Gly Gly Arg Val Ser Ala Val Met Val Gly Ser Ala Pro Leu Ser

385 390 395 400

Glu Glu Leu Gly Glu Phe Ile Glu Ser Cys Phe Glu Leu Asn Leu Thr

405 410 415

Asp Gly Tyr Gly Ser Thr Glu Ala Gly Met Val Phe Arg Asp Gly Ile

420 425 430

Val Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu

435 440 445

Leu Gly Tyr Phe Ser Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu

450 455 460

Leu Lys Thr Asp Gly Met Phe Leu Gly Tyr Tyr Lys Arg Pro Glu Val

465 470 475 480

Thr Ala Ser Val Phe Asp Ala Asp Gly Phe Tyr Met Thr Gly Asp Ile

485 490 495

Val Ala Glu Leu Ala His Asp Asn Ile Glu Ile Ile Asp Arg Arg Asn

500 505 510

Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Thr Leu

515 520 525

Glu Ala Glu Tyr Ala Asn Ser Pro Val Val His Gln Ile Tyr Val Tyr

530 535 540

Gly Ser Ser Glu Arg Ser Tyr Leu Leu Ala Val Val Val Pro Thr Pro

545 550 555 560

Glu Ala Val Ala Ala Ala Lys Gly Asp Ala Ala Ala Leu Lys Thr Thr

565 570 575

Ile Ala Asp Ser Leu Gln Asp Ile Ala Lys Glu Ile Gln Leu Gln Ser

580 585 590

Tyr Glu Val Pro Arg Asp Phe Ile Ile Glu Pro Gln Pro Phe Thr Gln

595 600 605

Gly Asn Gly Leu Leu Thr Gly Ile Ala Lys Leu Ala Arg Pro Asn Leu

610 615 620

Lys Ala His Tyr Gly Pro Arg Leu Glu Gln Met Tyr Ala Glu Ile Ala

625 630 635 640

Glu Gln Gln Ala Ala Glu Leu Arg Ala Leu His Gly Val Asp Pro Asp

645 650 655

Lys Pro Ala Leu Glu Thr Val Leu Lys Ala Ala Gln Ala Leu Leu Gly

660 665 670

Val Ser Ser Ala Glu Leu Ala Ala Asp Ala His Phe Thr Asp Leu Gly

675 680 685

Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser Asp Leu Leu Arg Asp Ile

690 695 700

Phe Ala Val Glu Val Pro Val Gly Val Ile Val Ser Ala Ala Asn Asp

705 710 715 720

Leu Gly Gly Val Ala Lys Phe Val Asp Glu Gln Arg His Ser Gly Gly

725 730 735

Thr Arg Pro Thr Ala Glu Thr Val His Gly Ala Gly His Thr Glu Ile

740 745 750

Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile Asp Glu Ala Thr Leu

755 760 765

His Ala Ala Pro Ser Leu Pro Lys Ala Ala Gly Ile Pro His Thr Val

770 775 780

Leu Leu Thr Gly Ser Asn Gly Tyr Leu Gly His Tyr Leu Ala Leu Glu

785 790 795 800

Trp Leu Glu Arg Leu Asp Lys Thr Asp Gly Lys Leu Ile Val Ile Val

805 810 815

Arg Gly Lys Asn Ala Glu Ala Ala Tyr Gly Arg Leu Glu Glu Ala Phe

820 825 830

Asp Thr Gly Asp Thr Glu Leu Leu Ala His Phe Arg Ser Leu Ala Asp

835 840 845

Lys His Leu Glu Val Leu Ala Gly Asp Ile Gly Asp Pro Asn Leu Gly

850 855 860

Leu Asp Ala Asp Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Val Ile

865 870 875 880

Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Asn Gln Leu

885 890 895

Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile Ile Lys Leu Ala Ile

900 905 910

Thr Thr Lys Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala

915 920 925

Ala Tyr Val Asp Pro Thr Thr Phe Asp Glu Glu Ser Asp Ile Arg Leu

930 935 940

Ile Ser Ala Val Arg Pro Ile Asp Asp Gly Tyr Ala Asn Gly Tyr Gly

945 950 955 960

Asn Ala Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu

965 970 975

Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His

980 985 990

Ser Arg Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu

995 1000 1005

Ile Leu Ser Leu Ile Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Gln

1010 1015 1020

Ala Gln Thr Thr Gly Glu Arg Pro Leu Ala His Tyr Asp Gly Leu Pro

1025 1030 1035 1040

Gly Asp Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Thr Gln Val Pro

1045 1050 1055

Glu Gly Ser Glu Gly Phe Val Thr Tyr Asp Cys Val Asn Pro His Ala

1060 1065 1070

Asp Gly Ile Ser Leu Asp Asn Phe Val Asp Trp Leu Ile Glu Ala Gly

1075 1080 1085

Tyr Pro Ile Ala Arg Ile Asp Asn Tyr Thr Glu Trp Phe Thr Arg Phe

1090 1095 1100

Asp Thr Ala Ile Arg Gly Leu Ser Glu Lys Gln Lys Gln His Ser Leu

1105 1110 1115 1120

Leu Pro Leu Leu His Ala Phe Glu Gln Pro Ser Ala Ala Glu Asn His

1125 1130 1135

Gly Val Val Pro Ala Lys Arg Phe Gln His Ala Val Gln Ala Ala Gly

1140 1145 1150

Ile Gly Pro Val Gly Gln Asp Gly Thr Thr Asp Ile Pro His Leu Ser

1155 1160 1165

Arg Arg Leu Ile Val Lys Tyr Ala Lys Asp Leu Glu Gln Leu Gly Leu

1170 1175 1180

Leu

1185

<210> 6

<211> 1186

<212> PRT

<213> Segniliparus rotundus

<400> 6

Met Thr Gln Ser His Thr Gln Gly Pro Gln Ala Ser Ala Ala His Ser

1 5 10 15

Arg Leu Ala Arg Arg Ala Ala Glu Leu Leu Ala Thr Asp Pro Gln Ala

20 25 30

Ala Ala Thr Leu Pro Asp Pro Glu Val Val Arg Gln Ala Thr Arg Pro

35 40 45

Gly Leu Arg Leu Ala Glu Arg Val Asp Ala Ile Leu Ser Gly Tyr Ala

50 55 60

Asp Arg Pro Ala Leu Gly Gln Arg Ser Phe Gln Thr Val Lys Asp Pro

65 70 75 80

Ile Thr Gly Arg Ser Ser Val Glu Leu Leu Pro Thr Phe Asp Thr Ile

85 90 95

Thr Tyr Arg Glu Leu Arg Glu Arg Ala Thr Ala Ile Ala Ser Asp Leu

100 105 110

Ala His His Pro Gln Ala Pro Ala Lys Pro Gly Asp Phe Leu Ala Ser

115 120 125

Ile Gly Phe Ile Ser Val Asp Tyr Val Ala Ile Asp Ile Ala Gly Val

130 135 140

Phe Ala Gly Leu Thr Ala Val Pro Leu Gln Thr Gly Ala Thr Leu Ala

145 150 155 160

Thr Leu Thr Ala Ile Thr Ala Glu Thr Ala Pro Thr Leu Phe Ala Ala

165 170 175

Ser Ile Glu His Leu Pro Thr Ala Val Asp Ala Val Leu Ala Thr Pro

180 185 190

Ser Val Arg Arg Leu Leu Val Phe Asp Tyr Arg Ala Gly Ser Asp Glu

195 200 205

Asp Arg Glu Ala Val Glu Ala Ala Lys Arg Lys Ile Ala Asp Ala Gly

210 215 220

Ser Ser Val Leu Val Asp Val Leu Asp Glu Val Ile Ala Arg Gly Lys

225 230 235 240

Ser Ala Pro Lys Ala Pro Leu Pro Pro Ala Thr Asp Ala Gly Asp Asp

245 250 255

Ser Leu Ser Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys

260 265 270

Gly Ala Met Tyr Pro Glu Arg Asn Val Ala His Phe Trp Gly Gly Val

275 280 285

Trp Ala Ala Ala Phe Asp Glu Asp Ala Ala Pro Pro Val Pro Ala Ile

290 295 300

Asn Ile Thr Phe Leu Pro Leu Ser His Val Ala Ser Arg Leu Ser Leu

305 310 315 320

Met Pro Thr Leu Ala Arg Gly Gly Leu Met His Phe Val Ala Lys Ser

325 330 335

Asp Leu Ser Thr Leu Phe Glu Asp Leu Lys Leu Ala Arg Pro Thr Asn

340 345 350

Leu Phe Leu Val Pro Arg Val Val Glu Met Leu Tyr Gln His Tyr Gln

355 360 365

Ser Glu Leu Asp Arg Arg Gly Val Gln Asp Gly Thr Arg Glu Ala Glu

370 375 380

Ala Val Lys Asp Asp Leu Arg Thr Gly Leu Leu Gly Gly Arg Ile Leu

385 390 395 400

Thr Ala Gly Phe Gly Ser Ala Pro Leu Ser Ala Glu Leu Ala Gly Phe

405 410 415

Ile Glu Ser Leu Leu Gln Ile His Leu Val Asp Gly Tyr Gly Ser Thr

420 425 430

Glu Ala Gly Pro Val Trp Arg Asp Gly Tyr Leu Val Lys Pro Pro Val

435 440 445

Thr Asp Tyr Lys Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr

450 455 460

Asp Ser Pro His Pro Arg Gly Glu Leu Ala Ile Lys Thr Gln Thr Ile

465 470 475 480

Leu Pro Gly Tyr Tyr Lys Arg Pro Glu Thr Thr Ala Glu Val Phe Asp

485 490 495

Glu Asp Gly Phe Tyr Leu Thr Gly Asp Val Val Ala Gln Ile Gly Pro

500 505 510

Glu Gln Phe Ala Tyr Val Asp Arg Arg Lys Asn Val Leu Lys Leu Ser

515 520 525

Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Ala Tyr Ser Ser

530 535 540

Ser Pro Leu Val Arg Gln Leu Phe Val Tyr Gly Ser Ser Glu Arg Ser

545 550 555 560

Tyr Leu Leu Ala Val Ile Val Pro Thr Pro Asp Ala Leu Lys Lys Phe

565 570 575

Gly Val Gly Glu Ala Ala Lys Ala Ala Leu Gly Glu Ser Leu Gln Lys

580 585 590

Ile Ala Arg Asp Glu Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp Phe

595 600 605

Ile Ile Glu Thr Asp Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Asp

610 615 620

Ala Arg Lys Ser Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg

625 630 635 640

Leu Glu Ala Met Tyr Lys Glu Leu Ala Asp Gly Gln Ala Asn Glu Leu

645 650 655

Arg Asp Ile Arg Arg Gly Val Gln Gln Arg Pro Thr Leu Glu Thr Val

660 665 670

Arg Arg Ala Ala Ala Ala Met Leu Gly Ala Ser Ala Ala Glu Ile Lys

675 680 685

Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu

690 695 700

Thr Phe Ser Asn Phe Leu His Asp Leu Phe Glu Val Asp Val Pro Val

705 710 715 720

Gly Val Ile Val Ser Ala Ala Asn Thr Leu Gly Ser Val Ala Glu His

725 730 735

Ile Asp Ala Gln Leu Ala Gly Gly Arg Ala Arg Pro Thr Phe Ala Thr

740 745 750

Val His Gly Lys Gly Ser Thr Thr Ile Lys Ala Ser Asp Leu Thr Leu

755 760 765

Asp Lys Phe Ile Asp Glu Gln Thr Leu Glu Ala Ala Lys His Leu Pro

770 775 780

Lys Pro Ala Asp Pro Pro Arg Thr Val Leu Leu Thr Gly Ala Asn Gly

785 790 795 800

Trp Leu Gly Arg Phe Leu Ala Leu Glu Trp Leu Glu Arg Leu Ala Pro

805 810 815

Ala Gly Gly Lys Leu Ile Thr Ile Val Arg Gly Lys Asp Ala Ala Gln

820 825 830

Ala Lys Ala Arg Leu Asp Ala Ala Tyr Glu Ser Gly Asp Pro Lys Leu

835 840 845

Ala Gly His Tyr Gln Asp Leu Ala Ala Thr Thr Leu Glu Val Leu Ala

850 855 860

Gly Asp Phe Ser Glu Pro Arg Leu Gly Leu Asp Glu Ala Thr Trp Asn

865 870 875 880

Arg Leu Ala Asp Glu Val Asp Phe Ile Ser His Pro Gly Ala Leu Val

885 890 895

Asn His Val Leu Pro Tyr Asn Gln Leu Phe Gly Pro Asn Val Ala Gly

900 905 910

Val Ala Glu Ile Ile Lys Leu Ala Ile Thr Thr Arg Ile Lys Pro Val

915 920 925

Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly Val Glu Pro Ser Ala

930 935 940

Leu Asp Glu Asp Gly Asp Ile Arg Thr Val Ser Ala Glu Arg Ser Val

945 950 955 960

Asp Glu Gly Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Gly Gly Glu

965 970 975

Val Leu Leu Arg Glu Ala His Asp Arg Thr Gly Leu Pro Val Arg Val

980 985 990

Phe Arg Ser Asp Met Ile Leu Ala His Gln Lys Tyr Thr Gly Gln Val

995 1000 1005

Asn Ala Thr Asp Gln Phe Thr Arg Leu Val Gln Ser Leu Leu Ala Thr

1010 1015 1020

Gly Leu Ala Pro Lys Ser Phe Tyr Glu Leu Asp Ala Gln Gly Asn Arg

1025 1030 1035 1040

Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp Phe Thr Ala Glu Ser

1045 1050 1055

Ile Thr Thr Leu Gly Gly Asp Gly Leu Glu Gly Tyr Arg Ser Tyr Asn

1060 1065 1070

Val Phe Asn Pro His Arg Asp Gly Val Gly Leu Asp Glu Phe Val Asp

1075 1080 1085

Trp Leu Ile Glu Ala Gly His Pro Ile Thr Arg Ile Asp Asp Tyr Asp

1090 1095 1100

Gln Trp Leu Ser Arg Phe Glu Thr Ser Leu Arg Gly Leu Pro Glu Ser

1105 1110 1115 1120

Lys Arg Gln Ala Ser Val Leu Pro Leu Leu His Ala Phe Ala Arg Pro

1125 1130 1135

Gly Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Thr Val Phe Arg Thr

1140 1145 1150

Asp Val Gln Lys Ala Lys Ile Gly Ala Glu His Asp Ile Pro His Leu

1155 1160 1165

Gly Lys Ala Leu Val Leu Lys Tyr Ala Asp Asp Ile Lys Gln Leu Gly

1170 1175 1180

Leu Leu

1185

<210> 7

<211> 459

<212> PRT

<213> 青紫色杆菌

<400> 7

Met Gln Lys Gln Arg Thr Thr Ser Gln Trp Arg Glu Leu Asp Ala Ala

1 5 10 15

His His Leu His Pro Phe Thr Asp Thr Ala Ser Leu Asn Gln Ala Gly

20 25 30

Ala Arg Val Met Thr Arg Gly Glu Gly Val Tyr Leu Trp Asp Ser Glu

35 40 45

Gly Asn Lys Ile Ile Asp Gly Met Ala Gly Leu Trp Cys Val Asn Val

50 55 60

Gly Tyr Gly Arg Lys Asp Phe Ala Glu Ala Ala Arg Arg Gln Met Glu

65 70 75 80

Glu Leu Pro Phe Tyr Asn Thr Phe Phe Lys Thr Thr His Pro Ala Val

85 90 95

Val Glu Leu Ser Ser Leu Leu Ala Glu Val Thr Pro Ala Gly Phe Asp

100 105 110

Arg Val Phe Tyr Thr Asn Ser Gly Ser Glu Ser Val Asp Thr Met Ile

115 120 125

Arg Met Val Arg Arg Tyr Trp Asp Val Gln Gly Lys Pro Glu Lys Lys

130 135 140

Thr Leu Ile Gly Arg Trp Asn Gly Tyr His Gly Ser Thr Ile Gly Gly

145 150 155 160

Ala Ser Leu Gly Gly Met Lys Tyr Met His Glu Gln Gly Asp Leu Pro

165 170 175

Ile Pro Gly Met Ala His Ile Glu Gln Pro Trp Trp Tyr Lys His Gly

180 185 190

Lys Asp Met Thr Pro Asp Glu Phe Gly Val Val Ala Ala Arg Trp Leu

195 200 205

Glu Glu Lys Ile Leu Glu Ile Gly Ala Asp Lys Val Ala Ala Phe Val

210 215 220

Gly Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Ala Thr

225 230 235 240

Tyr Trp Pro Glu Ile Glu Arg Ile Cys Arg Lys Tyr Asp Val Leu Leu

245 250 255

Val Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Glu Trp Phe

260 265 270

Gly His Gln His Phe Gly Phe Gln Pro Asp Leu Phe Thr Ala Ala Lys

275 280 285

Gly Leu Ser Ser Gly Tyr Leu Pro Ile Gly Ala Val Phe Val Gly Lys

290 295 300

Arg Val Ala Glu Gly Leu Ile Ala Gly Gly Asp Phe Asn His Gly Phe

305 310 315 320

Thr Tyr Ser Gly His Pro Val Cys Ala Ala Val Ala His Ala Asn Val

325 330 335

Ala Ala Leu Arg Asp Glu Gly Ile Val Gln Arg Val Lys Asp Asp Ile

340 345 350

Gly Pro Tyr Met Gln Lys Arg Trp Arg Glu Thr Phe Ser Arg Phe Glu

355 360 365

His Val Asp Asp Val Arg Gly Val Gly Met Val Gln Ala Phe Thr Leu

370 375 380

Val Lys Asn Lys Ala Lys Arg Glu Leu Phe Pro Asp Phe Gly Glu Ile

385 390 395 400

Gly Thr Leu Cys Arg Asp Ile Phe Phe Arg Asn Asn Leu Ile Met Arg

405 410 415

Ala Cys Gly Asp His Ile Val Ser Ala Pro Pro Leu Val Met Thr Arg

420 425 430

Ala Glu Val Asp Glu Met Leu Ala Val Ala Glu Arg Cys Leu Glu Glu

435 440 445

Phe Glu Gln Thr Leu Lys Ala Arg Gly Leu Ala

450 455

<210> 8

<211> 468

<212> PRT

<213> 铜绿假单胞菌

<400> 8

Met Asn Ala Arg Leu His Ala Thr Ser Pro Leu Gly Asp Ala Asp Leu

1 5 10 15

Val Arg Ala Asp Gln Ala His Tyr Met His Gly Tyr His Val Phe Asp

20 25 30

Asp His Arg Val Asn Gly Ser Leu Asn Ile Ala Ala Gly Asp Gly Ala

35 40 45

Tyr Ile Tyr Asp Thr Ala Gly Asn Arg Tyr Leu Asp Ala Val Gly Gly

50 55 60

Met Trp Cys Thr Asn Ile Gly Leu Gly Arg Glu Glu Met Ala Arg Thr

65 70 75 80

Val Ala Glu Gln Thr Arg Leu Leu Ala Tyr Ser Asn Pro Phe Cys Asp

85 90 95

Met Ala Asn Pro Arg Ala Ile Glu Leu Cys Arg Lys Leu Ala Glu Leu

100 105 110

Ala Pro Gly Asp Leu Asp His Val Phe Leu Thr Thr Gly Gly Ser Thr

115 120 125

Ala Val Asp Thr Ala Ile Arg Leu Met His Tyr Tyr Gln Asn Cys Arg

130 135 140

Gly Lys Arg Ala Lys Lys His Val Ile Thr Arg Ile Asn Ala Tyr His

145 150 155 160

Gly Ser Thr Phe Leu Gly Met Ser Leu Gly Gly Lys Ser Ala Asp Arg

165 170 175

Pro Ala Glu Phe Asp Phe Leu Asp Glu Arg Ile His His Leu Ala Cys

180 185 190

Pro Tyr Tyr Tyr Arg Ala Pro Glu Gly Leu Gly Glu Ala Glu Phe Leu

195 200 205

Asp Gly Leu Val Asp Glu Phe Glu Arg Lys Ile Leu Glu Leu Gly Ala

210 215 220

Asp Arg Val Gly Ala Phe Ile Ser Glu Pro Val Phe Gly Ser Gly Gly

225 230 235 240

Val Ile Val Pro Pro Ala Gly Tyr His Arg Arg Met Trp Glu Leu Cys

245 250 255

Gln Arg Tyr Asp Val Leu Tyr Ile Ser Asp Glu Val Val Thr Ser Phe

260 265 270

Gly Arg Leu Gly His Phe Phe Ala Ser Gln Ala Val Phe Gly Val Gln

275 280 285

Pro Asp Ile Ile Leu Thr Ala Lys Gly Leu Thr Ser Gly Tyr Gln Pro

290 295 300

Leu Gly Ala Cys Ile Phe Ser Arg Arg Ile Trp Glu Val Ile Ala Glu

305 310 315 320

Pro Asp Lys Gly Arg Cys Phe Ser His Gly Phe Thr Tyr Ser Gly His

325 330 335

Pro Val Ala Cys Ala Ala Ala Leu Lys Asn Ile Glu Ile Ile Glu Arg

340 345 350

Glu Gly Leu Leu Ala His Ala Asp Glu Val Gly Arg Tyr Phe Glu Glu

355 360 365

Arg Leu Gln Ser Leu Arg Asp Leu Pro Ile Val Gly Asp Val Arg Gly

370 375 380

Met Arg Phe Met Ala Cys Val Glu Phe Val Ala Asp Lys Ala Ser Lys

385 390 395 400

Ala Leu Phe Pro Glu Ser Leu Asn Ile Gly Glu Trp Val His Leu Arg

405 410 415

Ala Gln Lys Arg Gly Leu Leu Val Arg Pro Ile Val His Leu Asn Val

420 425 430

Met Ser Pro Pro Leu Ile Leu Thr Arg Glu Gln Val Asp Thr Val Val

435 440 445

Arg Val Leu Arg Glu Ser Ile Glu Glu Thr Val Glu Asp Leu Val Arg

450 455 460

Ala Gly His Arg

465

<210> 9

<211> 454

<212> PRT

<213> 丁香假单胞菌

<400> 9

Met Ser Ala Asn Asn Pro Gln Thr Leu Glu Trp Gln Ala Leu Ser Ser

1 5 10 15

Glu His His Leu Ala Pro Phe Ser Asp Tyr Lys Gln Leu Lys Glu Lys

20 25 30

Gly Pro Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Leu Trp Asp Ser

35 40 45

Glu Gly Asn Lys Ile Leu Asp Gly Met Ser Gly Leu Trp Cys Val Ala

50 55 60

Ile Gly Tyr Gly Arg Glu Glu Leu Ala Asp Ala Ala Ser Lys Gln Met

65 70 75 80

Arg Glu Leu Pro Tyr Tyr Asn Leu Phe Phe Gln Thr Ala His Pro Pro

85 90 95

Val Leu Glu Leu Ala Lys Ala Ile Ser Asp Ile Ala Pro Glu Gly Met

100 105 110

Asn His Val Phe Phe Thr Gly Ser Gly Ser Glu Gly Asn Asp Thr Met

115 120 125

Leu Arg Met Val Arg His Tyr Trp Ala Leu Lys Gly Gln Pro Asn Lys

130 135 140

Lys Thr Ile Ile Ser Arg Val Asn Gly Tyr His Gly Ser Thr Val Ala

145 150 155 160

Gly Ala Ser Leu Gly Gly Met Thr Tyr Met His Glu Gln Gly Asp Leu

165 170 175

Pro Ile Pro Gly Val Val His Ile Pro Gln Pro Tyr Trp Phe Gly Glu

180 185 190

Gly Gly Asp Met Thr Pro Asp Glu Phe Gly Ile Trp Ala Ala Glu Gln

195 200 205

Leu Glu Lys Lys Ile Leu Glu Leu Gly Val Glu Asn Val Gly Ala Phe

210 215 220

Ile Ala Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Asp

225 230 235 240

Ser Tyr Trp Pro Lys Ile Lys Glu Ile Leu Ser Arg Tyr Asp Ile Leu

245 250 255

Phe Ala Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Ser Glu Trp

260 265 270

Phe Gly Ser Asp Phe Tyr Gly Leu Arg Pro Asp Met Met Thr Ile Ala

275 280 285

Lys Gly Leu Thr Ser Gly Tyr Val Pro Met Gly Gly Leu Ile Val Arg

290 295 300

Asp Glu Ile Val Ala Val Leu Asn Glu Gly Gly Asp Phe Asn His Gly

305 310 315 320

Phe Thr Tyr Ser Gly His Pro Val Ala Ala Ala Val Ala Leu Glu Asn

325 330 335

Ile Arg Ile Leu Arg Glu Glu Lys Ile Val Glu Arg Val Arg Ser Glu

340 345 350

Thr Ala Pro Tyr Leu Gln Lys Arg Leu Arg Glu Leu Ser Asp His Pro

355 360 365

Leu Val Gly Glu Val Arg Gly Val Gly Leu Leu Gly Ala Ile Glu Leu

370 375 380

Val Lys Asp Lys Thr Thr Arg Glu Arg Tyr Thr Asp Lys Gly Ala Gly

385 390 395 400

Met Ile Cys Arg Thr Phe Cys Phe Asp Asn Gly Leu Ile Met Arg Ala

405 410 415

Val Gly Asp Thr Met Ile Ile Ala Pro Pro Leu Val Ile Ser Phe Ala

420 425 430

Gln Ile Asp Glu Leu Val Glu Lys Ala Arg Thr Cys Leu Asp Leu Thr

435 440 445

Leu Ala Val Leu Gln Gly

450

<210> 10

<211> 467

<212> PRT

<213> 球形红杆菌

<400> 10

Met Thr Arg Asn Asp Ala Thr Asn Ala Ala Gly Ala Val Gly Ala Ala

1 5 10 15

Met Arg Asp His Ile Leu Leu Pro Ala Gln Glu Met Ala Lys Leu Gly

20 25 30

Lys Ser Ala Gln Pro Val Leu Thr His Ala Glu Gly Ile Tyr Val His

35 40 45

Thr Glu Asp Gly Arg Arg Leu Ile Asp Gly Pro Ala Gly Met Trp Cys

50 55 60

Ala Gln Val Gly Tyr Gly Arg Arg Glu Ile Val Asp Ala Met Ala His

65 70 75 80

Gln Ala Met Val Leu Pro Tyr Ala Ser Pro Trp Tyr Met Ala Thr Ser

85 90 95

Pro Ala Ala Arg Leu Ala Glu Lys Ile Ala Thr Leu Thr Pro Gly Asp

100 105 110

Leu Asn Arg Ile Phe Phe Thr Thr Gly Gly Ser Thr Ala Val Asp Ser

115 120 125

Ala Leu Arg Phe Ser Glu Phe Tyr Asn Asn Val Leu Gly Arg Pro Gln

130 135 140

Lys Lys Arg Ile Ile Val Arg Tyr Asp Gly Tyr His Gly Ser Thr Ala

145 150 155 160

Leu Thr Ala Ala Cys Thr Gly Arg Thr Gly Asn Trp Pro Asn Phe Asp

165 170 175

Ile Ala Gln Asp Arg Ile Ser Phe Leu Ser Ser Pro Asn Pro Arg His

180 185 190

Ala Gly Asn Arg Ser Gln Glu Ala Phe Leu Asp Asp Leu Val Gln Glu

195 200 205

Phe Glu Asp Arg Ile Glu Ser Leu Gly Pro Asp Thr Ile Ala Ala Phe

210 215 220

Leu Ala Glu Pro Ile Leu Ala Ser Gly Gly Val Ile Ile Pro Pro Ala

225 230 235 240

Gly Tyr His Ala Arg Phe Lys Ala Ile Cys Glu Lys His Asp Ile Leu

245 250 255

Tyr Ile Ser Asp Glu Val Val Thr Gly Phe Gly Arg Cys Gly Glu Trp

260 265 270

Phe Ala Ser Glu Lys Val Phe Gly Val Val Pro Asp Ile Ile Thr Phe

275 280 285

Ala Lys Gly Val Thr Ser Gly Tyr Val Pro Leu Gly Gly Leu Ala Ile

290 295 300

Ser Glu Ala Val Leu Ala Arg Ile Ser Gly Glu Asn Ala Lys Gly Ser

305 310 315 320

Trp Phe Thr Asn Gly Tyr Thr Tyr Ser Asn Gln Pro Val Ala Cys Ala

325 330 335

Ala Ala Leu Ala Asn Ile Glu Leu Met Glu Arg Glu Gly Ile Val Asp

340 345 350

Gln Ala Arg Glu Met Ala Asp Tyr Phe Ala Ala Ala Leu Ala Ser Leu

355 360 365

Arg Asp Leu Pro Gly Val Ala Glu Thr Arg Ser Val Gly Leu Val Gly

370 375 380

Cys Val Gln Cys Leu Leu Asp Pro Thr Arg Ala Asp Gly Thr Ala Glu

385 390 395 400

Asp Lys Ala Phe Thr Leu Lys Ile Asp Glu Arg Cys Phe Glu Leu Gly

405 410 415

Leu Ile Val Arg Pro Leu Gly Asp Leu Cys Val Ile Ser Pro Pro Leu

420 425 430

Ile Ile Ser Arg Ala Gln Ile Asp Glu Met Val Ala Ile Met Arg Gln

435 440 445

Ala Ile Thr Glu Val Ser Ala Ala His Gly Leu Thr Ala Lys Glu Pro

450 455 460

Ala Ala Val

465

<210> 11

<211> 459

<212> PRT

<213> 大肠杆菌

<400> 11

Met Asn Arg Leu Pro Ser Ser Ala Ser Ala Leu Ala Cys Ser Ala His

1 5 10 15

Ala Leu Asn Leu Ile Glu Lys Arg Thr Leu Asp His Glu Glu Met Lys

20 25 30

Ala Leu Asn Arg Glu Val Ile Glu Tyr Phe Lys Glu His Val Asn Pro

35 40 45

Gly Phe Leu Glu Tyr Arg Lys Ser Val Thr Ala Gly Gly Asp Tyr Gly

50 55 60

Ala Val Glu Trp Gln Ala Gly Ser Leu Asn Thr Leu Val Asp Thr Gln

65 70 75 80

Gly Gln Glu Phe Ile Asp Cys Leu Gly Gly Phe Gly Ile Phe Asn Val

85 90 95

Gly His Arg Asn Pro Val Val Val Ser Ala Val Gln Asn Gln Leu Ala

100 105 110

Lys Gln Pro Leu His Ser Gln Glu Leu Leu Asp Pro Leu Arg Ala Met

115 120 125

Leu Ala Lys Thr Leu Ala Ala Leu Thr Pro Gly Lys Leu Lys Tyr Ser

130 135 140

Phe Phe Cys Asn Ser Gly Thr Glu Ser Val Glu Ala Ala Leu Lys Leu

145 150 155 160

Ala Lys Ala Tyr Gln Ser Pro Arg Gly Lys Phe Thr Phe Ile Ala Thr

165 170 175

Ser Gly Ala Phe His Gly Lys Ser Leu Gly Ala Leu Ser Ala Thr Ala

180 185 190

Lys Ser Thr Phe Arg Lys Pro Phe Met Pro Leu Leu Pro Gly Phe Arg

195 200 205

His Val Pro Phe Gly Asn Ile Glu Ala Met Arg Thr Ala Leu Asn Glu

210 215 220

Cys Lys Lys Thr Gly Asp Asp Val Ala Ala Val Ile Leu Glu Pro Ile

225 230 235 240

Gln Gly Glu Gly Gly Val Ile Leu Pro Pro Pro Gly Tyr Leu Thr Ala

245 250 255

Val Arg Lys Leu Cys Asp Glu Phe Gly Ala Leu Met Ile Leu Asp Glu

260 265 270

Val Gln Thr Gly Met Gly Arg Thr Gly Lys Met Phe Ala Cys Glu His

275 280 285

Glu Asn Val Gln Pro Asp Ile Leu Cys Leu Ala Lys Ala Leu Gly Gly

290 295 300

Gly Val Met Pro Ile Gly Ala Thr Ile Ala Thr Glu Glu Val Phe Ser

305 310 315 320

Val Leu Phe Asp Asn Pro Phe Leu His Thr Thr Thr Phe Gly Gly Asn

325 330 335

Pro Leu Ala Cys Ala Ala Ala Leu Ala Thr Ile Asn Val Leu Leu Glu

340 345 350

Gln Asn Leu Pro Ala Gln Ala Glu Gln Lys Gly Asp Met Leu Leu Asp

355 360 365

Gly Phe Arg Gln Leu Ala Arg Glu Tyr Pro Asp Leu Val Gln Glu Ala

370 375 380

Arg Gly Lys Gly Met Leu Met Ala Ile Glu Phe Val Asp Asn Glu Ile

385 390 395 400

Gly Tyr Asn Phe Ala Ser Glu Met Phe Arg Gln Arg Val Leu Val Ala

405 410 415

Gly Thr Leu Asn Asn Ala Lys Thr Ile Arg Ile Glu Pro Pro Leu Thr

420 425 430

Leu Thr Ile Glu Gln Cys Glu Leu Val Ile Lys Ala Ala Arg Lys Ala

435 440 445

Leu Ala Ala Met Arg Val Ser Val Glu Glu Ala

450 455

<210> 12

<211> 453

<212> PRT

<213> 河流弧菌

<400> 12

Met Asn Lys Pro Gln Ser Trp Glu Ala Arg Ala Glu Thr Tyr Ser Leu

1 5 10 15

Tyr Gly Phe Thr Asp Met Pro Ser Leu His Gln Arg Gly Thr Val Val

20 25 30

Val Thr His Gly Glu Gly Pro Tyr Ile Val Asp Val Asn Gly Arg Arg

35 40 45

Tyr Leu Asp Ala Asn Ser Gly Leu Trp Asn Met Val Ala Gly Phe Asp

50 55 60

His Lys Gly Leu Ile Asp Ala Ala Lys Ala Gln Tyr Glu Arg Phe Pro

65 70 75 80

Gly Tyr His Ala Phe Phe Gly Arg Met Ser Asp Gln Thr Val Met Leu

85 90 95

Ser Glu Lys Leu Val Glu Val Ser Pro Phe Asp Ser Gly Arg Val Phe

100 105 110

Tyr Thr Asn Ser Gly Ser Glu Ala Asn Asp Thr Met Val Lys Met Leu

115 120 125

Trp Phe Leu His Ala Ala Glu Gly Lys Pro Gln Lys Arg Lys Ile Leu

130 135 140

Thr Arg Trp Asn Ala Tyr His Gly Val Thr Ala Val Ser Ala Ser Met

145 150 155 160

Thr Gly Lys Pro Tyr Asn Ser Val Phe Gly Leu Pro Leu Pro Gly Phe

165 170 175

Val His Leu Thr Cys Pro His Tyr Trp Arg Tyr Gly Glu Glu Gly Glu

180 185 190

Thr Glu Glu Gln Phe Val Ala Arg Leu Ala Arg Glu Leu Glu Glu Thr

195 200 205

Ile Gln Arg Glu Gly Ala Asp Thr Ile Ala Gly Phe Phe Ala Glu Pro

210 215 220

Val Met Gly Ala Gly Gly Val Ile Pro Pro Ala Lys Gly Tyr Phe Gln

225 230 235 240

Ala Ile Leu Pro Ile Leu Arg Lys Tyr Asp Ile Pro Val Ile Ser Asp

245 250 255

Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Asn Thr Trp Gly Cys Val

260 265 270

Thr Tyr Asp Phe Thr Pro Asp Ala Ile Ile Ser Ser Lys Asn Leu Thr

275 280 285

Ala Gly Phe Phe Pro Met Gly Ala Val Ile Leu Gly Pro Glu Leu Ser

290 295 300

Lys Arg Leu Glu Thr Ala Ile Glu Ala Ile Glu Glu Phe Pro His Gly

305 310 315 320

Phe Thr Ala Ser Gly His Pro Val Gly Cys Ala Ile Ala Leu Lys Ala

325 330 335

Ile Asp Val Val Met Asn Glu Gly Leu Ala Glu Asn Val Arg Arg Leu

340 345 350

Ala Pro Arg Phe Glu Glu Arg Leu Lys His Ile Ala Glu Arg Pro Asn

355 360 365

Ile Gly Glu Tyr Arg Gly Ile Gly Phe Met Trp Ala Leu Glu Ala Val

370 375 380

Lys Asp Lys Ala Ser Lys Thr Pro Phe Asp Gly Asn Leu Ser Val Ser

385 390 395 400

Glu Arg Ile Ala Asn Thr Cys Thr Asp Leu Gly Leu Ile Cys Arg Pro

405 410 415

Leu Gly Gln Ser Val Val Leu Cys Pro Pro Phe Ile Leu Thr Glu Ala

420 425 430

Gln Met Asp Glu Met Phe Asp Lys Leu Glu Lys Ala Leu Asp Lys Val

435 440 445

Phe Ala Glu Val Ala

450

<210> 13

<211> 418

<212> PRT

<213> 极胞菌属物种JS666

<400> 13

Met Ser Glu Ala Ile Val Val Asn Asn Gln Asn Asp Gln Ser Arg Ala

1 5 10 15

Tyr Ala Ile Pro Leu Glu Asp Ile Asp Val Ser Asn Pro Glu Leu Phe

20 25 30

Arg Asp Asn Thr Met Trp Gly Tyr Phe Glu Arg Leu Arg Arg Glu Asp

35 40 45

Pro Val His Tyr Cys Lys Asp Ser Leu Phe Gly Pro Tyr Trp Ser Val

50 55 60

Thr Lys Phe Lys Asp Ile Met Gln Val Glu Thr His Pro Glu Ile Phe

65 70 75 80

Ser Ser Glu Gly Asn Ile Thr Ile Met Glu Ser Asn Ala Ala Val Thr

85 90 95

Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg

100 105 110

Met Ala Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Lys Leu Glu

115 120 125

Gly Leu Ile Arg Glu Arg Thr Gly Arg Ala Leu Asp Gly Leu Pro Ile

130 135 140

Asn Glu Thr Phe Asp Trp Val Lys Leu Val Ser Ile Asn Leu Thr Thr

145 150 155 160

Gln Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Glu Asp Arg Ala Lys

165 170 175

Leu Thr Arg Trp Ser Asp Val Ala Thr Ala Leu Val Gly Thr Gly Ile

180 185 190

Ile Asp Ser Glu Glu Gln Arg Met Glu Glu Leu Lys Gly Cys Val Gln

195 200 205

Tyr Met Thr Arg Leu Trp Asn Glu Arg Val Asn Val Pro Pro Gly Asn

210 215 220

Asp Leu Ile Ser Met Met Ala His Thr Glu Ser Met Arg Asn Met Thr

225 230 235 240

Pro Glu Glu Phe Leu Gly Asn Leu Ile Leu Leu Ile Val Gly Gly Asn

245 250 255

Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu Asn Glu

260 265 270

Asn Pro Asp Glu Tyr Arg Lys Leu Cys Ala Asn Pro Ala Leu Ile Ala

275 280 285

Ser Met Val Pro Glu Ile Val Arg Trp Gln Thr Pro Leu Ala His Met

290 295 300

Arg Arg Thr Ala Leu Gln Asp Thr Glu Leu Gly Gly Lys Ser Ile Arg

305 310 315 320

Lys Gly Asp Lys Val Ile Met Trp Tyr Val Ser Gly Asn Arg Asp Pro

325 330 335

Glu Ala Ile Glu Asn Pro Asp Ala Phe Ile Ile Asp Arg Ala Lys Pro

340 345 350

Arg His His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val Gly Asn

355 360 365

Arg Leu Ala Glu Leu Gln Leu Arg Ile Val Trp Glu Glu Leu Leu Lys

370 375 380

Arg Trp Pro Asn Pro Gly Gln Ile Glu Val Val Gly Ala Pro Glu Arg

385 390 395 400

Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val Arg Ile

405 410 415

Asn Ala

<210> 14

<211> 420

<212> PRT

<213> 分枝杆菌属物种 HXN-1500

<400> 14

Met Thr Glu Met Thr Val Ala Ala Ser Asp Ala Thr Asn Ala Ala Tyr

1 5 10 15

Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg

20 25 30

Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro

35 40 45

Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr

50 55 60

Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser

65 70 75 80

Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala

85 90 95

Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val

100 105 110

Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr

115 120 125

Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu

130 135 140

Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Glu Leu

145 150 155 160

Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg

165 170 175

Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly

180 185 190

Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys

195 200 205

Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro

210 215 220

Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His

225 230 235 240

Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly

245 250 255

Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu

260 265 270

Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu

275 280 285

Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser

290 295 300

His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His

305 310 315 320

Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg

325 330 335

Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala

340 345 350

Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val

355 360 365

Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile

370 375 380

Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro

385 390 395 400

Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val

405 410 415

Arg Ile Asn Ala

420

<210> 15

<211> 420

<212> PRT

<213> 南非分枝杆菌

<400> 15

Met Thr Glu Met Thr Val Ala Ala Asn Asp Ala Thr Asn Ala Ala Tyr

1 5 10 15

Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg

20 25 30

Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro

35 40 45

Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr

50 55 60

Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser

65 70 75 80

Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala

85 90 95

Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val

100 105 110

Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr

115 120 125

Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu

130 135 140

Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Asp Leu

145 150 155 160

Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg

165 170 175

Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly

180 185 190

Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys

195 200 205

Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro

210 215 220

Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His

225 230 235 240

Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly

245 250 255

Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu

260 265 270

Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu

275 280 285

Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser

290 295 300

His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His

305 310 315 320

Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg

325 330 335

Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala

340 345 350

Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val

355 360 365

Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile

370 375 380

Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro

385 390 395 400

Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val

405 410 415

Arg Ile Asn Ala

420

<210> 16

<211> 405

<212> PRT

<213> 极胞菌属物种JS666

<400> 16

Met Ser Glu Thr Val Ile Ile Ala Gly Ala Gly Gln Ala Ala Gly Gln

1 5 10 15

Ala Val Ala Ser Leu Arg Gln Glu Gly Phe Asp Gly Arg Ile Val Leu

20 25 30

Val Gly Ala Glu Pro Val Leu Pro Tyr Gln Arg Pro Pro Leu Ser Lys

35 40 45

Ala Phe Leu Ala Gly Thr Leu Pro Leu Glu Arg Leu Phe Leu Lys Pro

50 55 60

Pro Ala Phe Tyr Glu Gln Ala Arg Val Asp Thr Leu Leu Gly Val Ala

65 70 75 80

Val Thr Glu Leu Asp Ala Ala Arg Arg Gln Val Arg Leu Asp Asp Gly

85 90 95

Arg Glu Leu Ala Phe Asp His Leu Leu Leu Ala Thr Gly Gly Arg Ala

100 105 110

Arg Arg Leu Asp Cys Pro Gly Ala Asp His Pro Arg Leu His Tyr Leu

115 120 125

Arg Thr Val Ala Asp Val Asp Gly Ile Arg Ala Ala Leu Arg Pro Gly

130 135 140

Ala Arg Leu Val Leu Ile Gly Gly Gly Tyr Val Gly Leu Glu Ile Ala

145 150 155 160

Ala Val Ala Ala Lys Leu Gly Leu Ala Val Thr Val Leu Glu Ala Ala

165 170 175

Pro Thr Val Leu Ala Arg Val Thr Cys Pro Ala Val Ala Arg Phe Phe

180 185 190

Glu Ser Val His Arg Gln Ala Gly Val Thr Ile Arg Cys Ala Thr Thr

195 200 205

Val Ser Gly Ile Glu Gly Asp Ala Ser Leu Ala Arg Val Val Thr Gly

210 215 220

Asp Gly Glu Arg Ile Asp Ala Asp Leu Val Ile Ala Gly Ile Gly Leu

225 230 235 240

Leu Pro Asn Val Glu Leu Ala Gln Ala Ala Gly Leu Val Cys Asp Asn

245 250 255

Gly Ile Val Val Asp Glu Glu Cys Arg Thr Ser Val Pro Gly Ile Phe

260 265 270

Ala Ala Gly Asp Cys Thr Gln His Pro Asn Ala Ile Tyr Asp Ser Arg

275 280 285

Leu Arg Leu Glu Ser Val His Asn Ala Ile Glu Gln Gly Lys Thr Ala

290 295 300

Ala Ala Ala Met Cys Gly Lys Ala Arg Pro Tyr Arg Gln Val Pro Trp

305 310 315 320

Phe Trp Ser Asp Gln Tyr Asp Leu Lys Leu Gln Thr Ala Gly Leu Asn

325 330 335

Arg Gly Tyr Asp Gln Val Val Met Arg Gly Ser Thr Asp Asn Arg Ser

340 345 350

Phe Ala Ala Phe Tyr Leu Arg Asp Gly Arg Leu Leu Ala Val Asp Ala

355 360 365

Val Asn Arg Pro Val Glu Phe Met Val Ala Lys Ala Leu Ile Ala Asn

370 375 380

Arg Thr Val Ile Ala Pro Glu Arg Leu Ala Asp Glu Arg Ile Ala Ala

385 390 395 400

Lys Asp Leu Ala Gly

405

<210> 17

<211> 424

<212> PRT

<213> 分枝杆菌属物种HXN-1500

<400> 17

Met Ile His Thr Gly Val Thr Glu Ala Val Val Val Val Gly Ala Gly

1 5 10 15

Gln Ala Gly Ala Gln Thr Val Thr Ser Leu Arg Gln Arg Gly Phe Glu

20 25 30

Gly Gln Ile Thr Leu Leu Gly Asp Glu Pro Ala Leu Pro Tyr Gln Arg

35 40 45

Pro Pro Leu Ser Lys Ala Phe Leu Ala Gly Thr Leu Pro Leu Asp Arg

50 55 60

Leu Tyr Leu Arg Pro Ala Ala Phe Tyr Gln Gln Ala His Val Asp Val

65 70 75 80

Met Val Asp Thr Gly Val Ser Glu Leu Asp Thr Glu Asn Arg Arg Ile

85 90 95

Arg Leu Thr Asp Gly Arg Ala Ile Ser Phe Asp His Leu Val Leu Ala

100 105 110

Thr Gly Gly Arg Pro Arg Pro Leu Ala Cys Pro Gly Ala Asp His Pro

115 120 125

Arg Val His Tyr Leu Arg Thr Val Thr Asp Val Asp Arg Ile Arg Ser

130 135 140

Gln Phe His Pro Gly Thr Arg Leu Val Leu Val Gly Gly Gly Tyr Ile

145 150 155 160

Gly Leu Glu Ile Ala Ala Val Ala Ala Glu Leu Gly Leu Thr Val Thr

165 170 175

Val Leu Glu Ala Gln Thr Thr Val Leu Ala Arg Val Thr Cys Pro Thr

180 185 190

Val Ala Arg Phe Phe Glu His Thr His Arg Arg Ala Gly Val Thr Ile

195 200 205

Arg Cys Ala Thr Thr Val Thr Arg Ile His Asp Ser Ser Ser Thr Ala

210 215 220

Arg Ile Glu Leu Asp Ser Gly Glu Tyr Ile Asp Ala Asp Leu Val Ile

225 230 235 240

Val Gly Ile Gly Leu Leu Pro Asn Val Asp Leu Ala Ser Ala Ala Gly

245 250 255

Leu Thr Cys Glu Ser Gly Ile Val Val Asp Ser Arg Cys Gln Thr Ser

260 265 270

Ala Pro Gly Ile Tyr Ala Ala Gly Asp Cys Thr Gln Tyr Pro Ser Pro

275 280 285

Ile Tyr Gly Arg Pro Leu His Leu Glu Ser Val His Asn Ala Ile Glu

290 295 300

Gln Ala Lys Thr Ala Ala Ala Ala Ile Leu Gly Arg Asp Glu Pro Phe

305 310 315 320

Arg Gln Val Pro Trp Phe Trp Ser Asp Gln Tyr Asn Ile Lys Leu Gln

325 330 335

Thr Ala Gly Val Asn Glu Gly Tyr Asp Asp Val Ile Ile Arg Gly Asp

340 345 350

Pro Ala Ser Ala Ser Phe Ala Ala Phe Tyr Leu Arg Ala Gly Lys Leu

355 360 365

Leu Ala Val Asp Ala Ile Asn Arg Pro Arg Glu Phe Met Ala Ser Lys

370 375 380

Thr Leu Ile Ala Glu Arg Ala Glu Val Asp Pro Thr Gln Leu Ala Asp

385 390 395 400

Glu Ser Leu Pro Pro Thr Ala Leu Ala Ala Ala Val Asn Gly Pro Thr

405 410 415

Arg Ala Thr Ser Pro Thr Ser Leu

420

<210> 18

<211> 106

<212> PRT

<213> 极胞菌属物种 JS666

<400> 18

Met Thr Lys Val Thr Phe Ile Glu His Asn Gly Thr Val Arg Asn Val

1 5 10 15

Asp Val Asp Asp Gly Leu Ser Val Met Glu Ala Ala Val Asn Asn Leu

20 25 30

Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Ala Cys Ala Cys Ala Thr

35 40 45

Cys His Val His Ile Asp Ala Ala Trp Leu Asp Lys Leu Pro Pro Met

50 55 60

Glu Ala Met Glu Lys Ser Met Leu Glu Phe Ala Glu Gly Arg Asn Glu

65 70 75 80

Ser Ser Arg Leu Gly Cys Gln Ile Lys Leu Ser Pro Ala Leu Asp Gly

85 90 95

Ile Val Val Arg Thr Pro Leu Gly Gln His

100 105

<210> 19

<211> 106

<212> PRT

<213> 分枝杆菌属物种 HXN-1500

<400> 19

Met Pro Lys Ile Thr Tyr Ile Asp Tyr Thr Gly Thr Ser Arg Cys Val

1 5 10 15

Asp Ala Glu Asn Gly Met Ser Leu Met Glu Ile Ala Ile Asn Asn Asn

20 25 30

Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Glu Cys Ala Cys Ala Thr

35 40 45

Cys His Val His Val Asp Ala Asp Trp Leu Asp Lys Leu Pro Pro Ser

50 55 60

Ser Asp Gln Glu Val Ser Met Leu Glu Phe Cys Asp Gly Val Asp His

65 70 75 80

Thr Ser Arg Leu Gly Cys Gln Ile Lys Ile Cys Pro Thr Leu Asp Gly

85 90 95

Ile Val Val Arg Thr Pro Ala Ala Gln His

100 105

<210> 20

<211> 224

<212> PRT

<213> 枯草芽孢杆菌

<400> 20

Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu

1 5 10 15

Asn Glu Arg Phe Met Ser Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys

20 25 30

Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp

35 40 45

Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser

50 55 60

Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp

65 70 75 80

Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile

85 90 95

Cys Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys

100 105 110

Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr

115 120 125

Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr

130 135 140

His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly

145 150 155 160

Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly

165 170 175

Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys

180 185 190

Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His

195 200 205

Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu

210 215 220

<210> 21

<211> 222

<212> PRT

<213> 诺卡氏菌属物种NRRL 5646

<400> 21

Met Ile Glu Thr Ile Leu Pro Ala Gly Val Glu Ser Ala Glu Leu Leu

1 5 10 15

Glu Tyr Pro Glu Asp Leu Lys Ala His Pro Ala Glu Glu His Leu Ile

20 25 30

Ala Lys Ser Val Glu Lys Arg Arg Arg Asp Phe Ile Gly Ala Arg His

35 40 45

Cys Ala Arg Leu Ala Leu Ala Glu Leu Gly Glu Pro Pro Val Ala Ile

50 55 60

Gly Lys Gly Glu Arg Gly Ala Pro Ile Trp Pro Arg Gly Val Val Gly

65 70 75 80

Ser Leu Thr His Cys Asp Gly Tyr Arg Ala Ala Ala Val Ala His Lys

85 90 95

Met Arg Phe Arg Ser Ile Gly Ile Asp Ala Glu Pro His Ala Thr Leu

100 105 110

Pro Glu Gly Val Leu Asp Ser Val Ser Leu Pro Pro Glu Arg Glu Trp

115 120 125

Leu Lys Thr Thr Asp Ser Ala Leu His Leu Asp Arg Leu Leu Phe Cys

130 135 140

Ala Lys Glu Ala Thr Tyr Lys Ala Trp Trp Pro Leu Thr Ala Arg Trp

145 150 155 160

Leu Gly Phe Glu Glu Ala His Ile Thr Phe Glu Ile Glu Asp Gly Ser

165 170 175

Ala Asp Ser Gly Asn Gly Thr Phe His Ser Glu Leu Leu Val Pro Gly

180 185 190

Gln Thr Asn Asp Gly Gly Thr Pro Leu Leu Ser Phe Asp Gly Arg Trp

195 200 205

Leu Ile Ala Asp Gly Phe Ile Leu Thr Ala Ile Ala Tyr Ala

210 215 220

<210> 22

<211> 368

<212> PRT

<213> 海分枝杆菌

<400> 22

Met Pro Arg Glu Ile Arg Leu Pro Glu Ser Ser Val Val Val Arg Pro

1 5 10 15

Ala Pro Met Glu Ser Ala Thr Tyr Ser Gln Ser Ser Arg Leu Gln Ala

20 25 30

Ala Gly Leu Ser Pro Ala Ile Thr Leu Phe Glu Lys Ala Ala Gln Thr

35 40 45

Val Pro Leu Pro Asp Ala Pro Gln Pro Val Val Ile Ala Asp Tyr Gly

50 55 60

Val Ala Thr Gly His Asn Ser Leu Lys Pro Met Met Ala Ala Ile Asn

65 70 75 80

Ala Leu Arg Arg Arg Ile Arg Glu Asp Arg Ala Ile Met Val Ala His

85 90 95

Thr Asp Val Pro Asp Asn Asp Phe Thr Ala Leu Phe Arg Thr Leu Ala

100 105 110

Asp Asp Pro Asp Ser Tyr Leu His His Asp Ser Ala Ser Phe Ala Ser

115 120 125

Ala Val Gly Arg Ser Phe Tyr Thr Gln Ile Leu Pro Ser Asn Thr Val

130 135 140

Ser Leu Gly Trp Ser Ser Trp Ala Ile Gln Trp Leu Ser Arg Ile Pro

145 150 155 160

Ala Gly Ala Pro Glu Leu Thr Asp His Val Gln Val Ala Tyr Ser Lys

165 170 175

Asp Glu Arg Ala Arg Ala Ala Tyr Ala His Gln Ala Ala Thr Asp Trp

180 185 190

Gln Asp Phe Leu Ala Phe Arg Gly Arg Glu Leu Cys Pro Gly Gly Arg

195 200 205

Leu Val Val Leu Thr Met Ala Leu Asp Glu His Gly His Phe Gly Tyr

210 215 220

Arg Pro Met Asn Asp Ala Leu Val Ala Ala Leu Asn Asp Gln Val Arg

225 230 235 240

Asp Gly Leu Leu Arg Pro Glu Glu Leu Arg Arg Met Ala Ile Pro Val

245 250 255

Val Ala Arg Ala Glu Lys Asp Leu Arg Ala Pro Phe Ala Pro Arg Gly

260 265 270

Trp Phe Glu Gly Leu Thr Ile Glu Gln Leu Asp Val Phe Asn Ala Glu

275 280 285

Asp Arg Phe Trp Ala Ala Phe Gln Ser Asp Gly Asp Ala Glu Ser Phe

290 295 300

Gly Ala Gln Trp Ala Gly Phe Ala Arg Ala Ala Leu Phe Pro Thr Leu

305 310 315 320

Ala Ala Ala Leu Asp Cys Gly Thr Gly Asp Pro Arg Ala Thr Ala Phe

325 330 335

Ile Glu Gln Leu Glu Ala Ser Val Ala Asp Arg Leu Ala Ser Gln Pro

340 345 350

Glu Pro Met Arg Ile Pro Leu Ala Ser Leu Val Leu Ala Lys Arg Ala

355 360 365

<210> 23

<211> 360

<212> PRT

<213> 耻垢分枝杆菌

<400> 23

Met Pro Lys Phe Arg Val Ala Val Asp Pro Glu Pro Asp Asp Pro Thr

1 5 10 15

Pro Lys Met Arg Ala Pro Arg Pro His Ala Ala Gly Leu Asn Ser Ala

20 25 30

Ile Ala Leu Leu Glu Glu Ala Ala Arg Thr Val Pro Leu Pro Glu Ala

35 40 45

Pro Tyr Pro Ile Val Ile Ala Asp Tyr Gly Val Gly Thr Gly Arg Asn

50 55 60

Ser Met Arg Pro Ile Ala Ala Ala Ile Ala Ala Leu Arg Gly Arg Thr

65 70 75 80

Arg Pro Glu His Ser Val Leu Val Thr His Thr Asp Asn Ala Asp Asn

85 90 95

Asp Phe Thr Ala Val Phe Arg Gly Leu Ala Asp Asn Pro Asp Ser Tyr

100 105 110

Leu Arg Arg Asp Thr Ser Thr Tyr Pro Ser Ala Val Gly Arg Ser Phe

115 120 125

Tyr Thr Gln Ile Leu Pro Ser Lys Ser Val His Val Gly Trp Ser Ala

130 135 140

Trp Ala Ile Val Arg Val Gly Arg Met Pro Met Pro Val Pro Asp His

145 150 155 160

Val Ala Ala Ser Phe Ser Gly Asp Pro Gln Val Val Ala Ala Tyr Ala

165 170 175

Arg Gln Ala Ala Phe Asp Trp His Glu Phe Val Ala Phe Arg Gly Arg

180 185 190

Glu Leu Ala Ser Gly Ala Gln Leu Val Val Leu Thr Ala Ala Leu Gly

195 200 205

Asp Asp Gly Asp Phe Gly Tyr Arg Pro Leu Phe Ala Ala Val Met Asp

210 215 220

Thr Leu Arg Glu Leu Thr Ala Asp Gly Val Leu Arg Gln Asp Glu Leu

225 230 235 240

His Arg Met Ser Leu Pro Ile Val Gly Arg Arg Ala Asn Asp Phe Met

245 250 255

Ala Pro Phe Ala Pro Ser Gly Arg Phe Glu Arg Leu Ser Ile Ser His

260 265 270

Leu Glu Val Tyr Asp Ala Glu Asp Val Ile Tyr Ser Ser Tyr Gln Lys

275 280 285

Asp Arg Asp Thr Asp Val Phe Gly Leu Arg Trp Ala Asp Phe Cys Arg

290 295 300

Phe Thr Phe Phe Ser Asp Leu Cys Thr Ala Leu Asp Asp Asp Ala Ala

305 310 315 320

Arg Cys Thr Gln Phe Gln Asp Arg Leu His Ala Gly Ile Ala Ala Arg

325 330 335

Leu Ser Ala Gln Pro Glu Gln Met Arg Ile Pro Leu Ala Gln Leu Val

340 345 350

Leu Glu Arg Arg Arg Arg Ser Gly

355 360

<210> 24

<211> 394

<212> PRT

<213> 恶臭假单胞菌

<400> 24

Met Leu Ala Gln Leu Pro Pro Ala Leu Gln Ser Leu His Leu Pro Leu

1 5 10 15

Arg Leu Lys Leu Trp Asp Gly Asn Gln Phe Asp Leu Gly Pro Ser Pro

20 25 30

Gln Val Thr Ile Leu Val Lys Glu Pro Gln Leu Ile Gly Gln Leu Thr

35 40 45

His Pro Ser Met Glu Gln Leu Gly Thr Ala Phe Val Glu Gly Lys Leu

50 55 60

Glu Leu Glu Gly Asp Ile Gly Glu Ala Ile Arg Val Cys Asp Glu Leu

65 70 75 80

Ser Glu Ala Leu Phe Thr Asp Glu Asp Glu Gln Pro Pro Glu Arg Arg

85 90 95

Ser His Asp Lys Arg Thr Asp Ala Glu Ala Ile Ser Tyr His Tyr Asp

100 105 110

Val Ser Asn Ala Phe Tyr Gln Leu Trp Leu Asp Gln Asp Met Ala Tyr

115 120 125

Ser Cys Ala Tyr Phe Arg Glu Pro Asp Asn Thr Leu Asp Gln Ala Gln

130 135 140

Gln Asp Lys Phe Asp His Leu Cys Arg Lys Leu Arg Leu Asn Ala Gly

145 150 155 160

Asp Tyr Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Leu Ala Arg Phe

165 170 175

Ala Ala Arg Glu Tyr Asp Ala Lys Val Phe Gly Ile Thr Leu Ser Lys

180 185 190

Glu Gln Leu Lys Leu Gly Arg Gln Arg Val Lys Ala Glu Gly Leu Thr

195 200 205

Asp Lys Val Asp Leu Gln Ile Leu Asp Tyr Arg Asp Leu Pro Gln Asp

210 215 220

Gly Arg Phe Asp Lys Val Val Ser Val Gly Met Phe Glu His Val Gly

225 230 235 240

His Ala Asn Leu Ala Leu Tyr Cys Gln Lys Leu Phe Gly Ala Val Arg

245 250 255

Glu Gly Gly Leu Val Met Asn His Gly Ile Thr Ala Lys His Val Asp

260 265 270

Gly Arg Pro Val Gly Arg Gly Ala Gly Glu Phe Ile Asp Arg Tyr Val

275 280 285

Phe Pro His Gly Glu Leu Pro His Leu Ser Met Ile Ser Ala Ser Ile

290 295 300

Cys Glu Ala Gly Leu Glu Val Val Asp Val Glu Ser Leu Arg Leu His

305 310 315 320

Tyr Ala Lys Thr Leu His His Trp Ser Glu Asn Leu Glu Asn Gln Leu

325 330 335

His Lys Ala Ala Ala Leu Val Pro Glu Lys Thr Leu Arg Ile Trp Arg

340 345 350

Leu Tyr Leu Ala Gly Cys Ala Tyr Ala Phe Glu Lys Gly Trp Ile Asn

355 360 365

Leu His Gln Ile Leu Ala Val Lys Pro Tyr Ala Asp Gly His His Asp

370 375 380

Leu Pro Trp Thr Arg Glu Asp Met Tyr Arg

385 390

<210> 25

<211> 451

<212> PRT

<213> 酿酒酵母

<400> 25

Met Ser Glu Val Ser Lys Trp Pro Ala Ile Asn Pro Phe His Trp Gly

1 5 10 15

Tyr Asn Gly Thr Val Ser His Ile Val Gly Glu Asn Gly Ser Ile Lys

20 25 30

Leu His Leu Lys Asp Asn Lys Glu Gln Val Asp Phe Asp Glu Phe Ala

35 40 45

Asn Lys Tyr Val Pro Thr Leu Lys Asn Gly Ala Gln Phe Lys Leu Ser

50 55 60

Pro Tyr Leu Phe Thr Gly Ile Leu Gln Thr Leu Tyr Leu Gly Ala Ala

65 70 75 80

Asp Phe Ser Lys Lys Phe Pro Val Phe Tyr Gly Arg Glu Ile Val Lys

85 90 95

Phe Ser Asp Gly Gly Val Cys Thr Ala Asp Trp Leu Ile Asp Ser Trp

100 105 110

Lys Lys Asp Tyr Glu Phe Asp Gln Ser Thr Thr Ser Phe Asp Lys Lys

115 120 125

Lys Phe Asp Lys Asp Glu Lys Ala Thr His Pro Glu Gly Trp Pro Arg

130 135 140

Leu Gln Pro Arg Thr Arg Tyr Leu Lys Asp Asn Glu Leu Glu Glu Leu

145 150 155 160

Arg Glu Val Asp Leu Pro Leu Val Val Ile Leu His Gly Leu Ala Gly

165 170 175

Gly Ser His Glu Pro Ile Ile Arg Ser Leu Ala Glu Asn Leu Ser Arg

180 185 190

Ser Gly Arg Phe Gln Val Val Val Leu Asn Thr Arg Gly Cys Ala Arg

195 200 205

Ser Lys Ile Thr Thr Arg Asn Leu Phe Thr Ala Tyr His Thr Met Asp

210 215 220

Ile Arg Glu Phe Leu Gln Arg Glu Lys Gln Arg His Pro Asp Arg Lys

225 230 235 240

Leu Tyr Ala Val Gly Cys Ser Phe Gly Ala Thr Met Leu Ala Asn Tyr

245 250 255

Leu Gly Glu Glu Gly Asp Lys Ser Pro Leu Ser Ala Ala Ala Thr Leu

260 265 270

Cys Asn Pro Trp Asp Leu Leu Leu Ser Ala Ile Arg Met Ser Gln Asp

275 280 285

Trp Trp Ser Arg Thr Leu Phe Ser Lys Asn Ile Ala Gln Phe Leu Thr

290 295 300

Arg Thr Val Gln Val Asn Met Gly Glu Leu Gly Val Pro Asn Gly Ser

305 310 315 320

Leu Pro Asp His Pro Pro Thr Val Lys Asn Pro Ser Phe Tyr Met Phe

325 330 335

Thr Pro Glu Asn Leu Ile Lys Ala Lys Ser Phe Lys Ser Thr Arg Glu

340 345 350

Phe Asp Glu Val Tyr Thr Ala Pro Ala Leu Gly Phe Pro Asn Ala Met

355 360 365

Glu Tyr Tyr Lys Ala Ala Ser Ser Ile Asn Arg Val Asp Thr Ile Arg

370 375 380

Val Pro Thr Leu Val Ile Asn Ser Arg Asp Asp Pro Val Val Gly Pro

385 390 395 400

Asp Gln Pro Tyr Ser Ile Val Glu Lys Asn Pro Arg Ile Leu Tyr Cys

405 410 415

Arg Thr Asp Leu Gly Gly His Leu Ala Tyr Leu Asp Lys Asp Asn Asn

420 425 430

Ser Trp Ala Thr Lys Ala Ile Ala Glu Phe Phe Thr Lys Phe Asp Glu

435 440 445

Leu Val Val

450

<210> 26

<211> 382

<212> PRT

<213> 荧光假单胞菌

<400> 26

Met Gln Ile Gln Gly His Tyr Glu Leu Gln Phe Glu Ala Val Arg Glu

1 5 10 15

Ala Phe Ala Ala Leu Phe Asp Asp Pro Gln Glu Arg Gly Ala Gly Leu

20 25 30

Cys Ile Gln Ile Gly Gly Glu Thr Val Val Asp Leu Trp Ala Gly Thr

35 40 45

Ala Asp Lys Asp Gly Thr Glu Ala Trp His Ser Asp Thr Ile Val Asn

50 55 60

Leu Phe Ser Cys Thr Lys Thr Phe Thr Ala Val Thr Ala Leu Gln Leu

65 70 75 80

Val Ala Glu Gly Lys Leu Gln Leu Asp Ala Pro Val Ala Asn Tyr Trp

85 90 95

Pro Glu Phe Ala Ala Ala Gly Lys Glu Ala Ile Thr Leu Arg Gln Leu

100 105 110

Leu Cys His Gln Ala Gly Leu Pro Ala Ile Arg Glu Met Leu Pro Thr

115 120 125

Glu Ala Leu Tyr Asp Trp Arg Leu Met Val Asp Thr Leu Ala Ala Glu

130 135 140

Ala Pro Trp Trp Thr Pro Gly Gln Gly His Gly Tyr Glu Ala Ile Thr

145 150 155 160

Tyr Gly Trp Leu Val Gly Glu Leu Leu Arg Arg Ala Asp Gly Arg Gly

165 170 175

Pro Gly Glu Ser Ile Val Ala Arg Val Ala Arg Pro Leu Gly Leu Asp

180 185 190

Phe His Val Gly Leu Ala Asp Glu Glu Phe Tyr Arg Val Ala His Ile

195 200 205

Ala Arg Ser Lys Gly Asn Met Gly Asp Glu Ala Ala Gln Arg Leu Leu

210 215 220

Gln Val Met Met Arg Glu Pro Thr Ala Met Thr Thr Arg Ala Phe Ala

225 230 235 240

Asn Pro Pro Ser Ile Leu Thr Ser Thr Asn Lys Pro Glu Trp Arg Arg

245 250 255

Met Gln Gln Pro Ala Ala Asn Gly His Gly Asn Ala Arg Ser Leu Ala

260 265 270

Gly Phe Tyr Ser Gly Leu Leu Asp Gly Ser Leu Leu Glu Ala Asp Met

275 280 285

Leu Glu Gln Leu Thr Arg Glu His Ser Ile Gly Pro Asp Lys Thr Leu

290 295 300

Leu Thr Gln Thr Arg Phe Gly Leu Gly Cys Met Leu Asp Gln Gln Pro

305 310 315 320

Gln Leu Pro Asn Ala Thr Phe Gly Leu Gly Pro Arg Ala Phe Gly His

325 330 335

Pro Arg Ser Ala Pro Val Val Arg Trp Val Leu Pro Glu His Asp Val

340 345 350

Ala Phe Gly Phe Val Thr Asn Thr Leu Gly Pro Tyr Val Leu Met Asp

355 360 365

Pro Arg Ala Gln Lys Leu Val Gly Ile Leu Ala Gly Cys Leu

370 375 380

<210> 27

<211> 402

<212> PRT

<213> 恶臭假单胞菌

<400> 27

Met Asn Gly Lys Ser Ser Val Leu Asp Ser Ala Pro Glu Tyr Val Asp

1 5 10 15

Lys Lys Lys Tyr Phe Trp Ile Leu Ser Thr Phe Trp Pro Ala Thr Pro

20 25 30

Met Ile Gly Ile Trp Leu Ala Asn Glu Thr Gly Trp Gly Ile Phe Tyr

35 40 45

Gly Leu Val Leu Ala Val Trp Tyr Gly Val Leu Pro Leu Leu Asp Ala

50 55 60

Met Phe Gly Glu Asp Phe Asn Asn Pro Pro Glu Glu Val Val Glu Lys

65 70 75 80

Leu Glu Lys Glu Arg Tyr Tyr Arg Val Leu Thr Tyr Leu Thr Val Pro

85 90 95

Met His Tyr Ala Ala Leu Ile Val Ser Ala Trp Trp Val Gly Thr Gln

100 105 110

Ser Met Ser Trp Phe Glu Ile Val Ala Leu Ala Leu Ser Leu Gly Ile

115 120 125

Val Asn Gly Leu Ala Leu Asn Thr Gly His Glu Leu Gly His Lys Lys

130 135 140

Glu Ala Phe Asp Arg Trp Met Ala Lys Ile Val Leu Ala Val Val Gly

145 150 155 160

Tyr Gly His Phe Phe Ile Glu His Asn Lys Gly His His Arg Asp Val

165 170 175

Ala Thr Pro Met Asp Pro Ala Thr Ser Arg Met Gly Glu Asn Ile Tyr

180 185 190

Lys Phe Ser Thr Arg Glu Ile Pro Gly Ala Phe Arg Arg Ala Trp Gly

195 200 205

Leu Glu Glu Gln Arg Leu Ser Arg Arg Gly Gln Ser Val Trp Ser Phe

210 215 220

Asp Asn Glu Ile Leu Gln Pro Met Val Ile Thr Val Val Leu Tyr Thr

225 230 235 240

Leu Leu Leu Ala Phe Phe Gly Pro Lys Met Leu Val Phe Leu Pro Ile

245 250 255

Gln Met Ala Phe Gly Trp Trp Gln Leu Thr Ser Ala Asn Tyr Ile Glu

260 265 270

His Tyr Gly Leu Leu Arg Glu Lys Met Ala Asp Gly Arg Tyr Glu His

275 280 285

Gln Lys Pro His His Ser Trp Asn Ser Asn His Ile Val Ser Asn Leu

290 295 300

Val Leu Phe His Leu Gln Arg His Ser Asp His His Ala His Pro Thr

305 310 315 320

Arg Ser Tyr Gln Ser Leu Arg Asp Phe Pro Gly Leu Pro Ala Leu Pro

325 330 335

Thr Gly Tyr Pro Gly Ala Phe Leu Met Ala Met Ile Pro Gln Trp Phe

340 345 350

Arg Ser Val Met Asp Pro Lys Val Val Asn Trp Ala Asn Gly Asp Leu

355 360 365

Ser Lys Ile Gln Ile Glu Asp Ser Met Arg Ala Glu Tyr Ile Lys Lys

370 375 380

Phe Thr His Asn Val Gly Ala Asp Asp Lys Arg Gly Ala Thr Ala Val

385 390 395 400

Ala Ser

<210> 28

<211> 523

<212> PRT

<213> 麦芽糖假丝酵母

<400> 28

Met Ala Ile Glu Gln Ile Ile Glu Glu Val Leu Pro Tyr Leu Thr Lys

1 5 10 15

Trp Tyr Thr Ile Leu Phe Gly Ala Ala Val Thr Tyr Phe Leu Ser Ile

20 25 30

Ala Leu Arg Asn Lys Phe Tyr Glu Tyr Lys Leu Lys Cys Glu Asn Pro

35 40 45

Val Tyr Phe Glu Asp Ala Gly Leu Phe Gly Ile Pro Ala Leu Ile Asp

50 55 60

Ile Ile Lys Val Arg Lys Ala Gly Gln Leu Ala Asp Tyr Thr Asp Thr

65 70 75 80

Thr Phe Asp Lys Tyr Pro Asn Leu Ser Ser Tyr Met Thr Val Ala Gly

85 90 95

Val Leu Lys Ile Val Phe Thr Val Asp Pro Glu Asn Ile Lys Ala Val

100 105 110

Leu Ala Thr Gln Phe Asn Asp Phe Ala Leu Gly Ala Arg His Ala His

115 120 125

Phe Asp Pro Leu Leu Gly Asp Gly Ile Phe Thr Leu Asp Gly Glu Gly

130 135 140

Trp Lys Leu Ser Arg Ala Met Leu Arg Pro Gln Phe Ala Arg Glu Gln

145 150 155 160

Ile Ala His Val Lys Ala Leu Glu Pro His Val Gln Ile Leu Ala Lys

165 170 175

Gln Ile Lys Leu Asn Lys Gly Lys Thr Phe Asp Leu Gln Glu Leu Phe

180 185 190

Phe Arg Phe Thr Val Asp Thr Ala Thr Glu Phe Leu Phe Gly Glu Ser

195 200 205

Val His Ser Leu Tyr Asp Glu Lys Leu Gly Ile Pro Ala Pro Asn Asp

210 215 220

Ile Pro Gly Arg Glu Asn Phe Ala Glu Ala Phe Asn Thr Ser Gln His

225 230 235 240

Tyr Leu Ala Thr Arg Thr Tyr Ser Gln Ile Phe Tyr Trp Leu Thr Asn

245 250 255

Pro Lys Glu Phe Arg Asp Cys Asn Ala Lys Val His Lys Leu Ala Gln

260 265 270

Tyr Phe Val Asn Thr Ala Leu Asn Ala Thr Glu Lys Glu Val Glu Glu

275 280 285

Lys Ser Lys Gly Gly Tyr Val Phe Leu Tyr Glu Leu Val Lys Gln Thr

290 295 300

Arg Asp Pro Lys Val Leu Gln Asp Gln Leu Leu Asn Ile Met Val Ala

305 310 315 320

Gly Arg Asp Thr Thr Ala Gly Leu Leu Ser Phe Ala Met Phe Glu Leu

325 330 335

Ala Arg Asn Pro Lys Ile Trp Asn Lys Leu Arg Glu Glu Val Glu Val

340 345 350

Asn Phe Gly Leu Gly Asp Glu Ala Arg Val Asp Glu Ile Ser Phe Glu

355 360 365

Thr Leu Lys Lys Cys Glu Tyr Leu Lys Ala Val Leu Asn Glu Thr Leu

370 375 380

Arg Met Tyr Pro Ser Val Pro Ile Asn Phe Arg Thr Ala Thr Arg Asp

385 390 395 400

Thr Thr Leu Pro Arg Gly Gly Gly Lys Asp Gly Asn Ser Pro Ile Phe

405 410 415

Val Pro Lys Gly Ser Ser Val Val Tyr Ser Val Tyr Lys Thr His Arg

420 425 430

Leu Lys Gln Phe Tyr Gly Glu Asp Ala Tyr Glu Phe Arg Pro Glu Arg

435 440 445

Trp Phe Glu Pro Ser Thr Arg Lys Leu Gly Trp Ala Tyr Leu Pro Phe

450 455 460

Asn Gly Gly Pro Arg Ile Cys Leu Gly Gln Gln Phe Ala Leu Thr Glu

465 470 475 480

Ala Ser Tyr Val Ile Ala Arg Leu Ala Gln Met Phe Glu His Leu Glu

485 490 495

Ser Lys Asp Glu Thr Tyr Pro Pro Asn Lys Cys Ile His Leu Thr Met

500 505 510

Asn His Asn Glu Gly Val Phe Ile Ser Ala Lys

515 520

<210> 29

<211> 464

<212> PRT

<213> 肠沙门氏菌肠亚种鼠伤寒血清型

<400> 29

Met Asn Thr Ser Glu Leu Glu Thr Leu Ile Arg Thr Ile Leu Ser Glu

1 5 10 15

Gln Leu Thr Thr Pro Ala Gln Thr Pro Val Gln Pro Gln Gly Lys Gly

20 25 30

Ile Phe Gln Ser Val Ser Glu Ala Ile Asp Ala Ala His Gln Ala Phe

35 40 45

Leu Arg Tyr Gln Gln Cys Pro Leu Lys Thr Arg Ser Ala Ile Ile Ser

50 55 60

Ala Met Arg Gln Glu Leu Thr Pro Leu Leu Ala Pro Leu Ala Glu Glu

65 70 75 80

Ser Ala Asn Glu Thr Gly Met Gly Asn Lys Glu Asp Lys Phe Leu Lys

85 90 95

Asn Lys Ala Ala Leu Asp Asn Thr Pro Gly Val Glu Asp Leu Thr Thr

100 105 110

Thr Ala Leu Thr Gly Asp Gly Gly Met Val Leu Phe Glu Tyr Ser Pro

115 120 125

Phe Gly Val Ile Gly Ser Val Ala Pro Ser Thr Asn Pro Thr Glu Thr

130 135 140

Ile Ile Asn Asn Ser Ile Ser Met Leu Ala Ala Gly Asn Ser Ile Tyr

145 150 155 160

Phe Ser Pro His Pro Gly Ala Lys Lys Val Ser Leu Lys Leu Ile Ser

165 170 175

Leu Ile Glu Glu Ile Ala Phe Arg Cys Cys Gly Ile Arg Asn Leu Val

180 185 190

Val Thr Val Ala Glu Pro Thr Phe Glu Ala Thr Gln Gln Met Met Ala

195 200 205

His Pro Arg Ile Ala Val Leu Ala Ile Thr Gly Gly Pro Gly Ile Val

210 215 220

Ala Met Gly Met Lys Ser Gly Lys Lys Val Ile Gly Ala Gly Ala Gly

225 230 235 240

Asn Pro Pro Cys Ile Val Asp Glu Thr Ala Asp Leu Val Lys Ala Ala

245 250 255

Glu Asp Ile Ile Asn Gly Ala Ser Phe Asp Tyr Asn Leu Pro Cys Ile

260 265 270

Ala Glu Lys Ser Leu Ile Val Val Glu Ser Val Ala Glu Arg Leu Val

275 280 285

Gln Gln Met Gln Thr Phe Gly Ala Leu Leu Leu Ser Pro Ala Asp Thr

290 295 300

Asp Lys Leu Arg Ala Val Cys Leu Pro Glu Gly Gln Ala Asn Lys Lys

305 310 315 320

Leu Val Gly Lys Ser Pro Ser Ala Met Leu Glu Ala Ala Gly Ile Ala

325 330 335

Val Pro Ala Lys Ala Pro Arg Leu Leu Ile Ala Leu Val Asn Ala Asp

340 345 350

Asp Pro Trp Val Thr Ser Glu Gln Leu Met Pro Met Leu Pro Val Val

355 360 365

Lys Val Ser Asp Phe Asp Ser Ala Leu Ala Leu Ala Leu Lys Val Glu

370 375 380

Glu Gly Leu His His Thr Ala Ile Met His Ser Gln Asn Val Ser Arg

385 390 395 400

Leu Asn Leu Ala Ala Arg Thr Leu Gln Thr Ser Ile Phe Val Lys Asn

405 410 415

Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Thr

420 425 430

Phe Thr Ile Ala Thr Pro Thr Gly Glu Gly Thr Thr Ser Ala Arg Thr

435 440 445

Phe Ala Arg Ser Arg Arg Cys Val Leu Thr Asn Gly Phe Ser Ile Arg

450 455 460

<210> 30

<211> 471

<212> PRT

<213> 少动鞘氨醇单胞菌

<400> 30

Met Ser Thr Pro Thr Asn Leu Glu Gln Val Leu Ala Ala Gly Gly Asn

1 5 10 15

Thr Val Glu Met Leu Arg Asn Ser Gln Ile Gly Ala Tyr Val Tyr Pro

20 25 30

Val Val Ala Pro Glu Phe Ser Asn Trp Arg Thr Glu Gln Trp Ala Trp

35 40 45

Arg Asn Ser Ala Val Leu Phe Asp Gln Thr His His Met Val Asp Leu

50 55 60

Tyr Ile Arg Gly Lys Asp Ala Leu Lys Leu Leu Ser Asp Thr Met Ile

65 70 75 80

Asn Ser Pro Lys Gly Trp Glu Pro Asn Lys Ala Lys Gln Tyr Val Pro

85 90 95

Val Thr Pro Tyr Gly His Val Ile Gly Asp Gly Ile Ile Phe Tyr Leu

100 105 110

Ala Glu Glu Glu Phe Val Tyr Val Gly Arg Ala Pro Ala Ala Asn Trp

115 120 125

Leu Met Tyr His Ala Gln Thr Gly Gly Tyr Asn Val Asp Ile Val His

130 135 140

Asp Asp Arg Ser Pro Ser Arg Pro Met Gly Lys Pro Val Gln Arg Ile

145 150 155 160

Ser Trp Arg Phe Gln Ile Gln Gly Pro Lys Ala Trp Asp Val Ile Glu

165 170 175

Lys Leu His Gly Gly Thr Leu Glu Lys Leu Lys Phe Phe Asn Met Ala

180 185 190

Glu Met Asn Ile Ala Gly Met Lys Ile Arg Thr Leu Arg His Gly Met

195 200 205

Ala Gly Ala Pro Gly Leu Glu Ile Trp Gly Pro Tyr Glu Thr Gln Glu

210 215 220

Lys Ala Arg Asn Ala Ile Leu Glu Ala Gly Lys Glu Phe Gly Leu Ile

225 230 235 240

Pro Val Gly Ser Arg Ala Tyr Pro Ser Asn Thr Leu Glu Ser Gly Trp

245 250 255

Ile Pro Ser Pro Leu Pro Ala Ile Tyr Thr Gly Asp Lys Leu Lys Ala

260 265 270

Tyr Arg Glu Trp Leu Pro Ala Asn Ser Tyr Glu Ala Ser Gly Ala Ile

275 280 285

Gly Gly Ser Phe Val Ser Ser Asn Ile Glu Asp Tyr Tyr Val Asn Pro

290 295 300

Tyr Glu Ile Gly Tyr Gly Pro Phe Val Lys Phe Asp His Asp Phe Ile

305 310 315 320

Gly Arg Asp Ala Leu Glu Ala Ile Asp Pro Ala Thr Gln Arg Lys Lys

325 330 335

Val Thr Leu Ala Trp Asn Gly Asp Asp Met Ala Lys Ile Tyr Ala Ser

340 345 350

Leu Phe Asp Thr Glu Ala Asp Ala His Tyr Lys Phe Phe Asp Leu Pro

355 360 365

Leu Ala Asn Tyr Ala Asn Thr Asn Ala Asp Ala Val Leu Asp Ala Ala

370 375 380

Gly Asn Val Val Gly Met Ser Met Phe Thr Gly Tyr Ser Tyr Asn Glu

385 390 395 400

Lys Arg Ala Leu Ser Leu Ala Thr Ile Asp His Glu Ile Pro Val Gly

405 410 415

Thr Glu Leu Thr Val Leu Trp Gly Glu Glu Asn Gly Gly Thr Arg Lys

420 425 430

Thr Thr Val Glu Pro His Lys Gln Met Ala Val Arg Ala Val Val Ser

435 440 445

Pro Val Pro Tyr Ser Val Thr Ala Arg Glu Thr Tyr Glu Gly Gly Trp

450 455 460

Arg Lys Ala Ala Val Thr Ala

465 470

<210> 31

<211> 462

<212> PRT

<213> 少动鞘氨醇单胞菌

<400> 31

Met Ala Lys Ser Leu Gln Asp Val Leu Asp Asn Ala Gly Asn Ala Val

1 5 10 15

Asp Phe Leu Arg Asn Gln Gln Thr Gly Pro Asn Val Tyr Pro Gly Val

20 25 30

Pro Ala Glu Tyr Ser Asn Trp Arg Asn Glu Gln Arg Ala Trp Ala Lys

35 40 45

Thr Ala Val Leu Phe Asn Gln Ser Tyr His Met Val Glu Leu Met Val

50 55 60

Glu Gly Pro Asp Ala Phe Ala Phe Leu Asn Tyr Leu Gly Ile Asn Ser

65 70 75 80

Phe Lys Asn Phe Ala Pro Gly Lys Ala Lys Gln Trp Val Pro Val Thr

85 90 95

Ala Glu Gly Tyr Val Ile Gly Asp Val Ile Leu Phe Tyr Leu Ala Glu

100 105 110

Asn Gln Phe Asn Leu Val Gly Arg Ala Pro Ala Ile Glu Trp Ala Glu

115 120 125

Phe His Ala Ala Thr Gly Lys Trp Asn Val Thr Leu Thr Arg Asp Glu

130 135 140

Arg Thr Ala Leu Arg Thr Asp Gly Val Arg Arg His Tyr Arg Phe Gln

145 150 155 160

Leu Gln Gly Pro Asn Ala Met Ala Ile Leu Thr Asp Ala Met Gly Gln

165 170 175

Thr Pro Pro Asp Leu Lys Phe Phe Asn Met Ala Asp Ile Gln Ile Ala

180 185 190

Gly Lys Thr Val Gly Ala Leu Arg His Gly Met Ala Gly Gln Pro Gly

195 200 205

Tyr Glu Leu Tyr Gly Pro Trp Ala Asp Tyr Glu Ala Val His Ser Ala

210 215 220

Leu Val Ala Ala Gly Lys Asn His Gly Leu Ala Leu Val Gly Gly Arg

225 230 235 240

Ala Tyr Ser Ser Asn Thr Leu Glu Ser Gly Trp Val Pro Ser Pro Phe

245 250 255

Pro Gly Tyr Leu Phe Gly Glu Gly Ser Ala Asp Phe Arg Lys Trp Ala

260 265 270

Gly Glu Asn Ser Tyr Gly Ala Lys Cys Ser Ile Gly Gly Ser Tyr Val

275 280 285

Pro Glu Ser Leu Glu Gly Tyr Gly Leu Thr Pro Trp Asp Ile Gly Tyr

290 295 300

Gly Ile Ile Val Lys Phe Asp His Asp Phe Ile Gly Lys Glu Ala Leu

305 310 315 320

Glu Lys Met Ala Asn Glu Pro His Leu Glu Lys Val Thr Leu Ala Leu

325 330 335

Asp Asp Glu Asp Met Leu Arg Val Met Ser Ser Tyr Phe Ser Asp Ser

340 345 350

Gly Arg Ala Lys Tyr Phe Glu Phe Pro Ser Ala Val Tyr Ser Met His

355 360 365

Pro Tyr Asp Ser Val Leu Val Asp Gly Lys His Val Gly Val Ser Thr

370 375 380

Trp Val Gly Tyr Ser Ser Asn Glu Gly Lys Met Leu Thr Leu Ala Met

385 390 395 400

Ile Asp Pro Lys Tyr Ala Lys Pro Gly Thr Glu Val Ser Leu Leu Trp

405 410 415

Gly Glu Pro Asn Gly Gly Thr Ser Lys Pro Thr Val Glu Pro His Glu

420 425 430

Gln Thr Glu Ile Lys Ala Val Val Ala Pro Val Pro Tyr Ser Ala Val

435 440 445

Ala Arg Thr Gly Tyr Ala Asp Ser Trp Arg Thr Lys Lys Ala

450 455 460

<210> 32

<211> 246

<212> PRT

<213> 短乳杆菌

<400> 32

Met Ala Ala Asn Glu Phe Ser Glu Thr His Arg Val Val Tyr Tyr Glu

1 5 10 15

Ala Asp Asp Thr Gly Gln Leu Thr Leu Ala Met Leu Ile Asn Leu Phe

20 25 30

Val Leu Val Ser Glu Asp Gln Asn Asp Ala Leu Gly Leu Ser Thr Ala

35 40 45

Phe Val Gln Ser His Gly Val Gly Trp Val Val Thr Gln Tyr His Leu

50 55 60

His Ile Asp Glu Leu Pro Arg Thr Gly Ala Gln Val Thr Ile Lys Thr

65 70 75 80

Arg Ala Thr Ala Tyr Asn Arg Tyr Phe Ala Tyr Arg Glu Tyr Trp Leu

85 90 95

Leu Asp Asp Ala Gly Gln Val Leu Ala Tyr Gly Glu Gly Ile Trp Val

100 105 110

Thr Met Ser Tyr Ala Thr Arg Lys Ile Thr Thr Ile Pro Ala Glu Val

115 120 125

Met Ala Pro Tyr His Ser Glu Glu Gln Thr Arg Leu Pro Arg Leu Pro

130 135 140

Arg Pro Asp His Phe Asp Glu Ala Val Asn Gln Thr Leu Lys Pro Tyr

145 150 155 160

Thr Val Arg Tyr Phe Asp Ile Asp Gly Asn Gly His Val Asn Asn Ala

165 170 175

His Tyr Phe Asp Trp Met Leu Asp Val Leu Pro Ala Thr Phe Leu Arg

180 185 190

Ala His His Pro Thr Asp Val Lys Ile Arg Phe Glu Asn Glu Val Gln

195 200 205

Tyr Gly His Gln Val Thr Ser Glu Leu Ser Gln Ala Ala Ala Leu Thr

210 215 220

Thr Gln His Met Ile Lys Val Gly Asp Leu Thr Ala Val Lys Ala Thr

225 230 235 240

Ile Gln Trp Asp Asn Arg

245

<210> 33

<211> 261

<212> PRT

<213> 植物乳杆菌

<400> 33

Met Ala Thr Leu Gly Ala Asn Ala Ser Leu Tyr Ser Glu Gln His Arg

1 5 10 15

Ile Thr Tyr Tyr Glu Cys Asp Arg Thr Gly Arg Ala Thr Leu Thr Thr

20 25 30

Leu Ile Asp Ile Ala Val Leu Ala Ser Glu Asp Gln Ser Asp Ala Leu

35 40 45

Gly Leu Thr Thr Glu Met Val Gln Ser His Gly Val Gly Trp Val Val

50 55 60

Thr Gln Tyr Ala Ile Asp Ile Thr Arg Met Pro Arg Gln Asp Glu Val

65 70 75 80

Val Thr Ile Ala Val Arg Gly Ser Ala Tyr Asn Pro Tyr Phe Ala Tyr

85 90 95

Arg Glu Phe Trp Ile Arg Asp Ala Asp Gly Gln Gln Leu Ala Tyr Ile

100 105 110

Thr Ser Ile Trp Val Met Met Ser Gln Thr Thr Arg Arg Ile Val Lys

115 120 125

Ile Leu Pro Glu Leu Val Ala Pro Tyr Gln Ser Glu Val Val Lys Arg

130 135 140

Ile Pro Arg Leu Pro Arg Pro Ile Ser Phe Glu Ala Thr Asp Thr Thr

145 150 155 160

Ile Thr Lys Pro Tyr His Val Arg Phe Phe Asp Ile Asp Pro Asn Arg

165 170 175

His Val Asn Asn Ala His Tyr Phe Asp Trp Leu Val Asp Thr Leu Pro

180 185 190

Ala Thr Phe Leu Leu Gln His Asp Leu Val His Val Asp Val Arg Tyr

195 200 205

Glu Asn Glu Val Lys Tyr Gly Gln Thr Val Thr Ala His Ala Asn Ile

210 215 220

Leu Pro Ser Glu Val Ala Asp Gln Val Thr Thr Ser His Leu Ile Glu

225 230 235 240

Val Asp Asp Glu Lys Cys Cys Glu Val Thr Ile Gln Trp Arg Thr Leu

245 250 255

Pro Glu Pro Ile Gln

260

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1