本申请要求于2014年6月16日提交的美国临时申请序列号62/012,659,于2014年6月16日提交的62/012,666和于2014年6月16日提交的62/012,604的权益,其全部内容通过引用并入本文。
技术领域
本发明涉及使用一种或多种分离的酶(如脂肪酸O-甲基转移酶,醇O-乙酰转移酶和单加氧酶)生物合成6-羟基己酸甲酯和己酸己酯的方法,以及表达一种或多种此类酶的重组宿主细胞。本发明还涉及使用一种或多种酶,如酯酶,单加氧酶和脱甲基酶将6-羟基己酸甲酯和己酸己酯酶促转化为6-羟基己酸和1,6-己二醇的方法。此外,本发明涉及将6-羟基己酸和/或1,6-己二醇酶促转化为己二酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇(以下称为“C6构件块”)和产生此类C6构件块的重组宿主。
发明背景
尼龙是聚酰胺,其一般通过二胺与二羧酸的缩合聚合(condensation polymerization)合成。类似地,可以通过内酰胺的缩合聚合生成尼龙。一种普遍存在的尼龙是尼龙6,6,其通过六亚甲基二胺(HMD)和己二酸的缩合聚合生成。可以通过己内酰胺的开环聚合生成尼龙6(Anton&Baird,Polyamides Fibers,Encyclopedia of Polymer Science and Technology,2001)。
生物技术通过生物催化提供了石油化学方法的备选方法。生物催化是使用生物催化剂,如酶,来进行有机化合物的生物化学转化。
生物衍生的原料和石油化学原料两者都是用于生物催化过程的可行的起始材料。
因而,针对此背景,清楚的是需要用于生产己二酸,6-羟基己酸,6-氨基己酸,六亚甲基二胺和1,6-己二醇(下文称为“C6构件块”)中的一种或多种的可持续的方法,其中所述方法是基于生物催化的。
然而,无野生型原核生物或真核生物天然过度生成或分泌C6构件块到细胞外环境。但是,己二酸的代谢已有报道。
许多细菌和酵母经由β-氧化将二羧酸己二酸作为碳源高效转化为中心代谢产物。辅酶A(CoA)活化的己二酸至CoA活化的3-氧代己二酸的β-氧化通过例如与芳族底物降解相关的途径促进进一步的分解代谢。已经全面地表征通过几种细菌将3-氧代己二酰基-CoA分解代谢成乙酰基-CoA和琥珀酰基-CoA。
最优性原理叙述,微生物调节它们的生物化学网络来支持最大生物质(biomass)生长。超出在宿主生物体中表达异源途径的需要,将碳通量引导到充当碳源的C6构件块而非生物质生长组分与最优性原理矛盾。例如,将1-丁醇途径从梭菌属(Clostridium)物种转移至其它生产菌株与天然生产者的生产性能相比经常相差一个数量级(Shen等人,Appl.Environ.Microbiol.,2011,77(9):2905–2915)。
七碳脂肪族主链前体的有效合成是在C6脂肪族主链上形成末端官能团,如羧基,胺或羟基基团前合成一个或多个C6构件块的关键考虑。
发明概述
本文件至少部分地基于以下发现:可以构建用于产生七碳链脂肪族主链前体的生物化学途径,其中可以形成一个或两个官能团,即羧基,胺或羟基,从而导致己二酸,6-氨基己酸,6-羟基己酸,六亚甲基二胺和1,6-己二醇(下文称为“C6构件块”)中的一种或多种的合成。己二酸和己二酸盐(酯),6-羟基己酸和6-羟基己酸盐(酯),以及6-氨基己酸和6-氨基己酸盐(酯)在本文中可互换使用,是指任何其中性或离子化形式的相关化合物,包括其任何盐形式。本领域技术人员应当理解,具体形式将取决于pH。
本领域技术人员理解,当存在于亲本化合物中的酸性质子被金属离子,例如碱金属离子,碱土金属离子或铝离子替代;或与有机碱配位时,含有羧酸基团的化合物(包括但不限于有机一元酸,羟基酸,氨基酸和二羧酸)形成或转化成其离子盐形式。可接受的有机碱包括但不限于乙醇胺,二乙醇胺,三乙醇胺,氨丁三醇,N-甲基葡糖胺等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等。将本发明的盐分离为盐或通过经由添加酸或用酸性离子交换树脂处理将pH降至pKa以下而转化成游离酸。
本领域技术人员理解,含有胺基团的化合物(包括但不限于有机胺,氨基酸和二胺)形成或转化为它们的离子盐形式,例如通过向胺中加入酸性质子形成铵盐,与无机酸如盐酸,氢溴酸,硫酸,硝酸,磷酸等形成;或与有机酸形成,包括但不限于乙酸,丙酸,己酸,环戊烷丙酸,乙醇酸,丙酮酸,乳酸,丙二酸,琥珀酸,苹果酸,马来酸,富马酸,酒石酸,柠檬酸,苯甲酸,3-(4-羟基苯甲酰基)苯甲酸,肉桂酸,扁桃酸,甲磺酸,乙磺酸,1,2-乙二磺酸,2-羟基乙磺酸,苯磺酸,2-萘磺酸,4-甲基双环-[2.2.2]辛-2-烯-1-羧酸,葡庚糖酸,4,4'-亚甲基双-(3-羟基-2-烯-1-羧酸),3-苯基丙酸,三甲基乙酸,叔丁基乙酸,月桂基硫酸,葡糖酸,谷氨酸,羟基萘甲酸,水杨酸,硬脂酸,粘康酸等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等。本发明的盐以盐的形式分离或通过经由添加碱或用碱性离子交换树脂处理将pH至高于pKb转化成游离胺。
本领域技术人员理解,含有胺基团和羧酸基团两者的化合物(包括但不限于氨基酸)通过以下形成或转化成它们的离子盐形式:通过1)与无机酸形成的酸加成盐,所述无机酸包括但不限于盐酸,氢溴酸,硫酸,硝酸,磷酸等;或与有机酸形成的酸加成盐,所述有机酸包括但不限于乙酸,丙酸,己酸,环戊烷丙酸,乙醇酸,丙酮酸,乳酸,丙二酸,琥珀酸,苹果酸,马来酸,富马酸,酒石酸,柠檬酸,苯甲酸,3-(4-羟基苯甲酰基)苯甲酸,肉桂酸,扁桃酸,甲磺酸,乙磺酸,1,2-乙二磺酸,2-羟基乙磺酸,苯磺酸,2-萘磺酸,4-甲基双环-[2.2.2]辛-2-烯-1-羧酸,葡庚糖酸,4,4'-亚甲基双-(3-羟基-2-烯-1-羧酸),3-苯基丙酸,三甲基乙酸酸,叔丁基乙酸,月桂基硫酸,葡糖酸,谷氨酸,羟基萘甲酸,水杨酸,硬脂酸,粘康酸等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等,或2)当存在于亲本化合物中的酸性质子被金属离子,例如碱金属离子,碱土金属离子或铝离子置换时;或与有机碱配位。可接受的有机碱包括但不限于乙醇胺,二乙醇胺,三乙醇胺,氨丁三醇,N-甲基葡糖胺等。可接受的无机碱包括但不限于氢氧化铝,氢氧化钙,氢氧化钾,碳酸钠,氢氧化钠等。本发明的盐可以作为盐分离或通过经由添加酸或用酸性离子交换树脂处理将pH降至pKa以下而转化为游离酸。
本文所述的途径,代谢工程和培养策略依赖于使用例如脂肪酸O-甲基转移酶从己酸产生己酸甲酯,并使用例如单加氧酶从己酸甲酯产生6-羟基己酸甲酯。可以使用例如脱甲基酶或酯酶从6-羟基己酸甲酯产生6-羟基己酸。
本文所述的途径,代谢工程和培养策略依赖于使用例如醇O-乙酰转移酶产生己酸己酯,并使用例如单加氧酶从己酸己酯产生6-羟基己酸己酯,6-羟基己酸6-羟基己酯和/或己酸6-羟基己酯。可以使用例如酯酶从6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯产生6-羟基己酸。可以使用例如酯酶从己酸6-羟基己酯和/或6-羟基己酸6-羟基己酯产生1,6-己二醇。
来自聚羟基链烷酸酯累积细菌的与碳储存途径相关的CoA依赖性延长酶或同源物可用于产生前体分子。参见例如图1-2。
面对最优性原理,令人惊讶地,本发明人发现可以组合合适的非天然途径,原料,宿主微生物,对宿主生物化学网络的减弱策略和培养策略,以有效地产生一种或多种C6构件块。
在一些实施方案中,可以通过使用NADH或NADPH依赖性酶经由两个循环的CoA依赖性碳链延长从乙酰基-CoA形成用于转化成C6构件块的C6脂肪族主链。参见图1和图2。
在一些实施方案中,产生C6脂肪族主链的CoA依赖性碳链延长途径中的酶有目的地含有不可逆的酶促步骤。
在一些实施方案中,可以使用硫酯酶,醛脱氢酶,7-氧代庚酸脱氢酶,6-氧代己酸脱氢酶,5-氧代戊酸脱氢酶或单加氧酶来酶促形成末端羧基。参见图3和图4。
在一些实施方案中,可以使用ω-转氨酶或脱乙酰酶酶促形成末端胺基团。参见图5和图6。
在一些实施方案中,可以使用单加氧酶,酯酶或醇脱氢酶酶促形成末端羟基。参见图3、图7和图8。单加氧酶(例如,与氧化还原酶和/或铁氧还蛋白组合)或醇脱氢酶可以酶促形成羟基。单加氧酶可以与SEQ ID NO:13-15或27-28中所示的任一氨基酸序列具有至少70%的序列同一性。酯酶可以与SEQ ID NO:26所示的氨基酸序列具有至少70%的同一性。
ω-转氨酶或脱乙酰酶可以酶促形成胺基。ω-转氨酶可以与SEQ ID NO:7-12中所示的任一氨基酸序列具有至少70%的序列同一性。
硫酯酶,醛脱氢酶,7-氧代庚酸脱氢酶,6-氧代己酸脱氢酶或5-氧代戊酸脱氢酶可以酶促形成末端羧基。硫酯酶可以与SEQ ID NO:1所示的氨基酸序列具有至少70%的序列同一性。
羧酸还原酶(例如,与磷酸泛酰巯基乙胺基转移酶组合)可以形成末端醛基作为形成产物的中间体。羧酸还原酶可以与SEQ ID NO:2-6中所示的任一氨基酸序列具有至少70%的序列同一性。
可以在重组宿主中通过发酵进行任何方法。宿主可以经受在需氧,厌氧或微需氧培养条件下的培养策略。可以在营养限制如磷酸盐,氧或氮限制的条件下培养宿主。可以使用陶瓷膜保持宿主以在发酵期间保持高细胞密度。
在任何方法中,可以通过在选择性环境中连续培养来改善宿主对高浓度C6构件块的耐受性。
供给发酵的主要碳源可以来自生物或非生物原料。在一些实施方案中,生物原料是,包括,或源自单糖,二糖,木质纤维素、半纤维素、纤维素、木质素、乙酰丙酸和甲酸、甘油三酯、甘油、脂肪酸、农业废物、浓缩酒糟或城市废物。
在一些实施方案中,非生物原料是或源自天然气、合成气、CO2/H2、甲醇、乙醇、苯甲酸盐、非挥发性残留物(NVR)或来自环己烷氧化过程的碱洗液(caustic wash)废物流(non-volatile residue(NVR)or a caustic wash waste stream from cyclohexane oxidation processes)、或对苯二甲酸/异酞酸混合物废物流。
本文件的特征还在于重组宿主,其包括至少一种编码脂肪酸O-甲基转移酶和单加氧酶的外源核酸,并产生6-羟基己酸甲酯。此类宿主还可以包括脱甲基酶或酯酶,并进一步产生6-羟基己酸。此类宿主还可以包括(i)β-酮硫解酶或乙酰基-CoA羧化酶和β-酮酯酰基-[acp]合酶,(ii)3-羟基酰基-CoA脱氢酶或3-氧代酰基-CoA还原酶,(iii)烯酰基-CoA水合酶,和(iv)反式-2-烯酰基-CoA还原酶。宿主还可以进一步包括硫酯酶,醛脱氢酶或丁醛脱氢酶中的一种或多种。
本文件的特征还在于重组宿主,其包含至少一种编码醇O-乙酰转移酶的外源核酸并产生己酸己酯。此类宿主还可以包括单加氧酶和酯酶,并进一步产生6-羟基己酸和/或1,6-己二醇。此类宿主还可以包括(i)β-酮硫解酶或乙酰基-CoA羧化酶和β-酮酯酰基-[acp]合酶,(ii)3-羟基酰基-CoA脱氢酶或3-氧代酰基-CoA还原酶,(iii)烯酰基-CoA水合酶,和(iv)反式-2-烯酰基-CoA还原酶。宿主还可以进一步包括酸酯酶,羧酸还原酶,醛脱氢酶,丁醛或乙醛脱氢酶或醇脱氢酶中的一种或多种。
产生6-羟基己酸的重组宿主还可以包括单加氧酶,醇脱氢酶,醛脱氢酶,6-羟基己酸脱氢酶,5-羟基丁酸脱氢酶(5-hydroxybutanoate dehydrogenase),4-羟基丁酸脱氢酶,5-氧代丁酸(5-oxobutanoate)脱氢酶,6-氧代己酸脱氢酶或7-氧代庚酸脱氢酶中的一种或多种,所述宿主进一步产生己二酸或己二酸半醛。
产生6-羟基己酸的重组宿主还可以包括ω-转氨酶,6-羟基己酸脱氢酶,5-羟基戊酸脱氢酶,4-羟基丁酸脱氢酶和醇脱氢酶中的一种或多种,其中宿主进一步产生6-氨基己酸。
产生6-氨基己酸的重组宿主可包括酰胺水解酶(amidohydrolase),其中所述宿主进一步产生己内酰胺。
产生6-羟基己酸或6-氨基己酸的重组宿主还可以包括羧酸还原酶,ω-转氨酶,脱乙酰酶,N-乙酰转移酶或醇脱氢酶中的一种或多种,所述宿主进一步产生六亚甲基二胺。
产生6-羟基己酸的重组宿主还可以包括羧酸还原酶或醇脱氢酶,其中宿主进一步产生1,6-己二醇。
重组宿主可以是原核生物,例如来自埃希氏菌属(Escherichia)诸如大肠杆菌(Escherichia coli);来自梭菌属(Clostridia)诸如杨氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)或克鲁佛梭菌(Clostridium kluyveri);来自棒状杆菌属(Corynebacteria)诸如谷氨酸棒状杆菌(Corynebacterium glutamicum);来自贪铜菌属(Cupriavidus)诸如钩虫贪铜菌(Cupriavidus necator)或耐金属贪铜菌(Cupriavidus metallidurans);来自假单胞菌属(Pseudomonas)诸如荧光假单胞菌(Pseudomonas fluorescens),恶臭假单胞菌(Pseudomonas putida)或食油假单胞菌(Pseudomonas oleavorans);来自代尔夫特菌属(Delftia),食酸代尔夫特菌(Delftia acidovorans),来自芽孢杆菌属(Bacilluss)诸如枯草芽胞杆菌(Bacillus subtillis);来自乳杆菌属(Lactobacillus)诸如德氏乳杆菌(Lactobacillus delbrueckii);或来自乳球菌属(Lactococcus)诸如乳酸乳球菌(Lactococcus lactis)或来自红球菌属(Rhodococcus)诸如马红球菌(Rhodococcus equi)。
重组宿主可以是真核生物,例如来自曲霉属(Aspergillus)诸如黑曲霉(Aspergillus niger);来自酵母属(Saccharomyces)诸如酿酒酵母(Saccharomyces cerevisiae);来自毕赤酵母属(Pichia)诸如巴斯德毕赤酵母(Pichia pastoris);来自耶罗维亚酵母属(Yarrowia)诸如解脂耶罗维亚酵母(Yarrowia lipolytica),来自伊萨酵母属(Issatchenkia),诸如东方伊萨酵母(Issathenkia orientalis),来自德巴利酵母属(Debaryomyces)诸如汉逊德巴利酵母(Debaryomyces hansenii),来自Arxula属诸如Arxula adenoinivorans,或来自克鲁维酵母菌属(Kluyveromyces)诸如乳酸克鲁维酵母菌(Kluyveromyces lactis)。
在一些实施方案中,减弱或提升宿主的内源生物化学网络以(1)确保乙酰基-CoA的胞内利用度,(2)创建辅因子(即NADH或NADPH)不平衡,其可以经由C6构件块的形成平衡,(3)阻止导致并且包含C6构件块的中心代谢物,中心前体的降解和(4)确保从细胞的有效流出。
本文所述的任何重组宿主还可以包括一种或多种以下减弱的酶:聚羟基链烷酸合酶,乙酰基-CoA硫酯酶,乙酰基-CoA特异性β-酮硫解酶,形成乙酸的磷酸转乙酰酶,乙酸激酶,乳酸脱氢酶,menaquinol-延胡索酸氧化还原酶,产生异丁醇的2-酮酸脱羧酶,形成乙醇的醇脱氢酶,丙糖磷酸异构酶,丙酮酸脱羧酶,葡萄糖-6-磷酸异构酶,消散辅因子不平衡的转氢酶,对用于创建梯度的辅因子特异性的谷氨酸脱氢酶,利用NADH/NADPH的谷氨酸脱氢酶,庚二酰基-CoA脱氢酶;接受C6构件块和中心前体作为底物的酰基-CoA脱氢酶;戊二酰基-CoA脱氢酶;或庚二酰基-CoA合成酶。
本文所述的任何重组宿主还可以过表达一种或多种编码以下的基因:乙酰基-CoA合成酶,6-磷酸葡萄糖酸脱氢酶;转酮酶;反馈抗性苏氨酸脱氨酶;吡啶(puridine)核苷酸转氢酶;甲酸脱氢酶;甘油醛-3P-脱氢酶;苹果酸酶;葡萄糖-6-磷酸脱氢酶;果糖1,6二磷酸酶;丙酰基-CoA合成酶;L-丙氨酸脱氢酶;L-谷氨酸脱氢酶;L-谷氨酰胺合成酶;赖氨酸转运蛋白;二羧酸转运蛋白;和/或多药物转运蛋白。
本文件还涉及生成(C3-8羟基烷基)-C(=O)OCH3酯的方法,该方法包括将C4-9羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯;将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。
在一些实施方案中,可以使用具有脂肪酸O-甲基转移酶活性的多肽,将C4-9羧酸酶促转化为(C3-9烷基)-C(=O)OCH3酯。在一些实施方案中,具有脂肪酸O-甲基转移酶活性的多肽可以与SEQ ID NO:22,SEQ ID NO:23和/或SEQ ID NO:24所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,可使用具有单加氧酶活性的多肽将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。在一些实施方案中,单加氧酶分类在EC 1.14.14.-或EC 1.14.15.-下。在一些实施方案中,单加氧酶可以与SEQ ID NO:13-15,SEQ ID NO:27和/或SEQ ID NO:28中所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,可以从C4-9烷酰基(alkanoyl)-CoA酶促产生C4-9羧酸。在一些实施方案中,具有硫酯酶活性的多肽可以从C4-9烷酰基-CoA酶促产生C4-9羧酸。在一些实施方案中,硫酯酶可以与SEQ ID NO:1和/或SEQ ID NO:32-33所示的氨基酸序列具有至少70%的序列同一性。在一些实施方案中,具有丁醛脱氢酶活性的多肽和具有醛脱氢酶活性的多肽从C4-9烷酰基-CoA酶促产生C4-9羧酸。
本文件还描述了产生一种或多种羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯的方法。该方法包括将C4-9烷酰基-CoA酶促转化为(C4-9烷基)-OC(=O)-(C3-8烷基)酯;并且将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化为(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯中的任一种。
在一些实施方案中,可以使用具有醇O-乙酰转移酶活性的多肽将C4-9烷酰基-CoA酶促转化为(C4-9烷基)-OC(=O)-(C3-8烷基)酯。在一些实施方案中,醇O-乙酰转移酶可以与SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化成(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯。在一些实施方案中,所述具有单加氧酶活性的多肽归类于EC 1.14.14.-或EC 1.14.15.-。
在一些实施方案中,该方法还可以包括将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯转化为C4-9羟基链烷酸。在一些实施方案中,具有酯酶活性的多肽将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯酶促转化成C4-9羟基链烷酸。
在一个方面,本文件特征在于产生生物衍生的6-碳化合物的方法。用于产生生物衍生的六碳化合物的方法可包括在条件下培养或生长如本文所述的重组宿主达足够的时间段以产生生物衍生的六碳化合物,其中任选地,生物衍生的六碳化合物选自下组:己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇及其组合。
在一个方面,本文件的特征在于包含如本文所述的生物衍生的六碳化合物和除了生物衍生的六碳化合物之外的化合物的组合物,其中所述生物衍生的六碳化合物选自下组:己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇及其组合。例如,生物衍生的六碳化合物是宿主细胞或生物体的细胞部分。
本文件特征还在于基于生物的聚合物,其包含生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇,及其组合。
本文件特征还在于基于生物的树脂,其包含生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,1,6-己二醇及其组合的,以及通过模制基于生物的树脂获得的模制产品。
在另一方面,本文件特征还在于产生基于生物的聚合物的方法,其包括在聚合物产生反应中使生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,和/或1,6-己二醇与其自身或另一化合物起反应。
在另一方面,本文件特征在于产生基于生物的树脂的方法,其包括在树脂产生反应中使生物衍生的己二酸,己二酸半醛,6-氨基己酸,6-羟基己酸,己内酰胺,六亚甲基二胺,和/或1,6-己二醇与其自身或另一种化合物起反应。
在另一个方面中,本文件提供了生物衍生的产物、基于生物的产物或发酵衍生的产物,其中所述产物包含:
(i).组合物,所述组合物包含本文中或图1-8中任一项提供的至少一种生物衍生的、基于生物的或发酵衍生的化合物,或它们的任何组合;
(ii).生物衍生的、基于生物的或发酵衍生的聚合物,其包含(i).的生物衍生的、基于生物的或发酵衍生的组合物或化合物,或它们的任何组合;
(iii).生物衍生的、基于生物的或发酵衍生的树脂,其包含(i).的生物衍生的、基于生物的或发酵衍生的化合物或生物衍生的、基于生物的或发酵衍生的组合物或它们的任何组合或(ii).的生物衍生的、基于生物的或发酵衍生的聚合物或它们的任何组合;
(iv).模制物质,其通过使(ii).的生物衍生的、基于生物的或发酵衍生的聚合物或(iii).的生物衍生的、基于生物的或发酵衍生的树脂或它们的任何组合模制获得;
(v).生物衍生的、基于生物的或发酵衍生的配制剂,其包含(i).的生物衍生的、基于生物的或发酵衍生的组合物、(i).的生物衍生的、基于生物的或发酵衍生的化合物、(ii).的生物衍生的、基于生物的或发酵衍生的聚合物、(iii).生物衍生的、基于生物的或发酵衍生的树脂,或(iv)的生物衍生的、基于生物的或发酵衍生的模制物质,或它们的任何组合;或
(vi).生物衍生的、基于生物的或发酵衍生的半固体或非半固体流,其包含(i).的生物衍生的、基于生物的或发酵衍生的组合物、(i).的生物衍生的、基于生物的或发酵衍生的化合物、(ii).的生物衍生的、基于生物的或发酵衍生的聚合物、(iii).生物衍生的、基于生物的或发酵衍生的树脂,(v).生物衍生的、基于生物的或发酵衍生的配制剂,或(iv)的生物衍生的、基于生物的或发酵衍生的模制物质,或它们的任何组合。
此外,本文描述了生物化学网络,其包含至少一种编码多肽的外源核酸,所述多肽具有(i)脂肪酸O-甲基转移酶活性或醇O-乙酰转移酶活性,(ii)单加氧酶活性和(iii)酯酶或脱甲基酶活性。
此外,本文描述了包含至少一种外源核酸的生物化学网络,所述外源核酸编码具有脂肪酸O-甲基转移酶活性的多肽和具有单加氧酶活性的多肽,其中所述生物化学网络酶促产生6-羟基己酸甲酯。生化网络可以进一步包括具有脱甲基酶活性的多肽或具有酯酶活性的多肽,其中具有脱甲基酶活性的多肽或具有酯酶活性的多肽酶促产生6-羟基己酸。
生化网络可以进一步包括至少一种外源核酸,所述外源核酸编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,其中具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和多肽具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽,具有反式-2-烯酰基-CoA还原酶活性的多肽酶促产生C6前体分子,如己酰基-CoA。
生化网络可以进一步包含以下一种或多种:具有硫酯酶活性的外源多肽,具有醛脱氢酶活性的多肽或具有丁醛脱氢酶活性的多肽,其中具有硫酯酶活性的多肽,具有醛脱氢酶活性的多肽或具有丁醛脱氢酶活性酶促产生己酸作为C6前体分子。
此外,本文描述了生物化学网络,其包含至少一种编码具有醇O-乙酰转移酶活性的多肽和具有单加氧酶活性的多肽的外源核酸,其中所述生化网络产生己酸己酯。生化网络可以进一步包括酯酶,其中酯酶将己酸己酯酶促转化为6-羟基己酸和/或1,6-己二醇。
生化网络可以进一步包括至少一种外源核酸,其编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽,和具有反式-2-烯酰基-CoA还原酶活性的多肽,其中具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽,和具有β-酮脂酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性酶促产生C6前体分子,如己酰基-CoA。生化网络可以进一步包括以下一种或多种:具有醛脱氢酶活性的外源多肽,具有醇脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有羧酸还原酶活性的多肽或具有硫酯酶活性的多肽,其中具有醛脱氢酶活性的多肽,具有醇脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有羧酸还原酶活性的多肽或具有硫酯酶活性的多肽酶促产生己醇作为C6前体分子。
产生6-羟基己酸的生物化学网络可以进一步包括以下一种或多种:具有单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽,其中具有单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽将6-羟基己酸酶促转化为己二酸或己二酸半醛。
产生6-羟基己酸的生物化学网络可以进一步包括以下一种或多种:具有ω-转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽和具有醇脱氢酶活性的多肽,其中具有ω-转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为6-氨基己酸。
产生6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇的生化网络可以进一步包括以下一种或多种:具有羧酸还原酶活性的多肽,具有ω-转氨酶的多肽活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽或具有醇脱氢酶活性的多肽,其中具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽或具有醇脱氢酶活性的多肽将6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇酶促转化成六亚甲基二胺。
产生6-羟基己酸的生物化学网络可以进一步包括以下一种或多种:具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽,其中具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为1,6-己二醇。
此外,本文描述了用于获得6-羟基己酸的手段(means),其使用(i)具有脂肪酸O-甲基转移酶活性的多肽和具有单加氧酶活性的多肽和(ii)具有脱甲基酶活性的多肽或具有酯酶活性的多肽进行。所述手段还可以包括将6-羟基己酸转化为己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种的手段。所述手段可以包括具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽。
此外,本文描述了用于获得6-羟基己酸的手段,其使用(i)具有醇O-乙酰转移酶的多肽和具有单加氧酶活性的多肽和(ii)具有脱甲基酶活性的多肽或具有酯酶活性的多肽进行。所述手段还可以包括将6-羟基己酸转化为己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种的手段。所述手段可以包括具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽。
本文还描述了(i)用于获得6-羟基己酸的步骤,其使用具有醇O-乙酰转移酶的多肽,具有单加氧酶活性的多肽和具有脱甲基酶活性的多肽或具有酯酶活性的多肽获得,和(ii)用于获得己二酸,6-氨基己酸,己二酸半醛,1,6-己二醇,六亚甲基二胺的步骤,其使用具有羧酸还原酶活性的多肽,具有醇脱氢酶活性的多肽,具有ω-转氨酶的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽。
另一方面,本文件的特征在于组合物,其包含6-羟基己酸和具有醇O-乙酰转移酶的多肽,具有单加氧酶活性的多肽和具有脱甲基酶活性的多肽或具有酯酶活性复合物的多肽。组合物可以是细胞的。组合物还可以包括具有羧酸还原酶活性的多肽,具有醇脱氢酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽,以及己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种。组合物可以是细胞的。
本文中所述的途径的反应可在一种或多种细胞(例如宿主细胞)株中进行,其(a)天然表达一种或多种相关酶,(b)经基因工程化改造以表达一种或多种相关酶,或(c)天然表达一种或多种相关酶并且遗传工程化改造以表达一种或多种相关酶。或者,可以从上述类型的宿主细胞中提取相关酶,并以纯化或半纯化形式使用。提取的酶可以任选地固定到合适的反应容器的底部和/或壁。此外,此类提取物包括可用作相关酶来源的裂解物(例如细胞裂解物)。在本文件提供的方法中,所有步骤可以在细胞(例如宿主细胞)中进行,所有步骤可以使用提取的酶进行,或者一些步骤可以在细胞中进行,而其它步骤可以使用提取的酶进行。
除非另有定义,本文中使用的所有技术和科学术语与本发明所属领域的普通技术人员的通常理解具有相同的含义。尽管与本文中所述的方法和材料类似或等同的方法和材料可用于实施本发明,但下文描述了合适的方法和材料。本文中提及的所有出版物,专利申请,专利和其它参考文献,包括具有登录号的GenBank和NCBI提交物通过引用整体并入。在冲突的情况下,以本说明书(包括定义)为准。此外,材料,方法和实施例仅仅是说明性的,而不是限制性的。
在下面的附图和描述中阐述了本发明的一个或多个实施例的细节。本发明的其它特征,目的和优点将从说明书和附图以及权利要求书中显而易见。根据专利法中的标准实践,权利要求书中的词语“包括”可以被“基本上由...组成”或由“由...组成”替代。
附图简述
图1是使用NADH依赖性酶和乙酰基-CoA作为中心代谢物导致己酰基-CoA的示例性生物化学途径的示意图。
图2是使用NADPH依赖性酶和乙酰基-CoA作为中心代谢物导致己酰基-CoA的示例性生物化学途径的示意图。
图3是使用己酰基-CoA作为中心前体导致己酸和己醇的示例性生物化学途径的示意图。
图4是使用6-羟基己酸作为中心前体导致己二酸的示例性生物化学途径的示意图。
图5是使用6-羟基己酸作为中心前体导致6-氨基己酸和己内酰胺的示例性生物化学途径的示意图。
图6是使用6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇作为中心前体导致六亚甲基二胺的示例性生物化学途径的示意图。
图7是使用己酸或己酰基-CoA作为中心前体经由酯中间体导致6-羟基己酸的示例性生物化学途径的示意图。图7还含有使用1,6-己二醇作为中心前体导致6-羟基己酸的示例性生物化学途径。
图8是使用6-羟基己酸或己酰基-CoA作为中心前体导致1,6-己二醇的示例性生物化学途径的示意图。
图9含有由tesB编码的大肠杆菌硫酯酶(参见GenBank登录号AAA24665.1,SEQ ID NO:1),海分枝杆菌羧酸还原酶(参见GenBank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌羧酸还原酶(参见GenBank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus羧酸还原酶(参见GenBank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌羧酸还原酶(参见GenBank登录号EIV11143.1,SEQ ID NO:5),Segniliparus rotundus羧酸还原酶(参见GenBank登录号ADG98140.1,SEQ ID NO:6),青紫色杆菌ω-转氨酶(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌ω-转氨酶(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌ω-转氨酶(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌ω-转氨酶(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌ω-转氨酶(参见GenBank登录号AAA57874.1,SEQ ID NO:11)和河流弧菌ω-转氨酶(参见GenBank登录号AEA39183.1,SEQ ID NO:12),极胞菌属物种(Polaromonas sp.)JS666单加氧酶(参见GenBank登录号ABE47160.1,SEQ ID NO:13),分枝杆菌属物种HXN-1500单加氧酶(参见GenBank登录号CAH04396.1,SEQ ID NO:14),南非分枝杆菌(Mycobacterium austroafricanum)单加氧酶(参见GenBank登录号ACJ06772.1,SEQ ID NO:15),极胞菌属物种JS666氧化还原酶(参见GenBank登录号ABE47159.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500氧化还原酶(参见GenBank登录号CAH04397.1,SEQ ID NO:17),极胞菌属物种JS666铁氧还蛋白(参见GenBank登录号ABE47158.1,SEQ ID NO:18),分枝杆菌属物种HXN-1500铁氧还蛋白(参见GenBank登录号CAH04398.1,SEQ ID NO:19),枯草芽孢杆菌磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号CAA44858.1,SEQ ID NO:20),诺卡氏菌属物种NRRL 5646磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号ABI83656.1,SEQ ID NO:21),海分枝杆菌脂肪酸O-甲基转移酶(GenBank登录号ACC41782.1;SEQ ID NO:22),耻垢分枝杆菌菌株MC2脂肪酸O-甲基转移酶(GenBank登录号ABK73223.1;SEQ ID NO:23),恶臭假单胞菌脂肪酸O-甲基转移酶(GenBank登录号CAA39234.1;SEQ ID NO:24),酿酒酵母醇O-乙酰基转移酶(Genbank登录号:CAA85138.1,SEQ ID NO:25),荧光假单胞菌羧酸酯酶(Genbank登录号AAC60471.2,SEQ ID NO:26),恶臭假单胞菌烷1-单加氧酶(Genbank登录号CAB51047.1,SEQ ID NO:27),麦芽糖假丝酵母色素P450(Genbank登录号BAA00371.1,SEQ ID NO:28),肠沙门氏菌肠亚种鼠伤寒血清型(Salmonella enterica subsp.enterica serovar Typhimurium)丁醛脱氢酶(GenBank登录号AAD39015,SEQ ID NO:29),少动鞘氨醇单胞菌脱甲基酶(GenBank登录号BAD61059.1和GenBank登录号BAC79257.1,分别为SEQ ID NO:30和31),短乳杆菌硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32),和植物乳杆菌硫酯酶(GenBank登录号CCC78182.1,SEQ ID NO:33)的氨基酸序列。
图10是释放的CoA在412nm处的相对吸光度的条形图,作为相对于空载体对照,硫酯酶用于将己酰基-CoA转化为己酸的活性的量度。
图11是总结20分钟后340nm处吸光度变化的条形图,其是没有底物(仅酶对照)的NADPH消耗和羧酸还原酶活性的量度。
图12是20分钟后340nm处吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸还原酶用于将己二酸转化为己二酸半醛的活性的量度。
图13是20分钟后在340nm处的吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸还原酶用于将6-羟基己酸转化为6-羟基己醛的活性的量度。
图14是20分钟后340nm处吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸盐还原酶将N6-乙酰基-6-氨基己酸转化为N6-乙酰基-6-氨基己醛的活性的量度。
图15是20分钟后340nm处吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和羧酸还原酶用于将己二酸半醛转化为己二醛的活性的量度。
图16是总结在4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)作为仅酶对照(无底物)的ω-转氨酶活性的量度的条形图。
图17是24小时后丙酮酸至L-丙氨酸转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将6-氨基己酸转化为己二酸半醛的ω-转氨酶活性的量度。
图18是4小时后L-丙氨酸至丙酮酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将己二酸半醛转化为6-氨基己酸的ω-转氨酶活性的量度。
图19是4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将六亚甲基二胺转化为6-氨基己醛的ω-转氨酶活性的量度。
图20是4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将N6-乙酰基-1,6-二氨基己烷转化为N6-乙酰基-6-氨基己醛的ω-转氨酶活性的量度。
图21是4小时后丙酮酸至L-丙氨酸的转化百分比(mol/mol)的条形图,作为相对于空载体对照,用于将6-氨基己醇转化为6-氧代己醇的ω-转氨酶活性的量度。
图22是通过LC-MS测定的6-羟基己酸的峰面积变化的条形图,作为相对于空载体对照,用于将己酸转化为6-羟基己酸的单加氧酶活性的量度。
图23是20分钟后在340nm处的吸光度变化的条形图,其是相对于空载体对照,NADPH消耗和用于将己酸转化为己醛的羧酸还原酶活性的量度。
发明详述
本文件提供了酶,非天然途径,培养策略,原料,中心前体,宿主微生物和对宿主生物化学网络的减弱,其从中心代谢物产生六碳链脂肪族主链(其可以与辅酶A部分结合),其中可形成两个末端官能团,导致合成以下一种或多种:己二酸、6-羟基己酸、6-氨基己酸、己内酰胺、六亚甲基二胺或1,6-己二醇(在本文中称为“C6构件块”)。如本文中使用,术语“中心前体”用于意指导致C6构件块合成的本文中显示的任何代谢途径中的任何代谢物。术语“中心代谢物”用于意指所有微生物中生成以支持生长的代谢物。
本文中描述的宿主微生物可以包含内源途径,该内源途径可以通过操作,使得可以生成一种或多种C6构件块或其中心前体。在内源途径中,宿主微生物天然表达催化途径内的反应的所有酶。含有工程化途径的宿主微生物不天然表达催化途径内的反应的所有酶,但是已经经过工程化改造,使得在宿主中表达途径内的所有酶。
如本文中提及核酸(或蛋白质)和宿主使用的,术语“外源”指不像其在自然界中被发现一样存在于特定类型细胞中(并且不能从特定类型细胞获得)的核酸或由所述核酸编码的蛋白质。如此,非天然存在的核酸一旦在宿主中即视为对于宿主而言外源的。重要的是注意非天然存在的核酸可含有在自然界中发现的核酸序列的核酸亚序列或片段,只要该核酸作为整体不存在于自然界中。例如,表达载体内含有基因组DNA序列的核酸分子是非天然存在的核酸,如此一旦导入宿主中对于宿主细胞而言是外源的,因为该核酸分子作为整体(基因组DNA加载体DNA)不存在于自然界中。如此,作为整体不存在于自然界中的任何载体、自主复制的质粒或病毒(例如逆转录病毒、腺病毒、或疱疹病毒)视为非天然存在的核酸。由此得出结论通过PCR或限制内切性核酸酶处理产生的基因组DNA片段以及cDNA也视为非天然存在的核酸,因为它们作为未见于自然界的分开的分子存在。由此还得出结论任何以未见于自然界中的排布含有启动子序列和多肽编码序列(例如cDNA或基因组DNA)的任何核酸也是非天然存在的核酸。天然存在的核酸可以是对于特定宿主微生物而言外源的。例如,从酵母x的细胞分离的完整染色体一旦将该染色体导入酵母y的细胞中就酵母y细胞而言是外源核酸。
比较而言,如本文中提及核酸(例如基因)(或蛋白质)和宿主使用的,术语“内源的”指就像其在自然界中被发现一样的确存在于特定宿主中(并且可以从特定宿主获得)的核酸(或蛋白质)。此外,“内源表达”核酸(或蛋白质)的细胞就像其在自然界中被发现时相同特定类型的宿主那样表达所述核酸(或蛋白质)。此外,“内源生成”核酸、蛋白质、或其它化合物的宿主就像其在自然界中被发现时相同特定类型的宿主那样生成所述核酸、蛋白质、或化合物。
例如,根据宿主和宿主产生的化合物,除了具有脂肪酸O-甲基转移酶活性的多肽或具有醇O-乙酰转移酶活性的多肽之外,还可以在宿主中表达一种或多种下列多肽:具有单加氧酶活性的多肽,具有酯酶活性的多肽,具有脱甲基酶活性的多肽,具有β-酮硫解酶活性的多肽,具有乙酰基-CoA羧化酶活性的多肽,具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽,具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽,具有反式-2-烯酰基-CoA还原酶活性的多肽,具有硫酯酶活性的多肽,具有醛脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有例如CYP4F3B家族中的单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有5-氧代戊酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有7-氧代庚酸脱氢酶活性的多肽,具有ω-转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽,具有羧酸还原酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽,或具有酰胺水解酶活性的多肽。在表达具有羧酸还原酶活性的多肽的重组宿主中,也可以表达具有磷酸泛酰巯基乙胺基转移酶活性的多肽,因为它增强具有羧酸还原酶活性的多肽的活性。在表达具有单加氧酶活性的多肽的重组宿主中,还可以表达电子转移链蛋白,如具有氧化还原酶活性的多肽和/或具有铁氧还蛋白多肽活性的多肽。
在一些实施方案中,重组宿主可以包括至少一种外源核酸,其编码具有(i)脂肪酸O-甲基转移酶活性的多肽或具有醇O-乙酰转移酶活性的多肽,(ii)具有单加氧酶活性的多肽,和(iii)具有酯酶活性的多肽或具有脱甲基酶活性的多肽。
在一些实施方案中,重组宿主可以包括编码具有脂肪酸O-甲基转移酶活性的多肽和具有单加氧酶活性的多肽的至少一种外源核酸,其中所述宿主产生6-羟基己酸甲酯。此类宿主还可以包括具有脱甲基酶活性的多肽或具有酯酶活性的多肽并进一步产生6-羟基己酸。在一些实施方案中,重组宿主还可以包括至少一种外源核酸,其编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,以产生C6前体分子,如己酰基-CoA。此类宿主还可以包括以下一种或多种(例如,两种或三种):具有硫酯酶活性的外源多肽,具有醛脱氢酶活性的多肽或具有丁醛脱氢酶活性的多肽,并产生己酸作为C6前体分子。
在一些实施方案中,重组宿主可以包括编码具有醇O-乙酰转移酶活性的多肽和具有单加氧酶活性的多肽的至少一种外源核酸,其中宿主产生己酸己酯。此类宿主还可以包括具有酯酶活性的多肽并进一步产生6-羟基己酸和/或1,6-己二醇。在一些实施方案中,重组宿主还可以包括至少一种外源核酸,其编码具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,以产生C6前体分子,如己酰基-CoA。此类宿主还可以包括以下一种或多种(例如,两种或三种):具有醛脱氢酶活性的外源多肽,具有醇脱氢酶活性的多肽,具有丁醛脱氢酶活性的多肽,具有羧酸还原酶活性的多肽或具有硫酯酶活性的多肽,并且产生己醇作为C6前体分子。
产生6-羟基己酸的重组宿主还可以包括以下一种或多种:具有单加氧酶活性的多肽(例如在CYP4F3B家族中),具有醇脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代己酸脱氢酶的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有6-羟基己酸脱氢酶活性的多肽,并产生己二酸或己二酸半醛。例如,重组宿主还可以包括具有单加氧酶活性的多肽并产生己二酸或己二酸半醛。作为另一个实例,重组宿主还可以包括(i)具有醇脱氢酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽或具有4-羟基丁酸脱氢酶活性的多肽,或(ii)具有醛脱氢酶活性的多肽,具有5-氧代丁酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽或具有7-氧代己酸脱氢酶活性的多肽,并产生己二酸。
产生6-羟基己酸的重组宿主还可以包括以下一种或多种:具有转氨酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基丁酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽和具有醇脱氢酶活性的多肽,并产生6-氨基己酸。例如,产生6-羟基己酸的重组宿主还可以包括具有ω-转氨酶活性的多肽和具有6-羟基己酸脱氢酶活性的多肽或具有醇脱氢酶活性的多肽。
产生6-氨基己酸,6-羟基己酸,己二酸半醛或1,6-己二醇的重组宿主还可以包括以下一种或多种:具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽,具有N-乙酰转移酶活性的多肽或具有醇脱氢酶活性的多肽,并产生六亚甲基二胺。在一些实施方案中,重组宿主还可以包括以下每种:具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽,具有脱乙酰酶活性的多肽和具有N-乙酰转移酶活性的多肽。在一些实施方案中,重组宿主还可以包括具有羧酸还原酶活性的多肽和具有ω-转氨酶活性的多肽。在一些实施方案中,重组宿主还可以包括具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽和具有醇脱氢酶活性的多肽。在其中重组宿主产生6-氨基己酸的实施方案中,具有ω-转氨酶活性的另外的多肽对于产生六亚甲基二胺可以是不必要的。在一些实施方案中,宿主包括具有ω-转氨酶活性的第二外源多肽,其不同于具有ω-转氨酶活性的第一外源多肽。
产生6-羟基己酸的重组宿主还可以包括具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽中的一种或多种,并产生1,6-己二醇。
在工程化途径内,酶可以来自单一来源,即来自一种物种或属,或者可以来自多种来源,即不同物种或属。编码本文中描述的酶的核酸已经自各种生物体鉴定,并且在公众可用的数据库(诸如GenBank或EMBL)中容易地可得到。在含有外源酶的重组宿主中,宿主含有编码酶的外源核酸。
可用于生成一种或多种C6构件块的本文中描述的任何酶可以与相应野生型酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)。应当理解,可以基于成熟酶(例如除去任何信号序列)或基于未成熟的酶(例如包括任何信号序列)测定序列同一性。
例如,本文中描述的具有硫酯酶活性的多肽可以与由tesB编码的大肠杆菌硫酯酶的氨基酸序列(参见GenBank登录号AAA24665.1,SEQ ID NO:1),与短乳杆菌硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌硫酯酶的氨基酸序列(GenBank登录号CCC78182.1,SEQ ID NO:33)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有羧酸还原酶活性的多肽可以与海分枝杆菌(参见Genbank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌(参见Genbank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus(参见Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(参见Genbank登录号EIV11143.1,SEQ ID NO:5),或Segniliparus rotundus(参见Genbank登录号ADG98140.1,SEQ ID NO:6)羧酸还原酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%)。参见图9。
例如,本文中描述的具有ω-转氨酶活性的多肽与青紫色杆菌(参见Genbank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见Genbank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见Genbank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见Genbank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:11),或河流弧菌(参见Genbank登录号AEA39183.1,SEQ ID NO:12)ω-转氨酶的氨基酸序列可以具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。这些ω-转氨酶中的一些是二胺ω-转氨酶。参见图9。
例如,本文中描述的具有单加氧酶活性的多肽可以与极胞菌属物种JS666单加氧酶(参见GenBank登录号ABE47160.1,SEQ ID NO:13),分枝杆菌物种HXN-1500单加氧酶(参见GenBank登录号CAH04396.1,SEQ ID NO:14),或南非分枝杆菌单加氧酶(参见GenBank登录号ACJ06772.1,SEQ ID NO:15)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有氧化还原酶活性的多肽可以与极胞菌属物种JS666氧化还原酶(参见GenBank登录号ABE47159.1,SEQ ID NO:16)或分枝杆菌物种HXN-1500氧化还原酶(参见GenBank登录号CAH04397.1,SEQ ID NO:17)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有铁氧还蛋白活性的多肽可以与极胞菌属物种JS666铁氧还蛋白(参见GenBank登录号ABE47158.1,SEQ ID NO:18)或分枝杆菌物种HXN-1500铁氧还蛋白(参见GenBank登录号CAH04398.1,SEQ ID NO:19)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有磷酸泛酰巯基乙胺基转移酶活性的多肽可以与枯草芽孢杆菌磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号CAA44858.1,SEQ ID NO:20)或诺卡尔菌属物种NRRL 5646磷酸泛酰巯基乙胺基转移酶(参见GenBank登录号ABI83656.1,SEQ ID NO:21)的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有脂肪酸O-甲基转移酶活性的多肽可以与海分枝杆菌(参见GenBank登录号ACC41782.1,SEQ ID NO:22),耻垢分枝杆菌(参见GenBank登录号ABK73223.1,SEQ ID NO:23),或恶臭假单胞菌(参见GenBank登录号CAA39234.1,SEQ ID NO:24)甲基转移酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有醇-O乙酰基转移酶活性的多肽可以与酿酒酵母(参见GenBank登录号CAA85138.1,SEQ ID NO:25)醇-O乙酰基转移酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有酯酶活性的多肽可以与荧光假单胞菌(参见GenBank登录号AAC60471.2,SEQ ID NO:26)酯酶的氨基酸序列具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。参见图9。
例如,本文中描述的具有烷1-单加氧酶活性的多肽可以与恶臭假单胞菌烷1-单加氧酶的氨基酸序列(Genbank登录号CAB51047.1,SEQ ID NO:27)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。
例如,本文中描述的具有色素P450单加氧酶活性的多肽可以与麦芽糖假丝酵母(Candida maltose)色素P450的氨基酸序列(Genbank登录号:BAA00371.1,SEQ ID NO:28)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。
例如,本文中描述的具有丁醛脱氢酶活性的多肽可以与肠沙门氏菌肠亚种鼠伤寒血清型丁醛脱氢酶的氨基酸序列(参见GenBank登录号AAD39015,SEQ ID NO:29)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。
例如,本文中描述的具有丁香酸(syringate)O-脱甲基酶活性的多肽可以与少动鞘氨醇单胞菌脱甲基酶的氨基酸序列(参见GenBank登录号BAD61059.1和GenBank登录号BAC79257.1,分别为SEQ ID NO:30和31)具有至少70%序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或100%)。
可以如下测定两种氨基酸序列间的百分比同一性(同源性)。首先,使用来自含有BLASTP第2.0.14版的单机版BLASTZ的BLAST 2Sequences(Bl2seq)程序比对氨基酸序列。此单机版BLASTZ可以获自Fish&Richardson的网站(例如www.fr.com/blast/)或美国政府国立生物技术信息中心网站(www.ncbi.nlm.nih.gov)。解释如何使用Bl2seq程序的用法说明可以参见伴随BLASTZ的自述文件。Bl2seq使用BLASTP算法实施两种氨基酸序列之间的比较。为了比较两种氨基酸序列,如下设置Bl2seq的选项:-i设置为含有要比较的第一氨基酸序列的文件(例如C:\seq1.txt);-j设置为含有要比较的第二氨基酸序列的文件(例如C:\seq2.txt);-p设置为blastp;-o设置为任何期望的文件名称(例如C:\output.txt);并且所有其它选项保持为其缺省设置。例如,可以使用以下命令来产生含有两种氨基酸序列间的比较的输出文件:C:\Bl2seq–i c:\seq1.txt–j c:\seq2.txt–p blastp–o c:\output.txt。如果两种比较序列共享同源性(同一性),那么指定的输出文件会呈现那些同源性区作为比对序列。如果两种比较序列不共享同源性(同一性),那么指定的输出文件不会呈现比对序列。可以对核酸序列遵循相似的规程,只是使用blastn。
一旦比对,通过计算相同氨基酸残基在这两种序列中呈现的位置的数目确定匹配数目。通过用匹配数目除以全长多肽氨基酸序列的长度,接着将所得的数值乘以100来确定百分比同一性(同源性)。注意到百分比同一性(同源性)值被四舍五入到最近的十分位。例如,78.11、78.12、78.13、和78.14被向下四舍五入到78.1,而78.15、78.16、78.17、78.18、和78.19被向上四舍五入到78.2。还注意到长度值会总是整数。
应当领会,许多核酸可以编码具有特定氨基酸序列的多肽。遗传密码的简并性是本领域中公知的;即对于许多氨基酸,存在有超过一种充当氨基酸密码子的核苷酸三联体。例如,可以修饰给定酶的编码序列中的密码子,从而获得特定物种(例如细菌或真菌)中的最佳表达,这使用适合于所述物种的密码子偏好表进行。
也可以在本文件的方法中使用本文中描述的任何酶的功能性片段。如本文中使用的,术语“功能性片段”指短于全长未成熟的蛋白质并且具有至少25%(例如至少30%;40%;50%;60%;70%;75%;80%;85%;90%;91%;92%;93%;94%;95%;96%;97%;98%;99%;100%;或甚至大于100%)的相应的成熟、全长、野生型蛋白质活性的蛋白质的肽片段。功能性片段一般但不总是可以由蛋白质的连续区构成,其中该区具有功能性活性。
此文件还提供了(i)本文件的方法中使用的酶的功能性变体和(ii)上文描述的功能性片段的功能性变体。相对于相应的野生型序列,酶和功能性片段的功能性变体可以含有添加、缺失、或取代。具有取代的酶一般会具有不超过50(例如不超过1、2、3、4、5、6、7、8、9、10、12、15、20、25、30、35、40、或50)处氨基酸取代(例如保守取代)。这适用于本文中描述的任何酶和功能性片段。保守取代是用一种氨基酸取代具有相似特征的另一种。保守取代包括下列组内的取代:缬氨酸、丙氨酸和甘氨酸;亮氨酸、缬氨酸、和异亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;丝氨酸、半胱氨酸、和苏氨酸;赖氨酸和精氨酸;和苯丙氨酸和酪氨酸。非极性疏水性氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。带正电荷的(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸。带负电荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。上文提及的极性、碱性或酸性组的一种成员被相同组的另一种成员的任何取代可以视为保守取代。比较而言,非保守取代是用一种氨基酸取代具有不同特征的另一种。
缺失变体可以缺乏1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个氨基酸的区段(具有两种或更多种氨基酸)或非连续的单一氨基酸。添加(添加变体)包括融合蛋白,其含有:(a)本文中描述的任何酶或其片段;和(b)内部或末端(C或N)无关或异源氨基酸序列。在此类融合蛋白的背景中,术语“异源氨基酸序列”指与(a)不同的氨基酸序列。异源序列可以是例如用于纯化重组蛋白的序列(例如FLAG、多组氨酸(例如六组氨酸)、凝集素(HA)、谷胱甘肽-S-转移酶(GST)、或麦芽糖结合蛋白(MBP))。异源序列也可以是可用作可检测标志物的蛋白质,例如萤光素酶、绿色荧光蛋白(GFP)、或氯霉素乙酰基转移酶(CAT)。在一些实施方案中,融合蛋白含有来自另一种蛋白质的信号序列。在某些宿主细胞(例如酵母宿主细胞)中,可以经由使用异源信号序列提高靶蛋白的表达和/或分泌。在一些实施方案中,融合蛋白可以含有可用于例如引发免疫应答以生成抗体的载体(例如KLH)或ER或高尔基体保留信号。异源序列可以是不同长度的,并且在一些情况中可以是比与异源序列附接的全长靶蛋白质更长的序列。
工程化宿主可以天然表达本文中描述的途径的酶中的无一或一些(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、或六种或更多种)。如此,工程化宿主内的途径可以包含所有外源酶,或者可以包含内源和外源酶两者。也可以破坏工程化宿主的内源基因以阻止不想要的代谢物的形成或阻止经由对中间体起作用的其它酶引起的途径中此类中间体的损失。工程化宿主可以称为重组宿主或重组宿主细胞。如本文中描述的,重组宿主可以包含编码下列一种或多种的核酸:具有脂肪酸O-甲基转移酶活性的多肽,具有醇O-乙酰转移酶活性的多肽,具有脱氢酶活性的多肽,具有β-酮硫解酶活性的多肽,具有β-酮脂酰基-acp]合酶活性的多肽,具有羧化酶活性的多肽,具有还原酶活性的多肽,具有水合酶活性的多肽,具有硫酯酶活性的多肽,具有单加氧酶活性的多肽,具有脱甲基酶活性的多肽,具有酯酶活性的多肽或具有转氨酶活性的多肽,如本文中描述的。
另外,可以使用本文中描述的分离的酶,使用来自宿主微生物的裂解物(例如细胞裂解物)作为酶来源,或者使用来自不同宿主微生物的多种裂解物作为酶来源体外进行一种或多种C6构件块的产生。
生物合成方法
本文提供了产生(C3-8羟基烷基)-C(=O)OCH3酯的方法。如本文中所用的,术语(C3-8羟基烷基)-C(=O)OCH3酯是指具有下式的化合物:
如本文中所用的,术语“C3-8羟基烷基”是指可以是直链或支链,并且被至少一个羟基(即羟基或OH)基团取代的饱和烃基。在一些实施方案中,C3-8羟基烷基是指可以是直链或支链,并且被至少一个末端羟基(OH)基团取代的饱和烃基。在一些实施方案中,烷基含有4至8、4至7、4至6、4至5、5至8、5至7、5至6、6至8、6至7、或7至8个碳原子。在一些实施方案中,C3-8羟基烷基是下式的基团:
在一些实施方案中,该方法包括:
a)将C3-8羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯;并且
b)将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。
如本文中所用的,术语“C4-9羧酸”是指具有式RC(=O)OH的化合物,其中R是指可以是直链或支链的饱和烃基(即烷基),其中该化合物具有4至9个碳原子。在一些实施方案中,C4-9羧酸基团含有4至9、4至8、4至7、4至6、4至5、5至9、5至8、5至7、5至6、6至9,6至8,6至7,7至9,7至8或8至9个碳原子。示例性的C4-9羧酸包括丁酸(即丁酸盐),戊酸(即戊酸盐),己酸(即己酸盐),庚酸(即庚酸盐),辛酸(例如辛酸盐),壬酸(即壬酸盐),2-甲基己酸(即2-甲基己酸盐),3-甲基己酸(即3-甲基己酸盐),4-甲基己酸(即4-甲基己酸盐)和5-甲基己酸(即5-甲基己酸盐)。在一些实施方案中,C4-9羧酸是己酸盐(即己酸)。
如本文中所用,术语“(C3-8烷基)-C(=O)OCH3酯”是指具有下式的化合物:
如本文中所用的,术语“C3-8烷基”是指可以是直链或支链的,具有3至9个碳原子的饱和烃基。在一些实施方案中,烷基含有4至8、4至7、4至6、4至5、5至8、5至7、5至6、6至8、6至7或7至8个碳原子。实例烷基部分包括正丁基,异丁基,仲丁基,叔丁基,正戊基,异戊基,新戊基,正己基,正庚基,正辛基。在一些实施方案中,C3-8烷基是下式的基团:
在一些实施方案中,该方法包括:
a)将C4-9羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯;并且
b)将(C3-8烷基)-C(=O)OCH3酯酶促转化为(C3-8羟基烷基)-C(=O)OCH3酯。
在一些实施方案中,使用具有脂肪酸O-甲基转移酶活性的多肽将C4-9羧酸酶促转化为(C3-8烷基)-C(=O)OCH3酯。在一些实施方案中,具有甲基转移酶活性的多肽与SEQ ID NO:23,SEQ ID NO:24或SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,使用具有单加氧酶活性的多肽将(C3-8烷基)-C(=O)OCH3酯酶促转化成(C3-8羟烷基)-C(=O)OCH3酯。在一些实施方案中,单加氧酶分类在EC 1.14.14.-或EC 1.14.15.-下。在一些实施方案中,单加氧酶与SEQ ID NO:13-15,SEQ ID NO:27和/或SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,从C4-9烷酰基-CoA酶促产生C4-9羧酸。如本文所用的,术语“C4-9烷酰基-CoA”是指具有下式的化合物:
其中C3-8烷基如本文所定义。在一些实施方案中,C3-8烷基是下式的基团:
在一些实施方案中,具有硫酯酶活性的多肽从C4-9烷酰基-CoA酶促产生C4-9羧酸。在一些实施方案中,硫酯酶与SEQ ID NO:1所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,具有丁醛脱氢酶活性的多肽和具有醛脱氢酶活性的多肽从C4-9烷酰基-CoA酶促产生C4-9羧酸。
在一些实施方案中,产生(C3-8羟基烷基)-C(=O)OCH3酯的方法是用于产生6-羟基己酸甲酯的方法,所述方法包括:
a)将己酸酶转化为己酸甲酯;并且
b)将己酸甲酯酶促转化为6-羟基己酸甲酯。
在一些实施方案中,使用具有脂肪酸O-甲基转移酶活性的多肽将己酸酶促转化成己酸甲酯。在一些实施方案中,具有脂肪酸O-甲基转移酶活性的多肽与SEQ ID NO:22,SEQ ID NO:23或SEQ ID NO:24中所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,使用具有单加氧酶活性的多肽将己酸甲酯酶促转化为6-羟基己酸甲酯。在一些实施方案中,具有单加氧酶活性的多肽与SEQ ID NO:13-15,SEQ ID NO:27和/或SEQ ID NO:28中所示的氨基酸具有至少70%的序列同一性。在一些实施方案中,具有单加氧酶活性的多肽分类在EC1.14.14.-或EC 1.14.15.-下。
在一些实施方案中,从己酰基-CoA酶促产生己酸。在一些实施方案中,具有硫酯酶活性的多肽从己酰基-CoA酶促产生己酸。在一些实施方案中,具有硫酯酶活性的多肽与SEQ ID NO:1,和/或SEQ ID NO:32-33所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,具有丁醛脱氢酶活性的多肽和具有醛脱氢酶活性的多肽从己酰基-CoA酶促产生己酸。
本文件还提供了产生一种或多种末端羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯的方法。如本文所用的,术语“(C4-9烷基)-OC(=O)-(C3-8烷基)酯”是指具有下式的化合物:
其中C3-8烷基如本文所定义。如本文所用的,术语“末端羟基取代的”(C4-9烷基)-OC(=O)-(C3-8烷基)酯”是指具有下式的化合物:
其中烷基中的至少一个(即C4-9烷基和C3-8烷基中的至少一个)被至少一个末端羟基(-OH)基团取代,并且C3-8烷基如本文所定义。如本文所用的,术语“C4-9烷基”是指可以是直链或支链的,具有4-9个碳原子的饱和烃基。在一些实施方案中,烷基包含4至9、4至8、4至7、4至6、4至5、5至9、5至8、5至7、5至6、6至9、6至8,6至7,7至9,7至8或8至9个碳原子。实例烷基部分包括正丁基,异丁基,仲丁基,叔丁基,正戊基,异戊基,新戊基,正己基,正庚基,正辛基和正壬基。在一些实施方案中,烷基之一被至少一个末端羟基取代。在一些实施方案中,每个烷基被至少一个末端羟基取代。在一些实施方案中,烷基之一被一个末端羟基取代。在一些实施方案中,每个烷基被一个末端羟基取代。在一些实施方案中,末端羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯选自:
在一些实施方案中,该方法包括:
a)将C4-9烷酰基-CoA酶促转化成(C4-9烷基)-OC(=O)-(C3-8烷基)酯;并且
b)将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化为(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯中的任一种。
在一些实施方案中,使用具有醇O-乙酰转移酶活性的多肽将C4-9烷酰基-CoA酶促转化为(C4-9烷基)-OC(=O)-(C3-8烷基)酯。在一些实施方案中,所述醇O-乙酰转移酶与SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,使用具有单加氧酶活性的多肽将(C4-9烷基)-OC(=O)-(C3-8烷基)酯酶促转化为(C4-9烷基)-OC(=O)-(C3-8羟基烷基)酯,(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯中的任一种。在一些实施方案中,具有单加氧酶活性的多肽归类在EC 1.14.14.-或EC 1.14.15.-下。
在一些实施方案中,所述方法还包括将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯酶促转化成C4-9羟基链烷酸。在一些实施方案中,具有酯酶活性的多肽将(C4-9羟基烷基)-OC(=O)-(C3-8羟基烷基)酯或(C4-9羟基烷基)-OC(=O)-(C3-8烷基)酯转化为C4-9羟基链烷酸。
如本文所用,术语C4-9羟基链烷酸是指具有下式的化合物:
其中C3-8羟基烷基如本文所定义。实例C4-9羟基链烷酸包括但不限于6-羟基己酸盐(即6-羟基己酸),5-羟基己酸盐(即5-羟基己酸),4-羟基己酸盐(即4-羟基己酸),3-羟基己酸盐(即,3-羟基己酸)等。本领域技术人员应理解,具体形式将取决于pH(例如,中性或离子化形式,包括其任何盐形式)。在一些实施方案中,C3-8羟基烷基是具有下式的基团:
在一些实施方案中,产生一种或多种羟基取代的(C4-9烷基)-OC(=O)-(C3-8烷基)酯的方法是产生一种或多种己酸己基羟基酯的方法。在一些实施方案中,该方法包括:
a)将己酰基-CoA酶促转化成己酸己酯;并且
b)将己酸己酯酶促转化为6-羟基己酸己酯,6-羟基己酸6-羟基己酯或己酸6-羟基己酯中的任一种。
在一些实施方案中,使用具有醇O-乙酰转移酶活性的多肽将己酰基-CoA酶促转化成己酸己酯。在一些实施方案中,具有醇O-乙酰转移酶活性的多肽与SEQ ID NO:25所示的氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,使用具有单加氧酶活性的多肽将己酸己酯酶促转化为6-羟基己酸己酯,6-羟基己酸6-羟基己酯和/或己酸6-羟基己酯中的任一种。在一些实施方案中,具有单加氧酶活性的多肽归类在EC 1.14.14.-或EC 1.14.15.-下。
在一些实施方案中,所述方法还包括将6-羟基己酸6-羟基己酯或6-羟基己酸己酯酶促转化为6-羟基己酸。在一些实施方案中,具有酯酶活性的多肽将6-羟基己酸6-羟基己酯或6-羟基己酸己酯酶促转化为6-羟基己酸。
在一些实施方案中,所述方法还包括将6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化为1,6-己二醇。在一些实施方案中,具有酯酶活性的多肽将6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化为1,6-己二醇。
在一些实施方案中,所述方法可包括将6-羟基己酸己酯,6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化为6-羟基己酸和/或1,6-己二醇。在一些实施方案中,具有酯酶活性的多肽将6-羟基己酸己酯,6-羟基己酸6-羟基己酯或己酸6-羟基己酯酶促转化成6-羟基己酸和/或1,6-己基二醇。
在一些实施方案中,该方法进一步包括将1,6-己二醇酶促转化为6-羟基己醛。在一些实施方案中,具有醇脱氢酶活性的多肽将1,6-己二醇酶促转化为6-羟基己醛。
在一些实施方案中,该方法还包括将6-羟基己醛酶促转化为6-羟基己酸。在一些实施方案中,具有醛脱氢酶活性的多肽将6-羟基己醛酶促转化为6-羟基己酸。
在一些实施方案中,所述方法还包括将6-羟基己酸甲酯酶促转化为6-羟基己酸。在一些实施方案中,具有脱甲基酶或酯酶活性的多肽将6-羟基己酸甲酯酶促转化为6-羟基己酸。
在一些实施方案中,所述方法还包括将6-羟基己酸酶促转化为选自下组的产物:己二酸,己二酸半醛,6-氨基己酸,六亚甲基二胺和1,6-己二醇。
在一些实施方案中,所述方法包括使用具有醇脱氢酶活性的多肽,具有6-羟基己酸脱氢酶活性的多肽,具有5-羟基戊酸脱氢酶活性的多肽,具有4-羟基丁酸脱氢酶活性的多肽或具有单加氧酶活性的多肽将6-羟基己酸酶促转化为己二酸半醛。
在一些实施方案中,所述方法进一步使用具有5-氧代戊酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有7-氧代庚酸脱氢酶活性的多肽,具有醛脱氢酶活性的多肽,或具有单加氧酶活性的多肽将己二酸半醛酶促转化为己二酸。
在一些实施方案中,所述方法还包括将己二酸半醛酶促转化为6-氨基己酸。在一些实施方案中,具有ω-转氨酶活性的多肽将己二酸半醛酶促转化为6-氨基己酸。
在一些实施方案中,所述方法还包括将6-氨基己酸酶促转化为六亚甲基二胺。在一些实施方案中,所述方法还包括将己二酸半醛酶促转化为六亚甲基二胺。在一些实施方案中,使用具有羧酸还原酶活性的多肽和/或具有ω-转氨酶活性的多肽和任选地具有N-乙酰转移酶活性的多肽,具有乙酰腐胺脱乙酰酶活性的多肽和具有醇脱氢酶活性的多肽中的一种或多种,将己二酸半醛或6-氨基己酸酶促转化成六亚甲基二胺。
在一些实施方案中,所述方法包括使用具有羧酸还原酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为1,6-己二醇。
在一些实施方案中,所述方法还包括将1,6-己二醇酶促转化为六亚甲基二胺。在一些实施方案中,具有醇脱氢酶活性的多肽和具有ω-转氨酶活性的多肽将1,6-己二醇酶促转化六亚甲基二胺。
在一些实施方案中,具有羧酸还原酶活性的多肽,具有ω-转氨酶活性的多肽和具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为六亚甲基二胺。
在一些实施方案中,具有ω-转氨酶活性的多肽与SEQ ID NO:7-12中所示的任一氨基酸序列具有至少70%的序列同一性。
在一些实施方案中,通过CoA依赖性碳链延长的两个循环从乙酰基-CoA产生己酰基-CoA。在一些实施方案中,所述CoA依赖性碳链延长的两个循环的每一个包括使用具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮脂酰基-[acp]合酶活性的多肽,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA还原酶活性的多肽,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽,以从乙酰基-CoA形成己酰基-CoA。
将己酸或己酰基-CoA转化为6-羟基己酸的酶
如图7中描绘,可以使用具有脂肪酸O-甲基转移酶活性的多肽,如具有例如EC 2.1.1.15下分类的脂肪酸O-甲基转移酶活性的多肽从己酸形成己酸甲酯。例如,具有脂肪酸O-甲基转移酶活性的多肽可以获自海分枝杆菌(GenBank登录号ACC41782.1,SEQ ID NO:22);耻垢分枝杆菌(参见GenBank登录号ABK73223.1,SEQ ID NO:23)或恶臭假单胞菌(参见GenBank登录号CAA39234.1,SEQ ID NO:24)。
可以使用具有例如在EC 1.14.14.-或EC 1.14.15-(1,3)下分类的单加氧酶活性的多肽将己酸甲酯转化为6-羟基己酸甲酯。例如,具有单加氧酶活性可以是例如来自CYP153A家族(SEQ ID NO:13-15),CYP52A3家族(参见Genbank登录号:BAA00371.1,SEQ ID NO:28)或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(参见Genbank登录号CAB51047.1,SEQ ID NO:27)。参见图7。
可以使用具有例如在EC 2.1.1.-下分类的脱甲基酶活性的多肽,如ligM(参见GenBank登录号BAD61059.1;SEQ SEQ ID NO:30)或desA(GenBank登录号BAC79257.1;SEQ ID NO:31)的基因产物或使用具有例如在EC 3.1.1.-下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将6-羟基己酸甲酯转化为6-羟基己酸。
如图7中描绘,可以使用具有例如在EC 2.3.1.-(84)下分类的醇O-乙酰转移酶活性的多肽,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)将己酰基-CoA转化为己酸己酯。
可以使用具有例如在EC 1.14.14.-或EC 1.14.15-(1,3)下分类的单加氧酶活性的多肽将己酸己酯转化为6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3家族(Genbank登录号:BAA00371.1,SEQ ID NO:28)或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(Genbank登录号CAB51047.1,SEQ ID NO:27)。参见图7。
可以使用具有例如EC 3.1.1.-(1,6)下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将6-羟基己酸己酯和6-羟基己酸6-羟基己酯转化为6-羟基己酸。
例如,在例如EC 1.14.15.-(1,3)下分类的单加氧酶CYP153A家族是可溶的,并且对末端羟基化具有区域特异性,接受中等链长度底物(参见例如Koch等人,Appl.Environ.Microbiol.,2009,75(2),337-344;Funhoff等人,2006,J.Bacteriol.,188(44):5220–5227;Van Beilen&Funhoff,Current Opinion in Biotechnology,2005,16,308–314;Nieder and Shapiro,J.Bacteriol.,1975,122(1),93-98)。虽然在体外观察到CYP153A的非末端羟基化,但在体内仅发生1-羟基化(参见,Funhoff等人,2006,同上)。
已经通过成功地将CYP153A的链长度特异性降低到低于C8,拓宽了末端单加氧酶的底物特异性和活性(Koch等人,2009,同上)。
在一些实施方案中,可以使用归类在EC 3.1.2.-下的具有硫酯酶活性的多肽,如YciA的基因产物tesB(GenBank登录号AAA24665.1,SEQ ID NO:1),Acot13(Cantu等人,Protein Science,2010,19,1281–1295;Zhuang等人,Biochemistry,2008,47(9):2789–2796;Naggert等人,J.Biol.Chem.,1991,266(17):11044–11050),来自短乳杆菌(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌(GenBank登录号CCC78182.1,SEQ ID NO:SEQ ID NO:33)的酰基-[acp]硫酯酶从己酰基-CoA酶促形成己酸。此类酰基-[acp]硫酯酶具有C6-C8链长度特异性(参见例如Jing等人,2011,BMC Biochemistry,12(44))。参见图3。
在一些实施方案中,可以使用具有例如在EC 1.2.1.-如EC 1.2.1.10或EC 1.2.1.57下分类(参见例如GenBank登录号AAD39015,SEQ ID NO:29或GenBank登录号ABJ64680.1)的丁醛脱氢酶活性的多肽,如PduP或PduB的基因产物和分类在例如EC 1.2.1.-(例如EC 1.2.1.3或EC 1.2.1.4)下的醛脱氢酶从己酰基-CoA酶促形成己酸(参见Ho&Weiner,J.Bacteriol.,2005,187(3):1067–1073)。参见图3。
产生己酰基-CoA以转化成C6构件块的酶
如图1和图2中描绘,可以通过使用NADH或NADPH依赖性酶的经由两个循环的CoA依赖性碳链延长从乙酰基-CoA形成己酰基-CoA。
在一些实施方案中,CoA依赖性碳链延伸循环包括使用具有β-酮硫解酶活性的多肽或具有乙酰基-CoA羧化酶活性的多肽和具有β-酮酯酰基-[acp]合酶活性的多肽,具有3-羟酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基CoA还原酶活性,具有烯酰基-CoA水合酶活性的多肽和具有反式-2-烯酰基-CoA还原酶活性的多肽。具有β-酮硫解酶活性的多肽可以将乙酰基-CoA转化为3-氧代丁酰基-CoA,并且可以将丁酰基-CoA转化为3-氧代己酰基-CoA。具有乙酰基-CoA羧化酶活性的多肽可以将乙酰基-CoA转化为丙二酰基-CoA。具有乙酰乙酰基-CoA合酶活性的多肽可以将丙二酰基-CoA转化为乙酰乙酰基-CoA。具有3-羟基丁酰基-CoA脱氢酶活性的多肽可以将3-氧代丁酰基-CoA转化为3-羟基丁酰基CoA。具有3-氧代酰基CoA还原酶/3-羟基酰基-CoA脱氢酶活性的多肽可以将3-氧代己酰基-CoA转化为3-羟基己酰基-CoA。具有烯酰基-CoA水合酶活性的多肽可以将3-羟基丁酰基-CoA转化为丁-2-烯酰基-CoA,并且可以将3-羟基己酰基-CoA转化为己-2-烯酰基-CoA。具有反式-2-烯酰基-CoA还原酶活性的多肽可将丁-2-烯酰基-CoA转化为丁酰基-CoA,并可将己-2-烯酰基-CoA转化为己酰基-CoA。参见图1和2。
在一些实施方案中,具有β-酮硫解酶活性的多肽可以在EC 2.3.1.16下分类,如bktB的基因产物(参见例如Genbank登录号AAC38322.1)。由来自钩虫贪铜菌的bktB编码的具有β-酮硫解酶活性的多肽接受丁酰基-CoA作为底物。当丁酰基-CoA是底物时,产生CoA-活化的C6脂肪族主链(3-氧代己酰基-CoA)(参见例如Haywood等人,FEMS Microbiology Letters,1988,52:91-96;Slater等人,J.Bacteriol.,1998,180(8):1979-1987)。由paaJ(参见例如Genbank登录号AAC74479.1),catF和pcaF编码的具有β-酮硫解酶活性的多肽可以分类在例如EC 2.3.1.174下。由paaJ编码的具有β-酮硫解酶活性的多肽将乙酰基-CoA和琥珀酰基-CoA缩合成3-氧代己二酰基-CoA(参见例如Fuchs等人,2011,Nature Reviews Microbiology,9,803–816;等人,2002,J.Bacteriol.,184(1),216–223)。参见图1和2。
在一些实施方案中,具有乙酰基-CoA羧化酶活性的多肽可以例如在EC 6.4.1.2下分类。在一些实施方案中,具有β-酮脂酰基-[acp]合酶活性的多肽可以分类在例如2.3.1.180下,如来自黄色葡萄球菌的FabH的基因产物(Qiu等人,2005,Protein Science,14:2087–2094)。参见图1和2。
在一些实施方案中,具有3-羟基酰基-CoA脱氢酶活性的多肽或具有3-氧代酰基-CoA脱氢酶活性的多肽可以分类在EC 1.1.1.-下。例如,具有3-羟基酰基-CoA脱氢酶活性的多肽可以在EC 1.1.1.35下分类,如fadB的基因产物(图1);分类在EC 1.1.1.157下,如hbd的基因产物(可以称为3-羟基丁酰基-CoA脱氢酶)(图1);或归类在EC1.1.1.36下,如phaB的乙酰乙酰基-CoA还原酶基因产物(Liu&Chen,Appl.Microbiol.Biotechnol.,2007,76(5):1153–1159;Shen等人,Appl.Environ.Microbiol.,2011,77(9):2905–2915;Budde等人,J.Bacteriol.,2010,192(20):5319–5328)(图2)。
在一些实施方案中,具有3-氧代酰基-CoA还原酶活性的多肽可以分类在EC 1.1.1.100下,如fabG的基因产物(Budde等人,J.Bacteriol.,2010,192(20):5319–5328;Nomura等人,Appl.Environ.Microbiol.,2005,71(8):4297–4306)。图2。
在一些实施方案中,具有烯酰基-CoA水合酶活性的多肽可以在EC4.2.1.17下分类,例如crt的基因产物(Genbank登录号AAA95967.1)(图1)或在EC 4.2.1.119下分类,如phaJ的基因产物(Genbank登录号BAA21816.1)(图2)(Shen等人,2011,同上;Fukui等人,J.Bacteriol.,1998,180(3):667–673)。
在一些实施方案中,具有反式-2-烯酰基-CoA还原酶活性的多肽可以在EC 1.3.1.38(图2),EC 1.3.1.8(图2)或EC 1.3.1.44(图1)下分类,如ter(Genbank登录号AAW66853.1)(Nishimaki等人,J.Biochem.,1984,95:1315–1321;Shen等人,2011,同上)或tdter(Genbank登录号AAS11092.1)(Bond-Watts等人,Biochemistry,2012,51:6827–6837)的基因产物。
在C6构件块的生物合成中产生末端羧基的酶
如图4、5和7中描绘,可以使用具有硫酯酶活性的多肽,具有醛脱氢酶活性的多肽,具有7-氧代庚酸脱氢酶活性的多肽,具有6-氧代己酸脱氢酶活性的多肽,具有5-氧代戊酸脱氢酶活性的多肽,具有单加氧酶活性的多肽,具有酯酶活性的多肽或具有脱甲基酶活性的多肽酶促形成末端羧基基团。
在一些实施方案中,第一末端羧基由具有归类在EC2.1.1.-下的丁香酸O-脱甲基酶活性的多肽,如ligM(参见GenBank登录号BAD61059.1;SEQ ID NO:30)或desA(GenBank登录号BAC79257.1;SEQ ID NO:31)的基因产物或具有在EC 3.1.1.-下分类的酯酶活性的多肽,如EstC的基因产物(参见例如GenBank登录号AAC60471.2,SEQ ID NO:26)酶促形成。参见例如图7。
在一些实施方案中,第一末端羧基由具有例如在EC 1.2.1.3或EC 1.2.1.4下分类的醛脱氢酶活性的多肽酶促形成。
在一些实施方案中,导致合成己二酸的第二末端羧基由具有例如在EC 1.2.1.3下分类的醛脱氢酶活性的多肽酶促形成(参见Guerrillot&Vandecasteele,Eur.J.Biochem.,1977,81,185–192)。参见图4。
在一些实施方案中,导致合成己二酸的第二末端羧基由具有归类在EC 1.2.1.-下的具有脱氢酶活性的多肽酶促形成,如具有5-氧代戊酸脱氢酶活性的多肽(例如,CpnE的基因产物),具有6-氧代己酸脱氢酶活性的多肽(例如,来自不动杆菌属物种的ChnE的基因产物),具有7-氧代庚酸脱氢酶活性的多肽(例如来自Sphingomonas macrogolitabida的ThnG的基因产物)(Iwaki等人,Appl.Environ.Microbiol.,1999,65(11),5158–5162;López-Sánchez等人,Appl.Environ.Microbiol.,2010,76(1),110-118)。例如,具有5-氧代戊酸脱氢酶活性的多肽可以在EC 1.2.1.20下分类。例如,具有6-氧代己酸脱氢酶活性的多肽可以在EC 1.2.1.63下分类。例如,具有7-氧代庚酸脱氢酶活性的多肽可以在EC 1.2.1.-下分类。参见图4。
在一些实施方案中,导致合成己二酸的第二末端羧基通过在细胞色素P450家族中具有单加氧酶活性的多肽如CYP4F3B酶促形成(参见例如Sanders等人,J.Lipid Research,2005,46(5):1001-1008;Sanders等人,The FASEB Journal,2008,22(6):2064–2071)。参见图4。
ω-氧化在将羧基引入到烷中的用途已经在酵母热带假丝酵母(Candida tropicalis)中证实,导致己二酸的合成(Okuhara等人,Agr.Biol.Chem.,1971,35(9),1376–1380)。
在C6构件块的生物合成中产生末端胺基团的酶
如图5和图6中描绘,可以使用具有ω-转氨酶活性的多肽或具有脱乙酰酶活性的多肽来酶促形成末端胺基。
在一些实施方案中,导致6-氨基己酸,6-氨基己醛或6-氨基己醇的合成的第一末端胺基团由分类在例如EC 2.6.1.-下的ω-转氨酶酶促形成,如EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82,如获自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(Genbank登录号ABA81135.1,SEQ ID NO:10),河流弧菌(Genbank登录号AAA57874.1,SEQ ID NO:12),灰色链霉菌或Clostridium viride。在本文所述的方法和宿主中可以使用具有ω-转氨酶活性的另外的多肽来自大肠杆菌(Genbank登录号AAA57874.1,SEQ ID NO:11)。例如具有在EC 2.6.1.29或EC 2.6.1.82下分类的ω-转氨酶活性的一些多肽是具有二胺ω-转氨酶活性的多肽(例如,SEQ ID NO:11)。参见例如图5和6。
来自紫色色杆菌(Chromobacterium violaceum)的具有ω-转氨酶活性的可逆多肽(Genbank登录号AAQ59697.1,SEQ ID NO:7)已经证明类似的活性,其接受6-氨基己酸作为氨基供体,从而形成己二酸半醛中的第一末端胺基(Kaulmann等人,Enzyme and Microbial Technology,2007,41,628–637)。
来自灰色链霉菌的具有4-氨基丁酸:2-酮戊二酸转氨酶活性的可逆性多肽已经证明了将6-氨基己酸转化为己二酸半醛的类似活性(Yonaha等人,Eur.J.Biochem.,1985,146,101-106)。
来自Clostridium viride的具有5-氨基戊酸转氨酶活性的可逆性多肽已经证明了将6-氨基己酸转化为己二酸半醛的类似活性(Barker等人,J.Biol.Chem.,1987,262(19),8994–9003)。
在一些实施方案中,导致六亚甲基二胺合成的第二末端胺基团由具有二胺转氨酶活性的多肽酶促形成。例如,第二末端氨基可以由具有二胺转氨酶活性的多肽酶促形成,例如在EC 2.6.1.-,例如EC 2.6.1.29下分类,或例如在EC 2.6.1.82下分类,如来自大肠杆菌的YgjG的基因产物(Genbank登录号AAA57874.1,SEQ ID NO:12)。参见图6。
ygjG的基因产物接受宽范围的二胺碳链长度底物,如腐胺,尸胺和亚精胺(Samsonova等人,BMC Microbiology,2003,3:2)。
来自大肠杆菌菌株B的具有二胺转氨酶活性的多肽已经证明了对1,7二氨基庚烷的活性(Kim,The Journal of Chemistry,1964,239(3),783–786)。
在一些实施方案中,导致六亚甲基二胺合成的第二末端胺基团由具有脱乙酰酶活性的多肽酶促形成,例如在EC 3.5.1.62下分类,如具有乙酰腐胺脱乙酰酶活性的多肽。来自藤黄微球菌(Micrococcus luteus)K-11的具有乙酰腐胺脱乙酰酶活性的多肽接受宽范围的碳链长度底物,如乙酰腐胺,乙酰尸胺和N8-乙酰基精胺(参见例如Suzuki等人,1986,BBA–General Subjects,882(1):140–142)。
在C6构件块的生物合成中产生末端羟基的酶
如图8中描绘,可以使用具有醇脱氢酶活性的多肽酶促形成末端羟基。例如,导致1,6己二醇合成的第二末端羟基可以通过分类在EC 1.1.1.-(例如,EC 1.1.1.1,1.1.1.2,1.1.1.21或1.1.1.184)下的具有醇脱氢酶活性的多肽酶促形成。第一末端羟基可以用具有单加氧酶活性的多肽酶促形成,如上文关于图7中6-羟基己酸甲酯的形成所讨论的。
如图8中描绘,可以使用例如在EC 2.3.1.-(84)下分类的具有醇O-乙酰转移酶活性的多肽将己酰基-CoA转化为己酸己酯,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)。
可以使用例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的具有单加氧酶活性的多肽将己酸己酯转化为6-羟基己酸6-羟基己酯。可以使用例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的具有单加氧酶活性的多肽将己酸己酯转化为己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3家族或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物。参见图7。
可以使用例如在EC 3.1.1.-(例如EC 3.1.1.1或EC 3.1.1.6)下分类的具有酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将己酸6-羟基己酯和6-羟基己酸6-羟基己酯转化为1,6-己二醇。
生化途径
到作为C6构件块的中心前体的己酰基-CoA的途径
在一些实施方案中,如下从乙酰基-CoA合成己酰基-CoA:通过具有例如在EC 2.3.1.9下分类的β-酮硫解酶活性的多肽,如phaA或atoB的基因产物将乙酰基-CoA转化为3-氧代丁酰基-CoA;然后通过具有例如在EC 1.1.1.35下分类(如fadB的基因产物)或在例如EC 1.1.1.157下分类(如hbd的基因产物)的3-羟基酰基-CoA脱氢酶活性的多肽将3-氧代丁酰基-CoA转化为(S)3-羟基丁酰基-CoA;然后通过例如在EC 4.2.1.17下分类的具有烯酰基-CoA水合酶活性的多肽,如crt的基因产物(Genbank登录号AAA95967.1)将(S)3-羟基丁酰基-CoA转化为丁-2-烯酰基-CoA;然后通过具有例如在EC 1.3.1.44下分类的反式-2-烯酰基-CoA还原酶活性的多肽,如ter(Genbank登录号AAW66853.1)或tdter(Genbank登录号AAS11092.1)的基因产物将丁-2-烯酰基-CoA转化为丁酰基-CoA;然后通过具有例如在EC 2.3.1.16下分类的(如bktB的基因产物(Genbank登录号AAC38322.1))或在例如EC 2.3.1.174下分类的(如paaJ的基因产物(Genbank登录号AAC74479.1))的β-酮硫解酶活性的多肽将丁酰基-CoA转化为3-氧代-己酰基-CoA;然后通过具有例如在EC 1.1.1.35下分类的3-羟基酰基-CoA脱氢酶活性的多肽,如fadB的基因产物或通过具有例如在EC 1.1.1.157下分类的3-羟基酰基-CoA脱氢酶活性的多肽,如hbd的基因产物将3-氧代-己酰基-CoA转化为(S)3-羟基己酰基-CoA;然后通过具有例如在EC 4.2.1.17下分类的烯酰基-CoA水合酶活性的多肽,如crt的基因产物(Genbank登录号AAA95967.1)将(S)3-羟基己酰基-CoA转化为己-2-烯酰基-CoA;随后通过具有例如在EC 1.3.1.44下分类的反式-2-烯酰基-CoA还原酶活性的多肽,如ter(Genbank登录号AAW66853.1)或tdter(Genbank登录号AAS11092.1)的基因产物将己-2-烯酰基-CoA转化为己酰基-CoA。参见图1。
在一些实施方案中,如下从中心代谢物乙酰基-CoA合成己酰基-CoA:通过具有例如在EC 2.3.1.9下分类的β-酮硫解酶活性的多肽,如phaA或atoB的基因产物将乙酰基-CoA转化为3-氧代丁酰基-CoA;然后通过具有例如在EC1.1.1.1.100下分类的3-氧代酰基-CoA还原酶活性的多肽(如fadG的基因产物)或通过具有例如在EC 1.1.1.36下分类的乙酰乙酰基-CoA还原酶活性的多肽,如phaB的基因产物将3-氧代丁酰基-CoA转化为(R)3-羟基丁酰基-CoA;然后通过具有例如在EC 4.2.1.119下分类的烯酰基-CoA水合酶活性的多肽,如phaJ的基因产物(Genbank登录号BAA21816.1)将(R)3-羟基丁酰基-CoA转化为丁-2-烯酰基-CoA;然后通过具有例如在EC 1.3.1.38下分类的反式-2-烯酰基-CoA还原酶活性的多肽或具有在例如EC 1.3.1.8下分类的酰基CoA脱氢酶活性的多肽将丁-2烯酰基-CoA转化为丁烯酰基-CoA;然后通过具有例如在EC 2.3.1.16下分类(如bktB的基因产物(Genbank登录号AAC38322.1))或在例如EC 2.3.1.174下分类(如paaJ的基因产物(Genbank登录号AAC74479.1))的β-酮硫解酶活性的多肽将丁酰基-CoA转化为3-氧代-己酰基-CoA;然后通过具有例如在EC 1.1.1.100下分类的3-氧代酰基-CoA还原酶活性的多肽,如fabG的基因产物将3-氧代-己酰基-CoA转化为(R)3-羟基己酰基-CoA;然后通过具有例如在EC 4.2.1.119下分类的烯酰基-CoA水合酶活性的多肽,如phaJ的基因产物(Genbank登录号BAA21816.1)将(R)3-羟基己酰基-CoA转化为己-2-烯酰基-CoA;然后通过具有例如在EC 1.3.1.38下分类的反式-2-烯酰基-CoA还原酶活性的多肽或在具有例如EC 1.3.1.8下分类的酰基-CoA脱氢酶活性的多肽将己-2-烯酰基-CoA转化为己酰基-CoA。参见图2。
在一些实施方案中,可以从乙酰基-CoA合成3-氧代丁酰基-CoA。可以使用具有例如在EC 6.4.1.2下分类的乙酰基-CoA羧化酶活性的多肽将乙酰基-CoA转化为丙二酰基-CoA,其可以使用具有例如在EC 2.3.1.194下分类的乙酰乙酰基-CoA合酶活性的多肽,如fabH的基因产物转化为3-氧代丁酰基-CoA。参见图1和图2。
使用己酰基-CoA产生中心前体己酸的途径
在一些实施方案中,通过具有例如在EC 3.1.2.-下分类的硫酯酶活性的多肽,如YciA,tesB,Acot13基因产物,短乳杆菌酰基-[acp]硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌酰基-[acp]硫酯酶(GenBank登录号CCC78182.1,SEQ ID NO:33)将己酰基-CoA转化为己酸从己酰基-CoA合成己酸。参见图3。
在一些实施方案中,通过具有例如在EC 1.2.1.57(参见例如GenBank登录号AAD39015,SEQ ID NO:29)或EC 1.2.1.10下分类的丁醛脱氢酶活性的多肽或PduP或PduB的基因产物将己酰基-CoA转化为己醛;然后通过具有例如在EC 1.2.1.4或EC 1.2.1.3下分类的醛脱氢酶活性的多肽将己醛转化为己酸。参见图3。
已经使用NADH和NADPH作为辅因子证明己酰基-CoA至己醛的转化(参见Palosaari and Rogers,J.Bacteriol.,1988,170(7):2971–2976)。
使用己酰基-CoA产生中心前体己醇的途径
在一些实施方案中,如下从己酰基-CoA合成己酸:通过具有例如在EC 3.1.2.-下分类的硫酯酶活性的多肽,如YciA,tesB或Acot13的基因产物,乳杆菌[acp]硫酯酶(GenBank登录号ABJ63754.1,SEQ ID NO:32)或植物乳杆菌酰基-[acp]硫酯酶(GenBank登录号CCC78182.1,SEQ ID NO:33)将己酰基-CoA转化为己酸;然后通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如通过sfp的基因产物增强的car的基因产物将己酸转化成己醛;然后通过具有例如在EC 1.1.1.-如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(参见例如Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;或Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白质(来自嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus))将己醛转化为己醇。参见图3。
在一些实施方案中,通过具有例如在EC 1.2.1.57(参见例如GenBank登录号BAD61059.1,SEQ ID NO:30)下分类的丁醛脱氢酶活性的多肽将己酰CoA转化为己醛;然后通过具有例如在EC 1.1.1.-,如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(参见例如Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;或Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612的蛋白质(来自嗜热脂肪土芽孢杆菌)将己醛转化为己醇。参见图3。
使用己酸或己酰基-CoA作为中心前体到6-羟基己酸的的途径
在一些实施方案中,如下从中心前体己酸合成6-羟基己酸:通过使用具有例如在EC 2.1.1.15下分类的脂肪酸O-甲基转移酶活性的多肽(例如,来自海分枝杆菌(GenBank登录号ACC41782.1,SEQ ID NO:22),耻垢分枝杆菌(参见GenBank登录号ABK73223.1,SEQ ID NO:23)或恶臭假单胞菌(参见GenBank登录号CAA39234.1,SEQ ID NO:24)的脂肪酸O-甲基转移酶)将己酸转化成己酸甲酯;然后使用具有例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的单加氧酶活性的多肽,如具有CYP153A,CYP52A3家族或alkB家族中单加氧酶活性的多肽转化为6-羟基己酸甲酯;然后使用具有在EC 2.1.1.-下分类的丁香酸O-脱甲基酶活性的多肽,如ligM(参见GenBank登录号BAD61059.1;SEQ ID NO:30)或desA(GenBank登录号BAC79257.1;SEQ ID NO:31)的基因产物或使用具有在EC 3.1.1.-下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)(Kim等人,1994,Biosci.Biotech.Biochem,58(1),111-116)转化为6-羟基己酸。
在一些实施方案中,可以通过具有单加氧酶活性的多肽(分类在例如EC 1.14.14.-或EC 1.14.15.-下(例如,EC 1.14.15.1或EC 1.14.15.3),如CYP153A,CYP52A3家族或/和alkB家族中的单加氧酶)将己酸酶促转化为6-羟基己酸。
在一些实施方案中,可以使用具有例如在EC 2.3.1.-(84)下分类的醇O-乙酰转移酶活性的多肽,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)将己酰基-CoA转化成己酸己酯;然后使用具有例如在EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的单加氧酶活性的多肽转化为6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3家族(Genbank登录号:BAA00371.1,SEQ ID NO:28)或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(Genbank登录号:CAB51047.1,SEQ ID NO:27);然后使用具有例如在EC 3.1.1.-(1,6)下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)(Kim等人,1994,Biosci.Biotech.Biochem,58(1),111-116)将6-羟基己酸己酯和/或6-羟基己酸6-羟基己酯转化为6-羟基己酸。参见图7。
使用6-羟基己酸作为中心前体到己二酸的途径
可以通过将6-羟基己酸酶促转化为己二酸半醛合成己二酸半醛,其使用例如在EC 1.1.1.-下分类的具有醇脱氢酶活性的多肽,如YMR318C的基因产物(分类在例如EC 1.1.1.2下,参见GenBank登录号CAA90836.1)(Larroy等人,2002,Biochem J.,361(Pt 1),163–172),cpnD(Iwaki等人,2002,Appl.Environ.Microbiol.,68(11):5671–5684)或gabD(Lütke-Eversloh&Steinbüchel,1999,FEMS Microbiology Letters,181(1):63–71),例如在EC 1.1.1.258下分类的具有6-羟基己酸脱氢酶活性的多肽,如ChnD的基因产物(Iwaki等人,Appl.Environ.Microbiol.,1999,65(11):5158-5162),或具有细胞色素P450活性的多肽(Sanders等人,J.Lipid Research,2005,46(5),1001-1008;Sanders等人,The FASEB Journal,2008,22(6),2064–2071)。参见图4。由YMR318C编码的具有醇脱氢酶活性的多肽具有广泛的底物特异性,包括C6醇的氧化。
可以使用具有例如在EC 1.2.1.-(3、16、20、63、79)下分类的醛脱氢酶活性的多肽,如具有7-氧代庚酸脱氢酶活性的多肽(例如,ThnG的基因产物),具有6-氧代己酸脱氢酶活性的多肽(例如ChnE的基因产物)将己二酸半醛酶促转化为己二酸。参见图4。
使用6-羟基己酸作为中心前体到6-氨基己酸的途径
在一些实施方案中,如下从6-羟基己酸合成6-氨基己酸:通过使用具有例如在EC 1.1.1下分类的醇脱氢酶活性的多肽,如YMR318C的基因产物(分类在例如EC 1.1.1.2下,参见GenBank登录号CAA90836.1)(Larroy等人,2002,Biochem J.,361(Pt 1),163–172),cpnD(Iwaki等人,2002,Appl.Environ.Microbiol.,68(11):5671–5684)或gabD(Lütke-Eversloh&Steinbüchel,1999,FEMS Microbiology Letters,181(1):63–71)或分类在例如EC 1.1.1.258下的6-羟基己酸脱氢酶,如ChnD的基因产物(Iwaki等人,Appl.Environ.Microbiol.,1999,65(11):5158-5162)将6-羟基己酸转化为己二酸半醛;然后通过具有例如在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48,EC 2.6.1.82下分类的ω-转氨酶活性的多肽转化为6-氨基己酸,例如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图5。
使用6-氨基己酸,6-羟基己酸或己二酸半醛作为中心前体到六亚甲基二胺的的途径
在一些实施方案中,如下从中心前体6-氨基己酸合成六亚甲基二胺:通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如car的基因产物,与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因或来自诺卡氏菌的npt基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将6-氨基己酸转化为6-氨基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽将6-氨基己醛转化为六亚甲基二胺,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图6。
由car的基因产物编码的具有羧酸还原酶活性的多肽和增强剂npt或sfp具有广泛的底物特异性,包括末端双官能的C4和C5羧酸(Venkitasubramanian等人,Enzyme and Microbial Technology,2008,42,130–137)。
在一些实施方案中,如下从中心前体6-羟基己酸(其可以如图7所述制备)合成六亚甲基二胺:通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如来自海分枝杆菌(Genbank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌(Genbank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus(Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(Genbank登录号EIV11143.1,SEQ ID NO:5)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将6-羟基己酸转化为6-羟基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)将6-氧代己醇转化为6-氨基己醇;然后通过具有例如在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184)下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白转化为6-氨基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽转化为六亚甲基二胺,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图6。
在一些实施方案中,如下从中心前体6-氨基己酸合成六亚甲基二胺:通过具有N-乙酰基转移酶活性的多肽,如具有归类于例如EC 2.3.1.32下的赖氨酸N-乙酰转移酶活性的多肽将6-氨基己酸转化成N6-乙酰基-6-氨基己酸;然后通过具有例如在EC 1.2.99.6下分类的羧酸还原酶活性的多肽,如来自Segniliparus rugosus(Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(Genbank登录号EIV11143.1,SEQ ID NO:5)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,转化为N6-乙酰基-6-氨基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48,或EC 2.6.1.82下分类的ω-转氨酶活性的多肽,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)转化为N6-乙酰基-1,6-二氨基己烷;然后通过具有例如在EC 3.5.1.17或EC 3.5.1.62下分类的乙酰腐胺脱乙酰基酶活性的多肽转化为六亚甲基二胺。参见图6。
在一些实施方案中,如下从中心前体己二酸半醛合成六亚甲基二胺:通过具有例如在EC 1.2.99.6下分类的羧酸还原活性的多肽,如来自Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将己二酸半醛转化为己二醛;然后通过具有例如在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽转化为6-氨基己醛;然后通过例如在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的活性ω-转氨酶如SEQ ID NO:7-12转化为六亚甲基二胺。参见图6。
在一些实施方案中,如下从中心前体1,6-己二醇合成六亚甲基二胺:通过具有例如在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21,或EC1.1.1.184)下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)的基因产物或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白将1,6-己二醇转化为6-羟基己醛;然后通过具有例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类的ω-转氨酶活性的多肽如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)将6-氧代己醛转化为6-氨基己醇;然后通过具有例如在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184)下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白将6-氧代己醛转化为6-氨基己醛;随后转化为六亚甲基二胺,例如在EC 2.6.1.-如2.6.1.18,EC 2.6.1.19,EC 2.6.1.29,EC 2.6.1.48或EC 2.6.1.82下分类,如来自紫色色杆菌(参见GenBank登录号AAQ59697.1,SEQ ID NO:7),铜绿假单胞菌(参见GenBank登录号AAG08191.1,SEQ ID NO:8),丁香假单胞菌(参见GenBank登录号AAY39893.1,SEQ ID NO:9),球形红杆菌(参见GenBank登录号ABA81135.1,SEQ ID NO:10),大肠杆菌(参见GenBank登录号AAA57874.1,SEQ ID NO:11)或河流弧菌(参见GenBank登录号AEA39183.1,SEQ ID NO:12)。参见图6。
使用6-羟基己酸和己酰基-CoA作为中心前体到1,6-己二醇的途径
在一些实施方案中,如下从中心前体6-羟基己酸合成1,6己二醇:通过具有例如在EC 1.2.99.6下分类的羧酸还原活性的多肽如来自海分枝杆菌(Genbank登录号ACC40567.1,SEQ ID NO:2),耻垢分枝杆菌(Genbank登录号ABK71854.1,SEQ ID NO:3),Segniliparus rugosus(Genbank登录号EFV11917.1,SEQ ID NO:4),马赛分枝杆菌(Genbank登录号EIV11143.1,SEQ ID NO:5)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:6),与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因(Genbank登录号CAA44858.1,SEQ ID NO:20)或来自诺卡氏菌的npt(Genbank登录号ABI83656.1,SEQ ID NO:21)基因编码)或来自灰色链霉菌的GriC和GriD的基因产物组合,将6-羟基己酸转化为6-羟基己醛;然后通过具有例如在EC 1.1.1.-如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184下分类的醇脱氢酶活性的多肽,如YMR318C(Genbank登录号CAA90836.1)或YqhD(来自大肠杆菌,GenBank登录号AAA69178.1)(来自大肠杆菌,GenBank登录号AAA69178.1)的基因产物(参见例如Liu等人,Microbiology,2009,155,2078–2085;Larroy等人,2002,Biochem J.,361(Pt 1),163–172;或Jarboe,2011,Appl.Microbiol.Biotechnol.,89(2),249-257)或具有GenBank登录号CAA81612.1的蛋白质(来自嗜热脂肪土芽孢杆菌)将7-羟基己醛转化为1,6己二醇。参见图8。
在一些实施方案中,可以使用具有例如在EC 2.3.1.-(84)下分类的醇O-乙酰转移酶活性的多肽,如Eht1的基因产物(Genbank登录号:CAA85138.1,SEQ ID NO:25)将己酰基-CoA转化成己酸己酯;然后使用在具有例如EC 1.14.14.-或EC 1.14.15.-(1,3)下分类的单加氧酶活性的多肽转化为己酸6-羟基己酯和/或6-羟基己酸6-羟基己酯。例如,具有单加氧酶活性的多肽可以是例如来自CYP153A家族,CYP52A3(Genbank登录号:BAA00371.1,SEQ ID NO:28)家族或alkB家族,如来自恶臭假单胞菌的alkBGT的基因产物(Genbank登录号:CAB51047.1,SEQ ID NO:27);然后使用具有例如在EC 3.1.1.-(1,6)下分类的酯酶活性的多肽,如EstC的基因产物(参见GenBank登录号AAC60471.2,SEQ ID NO:26)将己酸6-羟基己酯和/或6-羟基己酸6-羟基己酯转化为1,6-己二醇。参见图8。
培养策略
在一些实施方案中,培养策略需要实现需氧、厌氧、微需氧、或混合氧/反硝化培养条件。体外表征为氧敏感性的酶需要维持极低溶解氧浓度的微需氧培养策略(参见例如,Chayabatra&Lu-Kwang,Appl.Environ.Microbiol.,2000,66(2),493 0 498;Wilson and Bouwer,1997,Journal of Industrial Microbiology and Biotechnology,18(2-3),116-130)。
在一些实施方案中,培养策略需要营养限制,如氮,磷酸盐或氧限制。
在一些实施方案中,可以利用除了氧以外的最终电子受体诸如硝酸盐。在一些实施方案中,可以采用使用例如陶瓷膜的细胞保留策略来实现并维持补料分批或连续发酵期间的高细胞密度。
在一些实施方案中,在一种或多种C6构件块合成中对发酵补料的主要碳源可以源自生物或非生物原料。
在一些实施方案中,所述生物原料可以是或可以源自单糖,二糖,木质纤维素、半纤维素、纤维素、木质素、乙酰丙酸和甲酸、甘油三酯、甘油、脂肪酸、农业废物、浓缩酒糟(condensed distillers'solubles)或城市废物。
已经在几种微生物(诸如大肠杆菌、钩虫贪铜菌、食油假单胞菌、恶臭假单胞菌和解脂耶罗维亚酵母)中证明了源自生物柴油生产的粗制甘油的有效分解代谢(Lee等人,Appl.Biochem.Biotechnol.,2012,166:1801–1813;Yang等人,Biotechnology for Biofuels,2012,5:13;Meijnen等人,Appl.Microbiol.Biotechnol.,2011,90:885-893)。
已经在几种生物体(诸如钩虫贪铜菌和恶臭假单胞菌)中证明了在经由前体丙酰基-CoA的3-羟基戊酸的合成中对木质纤维素衍生的乙酰丙酸的有效分解代谢(Jaremko and Yu,2011,见上文;Martin and Prather,J.Biotechnol.,2009,139:61–67)。
已经在几种微生物(诸如恶臭假单胞菌、钩虫贪铜菌)中证明了木质素衍生的芳香族化合物诸如苯甲酸类似物的有效分解代谢(Bugg等人,Current Opinion in Biotechnology,2011,22,394–400;Pérez-Pantoja等人,FEMS Microbiol.Rev.,2008,32,736–794)。
已经在几种微生物(包括解脂耶罗维亚酵母)中证明了农业废物(诸如橄榄磨坊废水)的有效利用(Papanikolaou等人,Bioresour.Technol.,2008,99(7):2419-2428)。
已经针对几种微生物(诸如大肠杆菌、谷氨酸棒状杆菌和德氏乳杆菌和乳酸乳球菌)证明了可发酵糖类(诸如源自纤维素、半纤维素、甘蔗和甜菜糖蜜、木薯、玉米和其它农业来源的单糖和二糖)的有效利用(参见,例如Hermann et al,J.Biotechnol.,2003,104:155–172;Wee等人,Food Technol.Biotechnol.,2006,44(2):163–172;Ohashi等人,J.Bioscience and Bioengineering,1999,87(5):647-654)。
已经针对钩虫贪铜菌证明了源自多种农业木质纤维素来源的糠醛的有效利用(Li等人,Biodegradation,2011,22:1215–1225)。
在一些实施方案中,所述非生物原料可以是或可以源自天然气、合成气、CO2/H2、甲醇、乙醇、苯甲酸盐、非挥发性残留物(NVR)或来自环己烷氧化过程的碱洗液(caustic wash)废物流、或对苯二甲酸/异酞酸混合物废物流。
已经针对甲基营养型酵母巴斯德毕赤酵母证明了甲醇的有效分解代谢。
已经针对克鲁佛梭菌证明了乙醇的有效分解代谢(Seedorf等人,Proc.Natl.Acad.Sci.USA,2008,105(6)2128-2133)。
已经针对钩虫贪铜菌证明了CO2和H2(其可以源自天然气和其它化学和石油化学来源)的有效分解代谢(Prybylski等人,Energy,Sustainability and Society,2012,2:11)。
已经针对多种微生物(诸如杨氏梭菌和自产乙醇梭菌)证明了合成气的有效分解代谢(等人,Applied and Environmental Microbiology,2011,77(15):5467–5475)。
已经针对多种微生物(诸如食酸代尔夫特菌和钩虫贪铜菌)证明了来自环己烷过程的非挥发性残留物废物流的有效分解代谢(Ramsay等人,Applied and Environmental Microbiology,1986,52(1):152–156)。
在一些实施方案中,所述宿主微生物是原核生物。例如,所述原核生物可以是细菌,来自埃希氏菌属(Escherichia)如大肠杆菌(Escherichia coli);来自梭菌属(Clostridia)如杨氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)或者克鲁佛梭菌(Clostridium kluyveri);来自棒状杆菌属(Corynebacteria)如谷氨酸棒状杆菌(Corynebacterium glutamicum);来自贪铜菌属(Cupriavidus)如钩虫贪铜菌(Cupriavidus necator)或者耐金属贪铜菌(Cupriavidus metallidurans);来自假单胞菌属(Pseudomonas)如荧光假单胞菌(Pseudomonas fluorescens)、恶臭假单胞菌(Pseudomonas putida)或者食油假单胞菌(Pseudomonas oleavorans);来自代尔夫特菌属(Delftia),如食酸代尔夫特菌(Delftia acidovorans);来自芽孢杆菌属(Bacillus)如枯草芽胞杆菌(Bacillus subtillis);来自乳杆菌属(Lactobacillus)如德氏乳杆菌(Lactobacillus delbrueckii);或者来自乳球菌属(Lactococcus)如乳酸乳球菌(Lactococcus lactis)。该原核生物还可以是基因的来源以构建本文中所述的能够生成一种或多种C6构件块的重组宿主细胞。
在一些实施方案中,宿主微生物是真核生物。例如,真核生物可以丝状真菌,例如来自曲霉属(Aspergillus)如黑曲霉(Aspergillus niger)。或者,真核生物可以是酵母,例如来自酵母属(Saccharomyces)如酿酒酵母(Saccharomyces cerevisiae);来自毕赤氏酵属(Pichia)如巴斯德毕赤酵母(Pichia pastoris);或来自耶罗维亚酵母属(Yarrowia)如解脂耶罗维亚酵母(Yarrowia lipolytica);来自伊萨酵母属(Issatchenkia)如东方伊萨酵母(Issathenkia orientalis);来自德巴利酵母属(Debaryomyces)如汉逊德巴利酵母(Debaryomyces hansenii);来自Arxula属如Arxula adenoinivorans;或者来自克鲁维酵母菌属(Kluyveromyces)如乳酸克鲁维酵母菌(Kluyveromyces lactis)。该真核生物还可以是基因的来源以构建本文中所述的能够生成一种或多种C6构件块的重组宿主。
代谢工程
本文件提供方法,所述方法涉及少于针对所有上述途径描述的所有步骤的步骤。这种方法可涉及例如此类步骤中的1、2、3、4、5、6、7、8、9、10、11、12或者更多个。在这种方法包含少于所有步骤的情况下,第一个,且在一些实施方案中唯一的步骤可为所列步骤中的任何步骤。
此外,本文中描述的重组宿主可以包括上述酶中的任何组合,使得所述步骤中的一个或者多个,例如此类步骤中的1、2、3、4、5、6、7、8、9、10或者更多个可以在重组宿主内实施。本文件提供所列出的和遗传工程化以表达本文件中列举的任何酶的一种或者多种(例如,2、3、4、5、6、7、8、9、10、11、12或者更多种)重组形式的任何属和种的宿主细胞。如此,例如,宿主细胞可含有外源核酸,其编码催化本文中描述的任何途径的一个或者多个步骤的酶。
另外,本文件认识到,在酶已经被描述为接受CoA活化的底物的情况下,存在与[acp]结合底物相关的相似的酶活性,其不一定为相同的酶种类。
此外,本文件认识到,在酶已经被描述为接受底物的(R)-对映异构体的情况下,存在与底物的(S)-对映异构体相关的相似的酶活性,其不一定为相同的酶种类。
本文件还认识到,在已经显示酶接受特定辅因子如NADPH或者共底物如乙酰基-CoA的情况下,许多酶在催化特定酶活性中在接受大量不同辅因子或者共底物方面是泛宿主性的(promiscuous)。此外,本文件认识到,在酶对例如特定辅助因子如NADH具有高特异性的情况下,对辅助因子NADPH具有高特异性的具有相似或者相同活性的酶可为不同的酶种类。此外,需要特定辅因子的途径中的酶可以用对不同辅因子具有相似或相同活性和特异性的酶替代。例如,使用对NADH具有特异性的酶的途径中的一个或多个步骤可以用对NADPH具有相似或相同活性和特异性的酶替代。类似地,使用对NADPH具有特异性的酶的途径中的一个或多个步骤可以用对NADH具有相似或相同活性和特异性的酶替代。
在一些实施方案中,本文中概述的途径中的酶是经由非直接或者合理酶设计方法的酶工程的结果,目的在于改善活性、改善特异性、降低反馈抑制、降低阻抑、改善酶溶解度、改变立体特异性,或者改变辅因子特异性。
在一些实施方案中,可以经由附加型或者染色体整合方法将本文概述的途径中的酶基因投入(gene dose)至所得的遗传修饰的生物体中(即,过表达)。
在一些实施方案中,可以利用基因组级别(genome-scale)系统生物学技术如通量平衡分析(Flux Balance Analysis)来设计用于将碳流量引导至C6构件块的基因组级别的减弱或者敲除策略。
减弱策略包括但不限于使用转座子、同源重组(双交叉方法)、诱变、酶抑制剂和RNAi干扰。
在一些实施方案中,可以利用通量组(fluxomic)、代谢物组(metabolomic)和转录物组(transcriptomal)数据来告知或者支持基因组级别的系统生物学技术,由此在将碳流量导向C6构件块的过程中设计基因组级别的减弱或者敲除策略。
在一些实施方案中,可以经由在选择性环境中的连续培养改善宿主微生物对高浓度的C6构件块的耐受性。
在一些实施方案中,可以减弱或提升宿主微生物的内源生物化学网络以(1)确保乙酰基-CoA的胞内利用度,(2)创建NADH或NADPH不平衡,其可以经由一种或多种C6构件块的形成平衡,(3)阻止导致并且包含一种或多种C6构件块的中心代谢物,中心前体的降解和/或(4)确保从细胞的有效流出。
在需要乙酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以在宿主生物体中减弱催化丙酰基-CoA和乙酰基-CoA水解的内源酶,如具有硫酯酶活性的短链多肽。
在需要乙酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱具有产生乙酸的磷酸转乙酰酶活性的内源多肽,如pta(Shen等人,Appl.Environ.Microbiol.,2011,77(9):2905–2915)。
在需要乙酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱在乙酸合成途径中编码具有乙酸激酶活性的多肽的的内源基因,如ack。
在需要乙酰基-CoA和NADH的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱编码催化丙酮酸降解为乳酸的酶(如由ldhA编码的具有乳酸脱氢酶活性的多肽)的内源基因(Shen等人,2011,同上)。
在需要乙酰基-CoA和NADH的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱编码催化磷酸烯醇丙酮酸降解为琥珀酸的酶,如具有menaquinol-延胡索酸氧化还原酶活性的多肽的内源基因,如frdBC(参见例如Shen等人,2011,同上)。
在需要乙酰基-CoA和NADH的胞内利用度用于C6构件块合成的一些实施方案中,可以减弱编码催化乙酰CoA降解为乙醇的酶的内源基因,如由adhE编码的具有醇脱氢酶活性的多肽(Shen等人,2011,同上)。
在一些实施方案中,其中途径需要过量NADH辅因子用于C6构件块合成,可以在宿主生物中过表达具有甲酸脱氢酶活性基因的重组多肽(Shen等人,2011,同上)。
在一些实施方案中,其中途径需要过量的NADH或NADPH辅因子用于C6构件块合成,可以减弱具有消散辅因子不平衡的转氢酶活性的多肽。
在一些实施方案中,可以减弱编码催化丙酮酸降解为乙醇的酶的内源基因,如具有丙酮酸脱羧酶活性的多肽。
在一些实施方案中,可以减弱编码催化异丁醇生成的酶的内源基因,如具有2-酮酸脱羧酶活性的多肽。
在需要乙酰CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以在微生物中过表达具有乙酰CoA合成酶活性的重组多肽如acs的基因产物(Satoh等人,J.Bioscience and Bioengineering,2003,95(4):335–341)。
在一些实施方案中,可以通过减弱具有葡萄糖-6-磷酸异构酶活性(EC5.3.1.9)的内源多肽将碳流量定向到丁糖(butose)磷酸循环中以提高NADPH的供应。
在一些实施方案中,可以通过过表达具有6-磷酸葡萄糖酸脱氢酶活性的多肽和/或具有转酮醇酶活性的多肽将碳流量重定向到戊糖磷酸循环中以提高NADPH的供应(Lee等人,2003,Biotechnology Progress,19(5),1444–1449)。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达基因诸如编码具有吡啶核苷酸转氢酶活性的多肽的UdhA(Brigham等人,Advanced Biofuels and Bioproducts,2012,Chapter 39,1065-1090)。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有甘油醛-3-磷酸-脱氢酶活性基因诸如GapN的重组多肽(Brigham等人,2012,见上文)。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况中,可以在宿主生物体中过表达重组苹果酸酶(苹果酸酶)基因诸如maeA或maeB(Brigham等人,2012,见上文)。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有葡萄糖-6-磷酸脱氢酶活性基因诸如zwf的重组多肽(Lim等人,J.Bioscience and Bioengineering,2002,93(6),543-549)。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有果糖1,6二磷酸酶活性诸如fbp的重组多肽(Becker等人,J.Biotechnol.,2007,132:99-109)。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以减弱具有丙糖磷酸异构酶活性(EC 5.3.1.1)的内源多肽。
在一些实施方案中,在合成C6构件块中在途径中需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达具有葡萄糖脱氢酶活性的重组多肽诸如gdh的基因产物(Satoh等人,J.Bioscience and Bioengineering,2003,95(4):335–341)。
在一些实施方案中,可以减弱促进NADPH转化成NADH的内源酶,所述转化诸如NADH产生循环,其可以经由具有EC 1.4.1.2(NADH-特异性)和EC 1.4.1.4(NADPH-特异性)下分类的谷氨酸脱氢酶活性的多肽的互变产生。
在一些实施方案中,可以减弱利用NADH和NADPH两者作为辅因子的具有谷氨酸脱氢酶活性(EC 1.4.1.3)的内源多肽。
在一些实施方案中,可以通过仅表达胞质域而不是锚定P450到内质网的N端区域溶解具有细胞色素P450活性如CYP4F3B的膜结合多肽(参见例如Scheller等人,J.Biol.Chem.,1994,269(17):12779-12783)。
在一些实施方案中,可以通过作为与小的可溶性蛋白如麦芽糖结合蛋白的融合蛋白的表达溶解具有烯酰CoA还原酶活性的膜结合多肽(Gloerich等人,FEBS Letters,2006,580,2092–2096)。
在使用天然累积聚羟基链烷酸的宿主的一些实施方案中,可以在宿主菌株中减弱具有聚羟基链烷酸合酶活性的内源多肽。
在需要丁酰基-CoA的胞内利用度用于C6构件块合成的一些实施方案中,可以在微生物中过表达具有丙酰CoA合成酶活性的重组多肽如PrpE-RS的基因产物(Rajashekhara&Watanabe,FEBS Letters,2004,556:143–147)。
在一些实施方案中,可以在宿主中过表达具有L-丙氨酸脱氢酶活性的多肽以从作为氨基供体的丙酮酸再生L-丙氨酸用于ω-转氨酶反应。
在一些实施方案中,可以在宿主中过表达具有L-谷氨酸脱氢酶活性的多肽,具有L-谷氨酰胺合成酶活性的多肽或具有谷氨酸合酶活性的多肽,以从2-酮戊二酸作为氨基供体再生L-谷氨酸用于ω-转氨酶反应。
在一些实施方案中,可以减弱酶如具有分类在EC 1.3.1.62下的庚二酰CoA脱氢酶活性的多肽;例如具有在EC 1.3.8.7或EC 1.3.8.1下分类的酰基-CoA脱氢酶活性的多肽;和/或例如具有在EC 1.3.8.6下分类的戊二酰基-CoA脱氢酶活性的多肽,其降解导致并包括C6构件块的中心代谢物和中心前体。
在一些实施方案中,可以减弱经由CoA酯化活化C6构件块的内源酶,诸如例如,具有EC 6.2.1.14下分类的CoA-连接酶活性的多肽(例如庚二酰基-CoA合成酶)。
在一些实施方案中,可以通过对细胞膜遗传工程化结构修饰或提高C6构件块的任何关联转运蛋白活性增强或放大C5构件块穿过细胞膜到胞外培养基的流出。
可以通过过表达宽底物范围多药物转运蛋白,诸如来自枯草芽孢杆菌的Blt(Woolridge等人,1997,J.Biol.Chem.,272(14):8864–8866);来自大肠杆菌的AcrB和AcrD(Elkins&Nikaido,2002,J.Bacteriol.,184(23),6490–6499),来自金黄色葡萄球菌(Staphylococcus aereus)的NorA(Ng等人,1994,Antimicrob Agents Chemother,38(6),1345–1355),或来自枯草芽孢杆菌的Bmr(Neyfakh,1992,Antimicrob Agents Chemother,36(2),484–485)增强或放大六亚甲基二胺的流出。
可以通过过表达溶质转运蛋白诸如来自谷氨酸棒杆菌(Corynebacterium glutamicum)的lysE转运蛋白增强或放大5-氨基己酸和六亚甲基二胺的流出(Bellmann等人,2001,Microbiology,147,1765–1774)。
通过过表达二羧酸转运蛋白诸如来自谷氨酸棒杆菌的SucE转运蛋白增强或放大己二酸的流出(Huhn等人,Appl.Microbiol.&Biotech.,89(2),327–335)。
使用重组宿主生产C6构件块
通常,可以通过提供宿主微生物,并且用含有如上文描述的合适的碳源的培养基培养提供的微生物生成一种或多种C6构件块。一般地,培养基和/或培养可以使得微生物生长到足够的密度并且有效产生C6构件块。对于大规模生产过程,可以使用任何方法,诸如别处描述的(Manual of Industrial Microbiology and Biotechnology,2nd Edition,Editors:A.L.Demain and J.E.Davies,ASM Press;和Principles of Fermentation Technology,P.F.Stanbury and A.Whitaker,Pergamon)。简言之,用特定微生物接种含有合适的培养基的大罐(例如,100加仑、200加仑、500加仑、或更多的罐)。在接种后,培养微生物以容许产生生物量。一旦达到期望的生物量,可以将含有微生物的培养基转移到第二个罐。此第二个罐可以是任何大小。例如,第二个罐可以是较大的,较小的,或者与第一个罐相同大小的。通常,第二个罐大于第一个,使得可以对来自第一个罐的培养基添加额外的培养基。另外,此第二个罐内的培养基可以与第一个罐中使用的培养基相同或不同。
一旦转移,可以温育微生物以容许生成C6构件块。一旦生成,可以使用任何方法来分离C6构件块。例如,可以经由吸附方法从发酵液选择性回收C6构件块。在己二酸和6-氨基己酸的情况下,可以经由蒸发进一步浓缩所得的洗脱液,经由蒸发和/或冷却结晶来结晶,并且经由离心回收晶体。在六亚亚基二胺和1,6-己二醇的情况下,可以采用蒸馏实现期望的产物纯度。
本发明在以下实施例中进一步描述,实施例不限制权利要求书中描述的本发明的范围。
实施例
实施例1
使用己二酸半醛作为底物并且形成6-氨基己酸的ω-转氨酶的酶活性
将编码His标签的核苷酸序列添加至分别编码SEQ ID NO:7、8、9、10、和12的ω-转氨酶的来自紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、和河流弧菌的基因(见图9),使得可以产生N-末端有HIS标签的ω-转氨酶。将每种所得的经修饰基因克隆到pET21a表达载体中在T7启动子的控制下,并且将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。将所得重组大肠杆菌菌株在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在37℃下培养,以230rpm振荡。使用1mM IPTG于16℃诱导每种培养物过夜。
经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒粒并经由超声处理裂解。经由离心分开细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。
在缓冲液中实施逆向(即6-氨基己酸至己二酸半醛)的酶活性测定法,所述缓冲液由终浓度为50mM HEPES缓冲液(pH=7.5)、10mM 6-氨基己酸、10mM丙酮酸和100μM吡哆(pyridoxyl)5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有6-氨基己酸的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育24小时。经由RP-HPLC量化从丙酮酸形成L-丙氨酸。
每种没有6-氨基庚酸的仅酶对照表明丙酮酸至L-丙氨酸的低基线转化。参见图16。如相对于空载体对照所确认的,SEQ ID NO 7、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的基因产物接受6-氨基己酸作为底物。见图17。
对SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的转氨酶确认正向(即己二酸半醛至6-氨基己酸)的酶反应。在缓冲液中实施酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM己二酸半醛、10mM L-丙氨酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有己二酸半醛的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化丙酮酸的形成。
如相对于空载体对照所确认的,SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的基因产物接受己二酸半醛作为底物。参见图18。确认了ω-转氨酶活性的可逆性,证明了SEQ ID NO 7、SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、和SEQ ID NO 12的ω-转氨酶接受己二酸半醛作为底物,并且合成6-氨基己酸作为反应产物。
实施例2
羧酸还原酶使用己二酸作为底物并形成己二酸半醛的酶活性
将编码HIS标签的序列添加至分别编码SEQ ID NO:4和6的羧酸还原酶的来自Segniliparus rugosus和Segniliparus rotundus的基因(参见图9),使得可以生成N-末端有HIS标签的羧酸还原酶。将每种经修饰的基因与编码有HIS标签的来自枯草芽孢杆菌的磷酸泛酰巯基乙胺基转移酶的sfp基因一起克隆入pET Duet表达载体中,两者都在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主,并且于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养所得的重组大肠杆菌菌株。使用自诱导培养基于37℃诱导每种培养物过夜。
经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒和经由超声处理裂解,并经由离心分离细胞碎片与上清液。使用Ni-亲和层析从上清液中纯化羧酸还原酶和磷酸泛酰巯基乙胺基转移酶,以10倍稀释入50mM HEPES缓冲液(pH=7.5)中,并经由超滤浓缩。
在缓冲液中一式三份实施酶活性测定法(即从己二酸至己二酸半醛),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM己二酸、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶基因产物或空载体对照至含有己二酸的测定缓冲液起始每个酶活性测定反应,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有己二酸的仅酶对照表明NADPH的低基线消耗。见图11。
如相对于空载体对照所确认的,SEQ ID NO 4和SEQ ID NO 6的基因产物,由sfp的基因产物增强,接受己二酸作为底物(参见图12),并且合成己二酸半醛。
实施例3
羧酸还原酶使用6-羟基己酸作为底物并形成6-羟基己醛的酶活性
将编码His标签的序列添加至分别编码SEQ ID NO:2-6的羧酸还原酶的来自海分枝杆菌、耻垢分枝杆菌、Segniliparus rugosus、马赛分枝杆菌和Segniliparus rotundus的基因(见图9),使得可以生成N-末端有HIS标签的羧酸还原酶。将每种经修饰的基因与编码有His标签的来自枯草芽孢杆菌的磷酸泛酰巯基乙胺基转移酶的sfp基因一起克隆入pET Duet表达载体中,两者都在T7启动子下。将每种表达载体与来自实施例1的表达载体一起转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养所得的每种重组大肠杆菌菌株。使用自诱导培养基于37℃诱导每种培养物过夜。
经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液。使用Ni-亲和层析从上清液中纯化羧酸还原酶和磷酸泛酰巯基乙胺基转移酶,以10倍稀释入50mM HEPES缓冲液(pH=7.5)中,并经由超滤浓缩。
在缓冲液中一式三份实施酶活性(即从6-羟基己酸至6-羟基己醛)测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM 6-羟基己醛、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有6-羟基己酸的测定缓冲液启动每个酶活性测定反应,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有6-羟基己酸的仅酶对照表明NADPH的低基线消耗。参见图11。
如相对于空载体对照确认的,SEQ ID NO 2-6的基因产物,由sfp的基因产物增强,接受6-羟基己酸作为底物(参见图13),并合成6-羟基己醛。
实施例4
ω-转氨酶对于6-氨基己醇,形成6-氧代己醇的酶活性
将编码N-末端His标签的序列添加至分别编码SEQ ID NO:7-12的ω-转氨酶的来自紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、大肠杆菌和河流弧菌基因(参见图9),使得可以产生N-末端有HIS标签的ω-转氨酶。将经修饰基因克隆至pET21a表达载体中,在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养每种所得的重组大肠杆菌菌株。使用1mM IPTG于16℃诱导每种培养物过夜。
经由离心收获来自每种经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。
在缓冲液中实施逆向(即6-氨基己醇至6-氧代己醇)的酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM 6-氨基己醇、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有6-氨基己醇的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化L-丙氨酸形成。
每个没有6-氨基己醇的仅酶对照具有丙酮酸至L-丙氨酸的低基线转化。参见图16。
如相对于空载体对照所确认的,SEQ ID NO:7-12的基因产物接受6-氨基己醇作为底物(参见图21),并合成6-氧代己醇作为反应产物。鉴于ω-转氨酶活性的可逆性(参见实施例2),可以推断SEQ ID NO:7-12的基因产物接受6-氨基己醇作为底物,并形成6-氧代己醇。
实施例5
ω-转氨酶使用六亚甲基二胺作为底物并形成6-氨基己醛的酶活性
将编码N-末端His标签的序列添加至分别编码SEQ ID NO:7-12的ω-转氨酶的紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、大肠杆菌、和河流弧菌基因(参见图9),使得可以产生N-末端有HIS标签的ω-转氨酶。将经修饰的基因克隆至pET21a表达载体中,在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养每种所得的重组大肠杆菌菌株。使用1mM IPTG于16℃诱导每种培养物过夜。
经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。
在缓冲液中实施逆向(即六亚甲基二胺至6-氨基己醛)的酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM六亚甲基二胺、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有六亚甲基二胺的测定缓冲液起始每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化L-丙氨酸的形成。
每个没有六亚甲基二胺的仅酶对照具有丙酮酸至L-丙氨酸的低基线转化。参见图16。
如相对于空载体对照所确认的,SEQ ID NO:7-12的基因产物接受六亚甲基二胺作为底物(参见图19),并合成6-氨基己醛作为反应产物。鉴于ω-转氨酶活性的可逆性(参见实施例2),可以推断SEQ ID NO:7-12的基因产物接受6-氨基己醛作为底物,并形成六亚甲基二胺。
实施例6
羧酸还原酶对于N6-乙酰-6-氨基己酸,形成N6-乙酰-6-氨基己醛的酶活性
一式三份在缓冲液中测定用于将N6-乙酰-6-氨基己酸转化成N6-乙酰-6-氨基己醛的N末端有His标签的SEQ ID NO:4-6的羧酸还原酶的活性(参见实施例2和3,和图9),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM N6-乙酰-6-氨基己酸、10mM MgCl2、1mM ATP、和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有N6-乙酰-6-氨基己酸的测定缓冲液起始测定,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有N6-乙酰-6-氨基己酸的仅酶对照表明NADPH的低基线消耗。参见图11。
如相对于空载体对照所确认的,SEQ ID NO 4-6的基因产物,由sfp的基因产物增强,接受N6-乙酰-6-氨基己酸作为底物(参见图14),并合成N6-乙酰-6-氨基己醛。
实施例7
ω-转氨酶使用N6-乙酰-1,6-二氨基己烷并形成N6-乙酰-6-氨基己醛的酶活性
在缓冲液中测定用于将N6-乙酰-1,6-二氨基己烷转化成N6-乙酰-6-氨基己醛的N末端有His标签的SEQ ID NO:7-12的ω-转氨酶的活性(参见实施例4,及图9),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM N6-乙酰-1,6-二氨基己烷、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶或空载体对照的无细胞提取物至含有N6-乙酰-1,6-二氨基己烷的测定缓冲液起始每个酶活性测定反应,然后在250rpm振荡的情况下于25℃温育4h。经由RP-HPLC量化L-丙氨酸的形成。
每个没有N6-乙酰-1,6-二氨基己烷的仅酶对照表明丙酮酸至L-丙氨酸的低基线转化。参见图14。
如相对于空载体对照所确认的,SEQ ID NO:7-12的基因产物接受N6-乙酰-1,6-二氨基己烷作为底物(参见图20),并合成N6-乙酰-6-氨基己醛作为反应产物。
鉴于ω-转氨酶活性的可逆性(参见实施例2),SEQ ID NO:7-12的基因产物接受N6-乙酰-6-氨基己醛作为底物,形成N6-乙酰-1,6-二氨基己烷。
实施例8:羧酸还原酶使用己二酸半醛作为底物并形成己二醛的酶活性
使用己二酸半醛作为底物测定N-末端有His标签的SEQ ID NO 6的羧酸还原酶(参见实施例2,实施例3和图9)。一式三份在缓冲液中实施酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM己二酸半醛、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有己二酸半醛的测定缓冲液起始测定,然后于室温温育20分钟。通过340nm的吸光度监测NADPH的消耗。每种没有己二酸半醛的仅酶对照表明NADPH的低基线消耗。参见图11。
如相对于空载体对照所确认的,SEQ ID NO:6的基因产物,由sfp的基因产物增强,接受己二酸半醛作为底物(参见图15),并合成己二醛。
实施例9
在形成6-羟基己酸中使用己酸作为底物的CYP153单加氧酶的酶活性
将编码HIS标签的序列添加到极胞菌属物种JS666、分枝杆菌物种HXN-1500和南非分枝杆菌基因,其分别编码(1)单加氧酶(SEQ ID NO:13–15),(2)关联的铁氧化还原蛋白还原酶配偶体(SEQ ID NO:16-17)和该物种的铁氧化还原蛋白(SEQ ID NO:18-19)。对于南非分枝杆菌单加氧酶,使用分枝杆菌物种HXN-1500氧化还原酶和铁氧化还原蛋白配偶体。将三种经修饰的蛋白质配偶体在杂合pTac启动子下克隆到pgBlue表达载体中。将每种表达载体转化到BL21[DE3]大肠杆菌宿主中。在含有50mL LB培养基和抗生素选择压力的500mL摇瓶培养物中在37℃培养每种所得的重组大肠杆菌菌株。在28℃使用1mM IPTG将每种培养物诱导24h。
经由离心收获来自每个诱导的摇瓶培养物的团粒。重悬每种团粒,并且在室温在Y-perTM溶液(ThermoScientific,Rockford,IL)中使细胞变得能透过达20分钟。在0℃在Y-perTM溶液中保持透化的细胞。
在由终浓度25mM磷酸钾缓冲液(pH=7.8),1.7mM MgSO4,2.5mM NADPH和30mM己酸组成的缓冲液中进行酶活性测定法。通过将Y-perTM溶液中悬浮的透化细胞的湿细胞重量的固定质量添加到含有庚酸的测定缓冲液启动每个酶活性测定反应,然后,在加热块摇动器中以1400rpm摇动的情况下在28℃温育24h。经由LC-MS量化7-羟基庚酸的形成。
与还原酶和铁氧化还原蛋白配偶体一起的SEQ ID NO 13-15的单加氧酶基因产物接受己酸作为底物,如相对于空载体对照确认(参见图22),并且合成6-羟基己酸作为反应产物。
其它实施方案
应当理解,虽然已经结合其详细描述描述了本发明,但是前面的描述旨在说明而不是限制由所附权利要求书的范围限定的本发明的范围。其它方面,优点和修改在所附权利要求书的范围内。
序列表
<110> 英威达技术有限责任公司
<120> 用于生物合成化合物的方法,试剂和细胞
<130> 35643-0066WO1
<150> US 62/012,666
<151> 2014-06-16
<150> US 62/012,659
<151> 2014-06-16
<150> US 62/012,604
<151> 2014-06-16
<160> 33
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 286
<212> PRT
<213> 大肠杆菌
<400> 1
Met Ser Gln Ala Leu Lys Asn Leu Leu Thr Leu Leu Asn Leu Glu Lys
1 5 10 15
Ile Glu Glu Gly Leu Phe Arg Gly Gln Ser Glu Asp Leu Gly Leu Arg
20 25 30
Gln Val Phe Gly Gly Gln Val Val Gly Gln Ala Leu Tyr Ala Ala Lys
35 40 45
Glu Thr Val Pro Glu Glu Arg Leu Val His Ser Phe His Ser Tyr Phe
50 55 60
Leu Arg Pro Gly Asp Ser Lys Lys Pro Ile Ile Tyr Asp Val Glu Thr
65 70 75 80
Leu Arg Asp Gly Asn Ser Phe Ser Ala Arg Arg Val Ala Ala Ile Gln
85 90 95
Asn Gly Lys Pro Ile Phe Tyr Met Thr Ala Ser Phe Gln Ala Pro Glu
100 105 110
Ala Gly Phe Glu His Gln Lys Thr Met Pro Ser Ala Pro Ala Pro Asp
115 120 125
Gly Leu Pro Ser Glu Thr Gln Ile Ala Gln Ser Leu Ala His Leu Leu
130 135 140
Pro Pro Val Leu Lys Asp Lys Phe Ile Cys Asp Arg Pro Leu Glu Val
145 150 155 160
Arg Pro Val Glu Phe His Asn Pro Leu Lys Gly His Val Ala Glu Pro
165 170 175
His Arg Gln Val Trp Ile Arg Ala Asn Gly Ser Val Pro Asp Asp Leu
180 185 190
Arg Val His Gln Tyr Leu Leu Gly Tyr Ala Ser Asp Leu Asn Phe Leu
195 200 205
Pro Val Ala Leu Gln Pro His Gly Ile Gly Phe Leu Glu Pro Gly Ile
210 215 220
Gln Ile Ala Thr Ile Asp His Ser Met Trp Phe His Arg Pro Phe Asn
225 230 235 240
Leu Asn Glu Trp Leu Leu Tyr Ser Val Glu Ser Thr Ser Ala Ser Ser
245 250 255
Ala Arg Gly Phe Val Arg Gly Glu Phe Tyr Thr Gln Asp Gly Val Leu
260 265 270
Val Ala Ser Thr Val Gln Glu Gly Val Met Arg Asn His Asn
275 280 285
<210> 2
<211> 1174
<212> PRT
<213> 海分枝杆菌
<400> 2
Met Ser Pro Ile Thr Arg Glu Glu Arg Leu Glu Arg Arg Ile Gln Asp
1 5 10 15
Leu Tyr Ala Asn Asp Pro Gln Phe Ala Ala Ala Lys Pro Ala Thr Ala
20 25 30
Ile Thr Ala Ala Ile Glu Arg Pro Gly Leu Pro Leu Pro Gln Ile Ile
35 40 45
Glu Thr Val Met Thr Gly Tyr Ala Asp Arg Pro Ala Leu Ala Gln Arg
50 55 60
Ser Val Glu Phe Val Thr Asp Ala Gly Thr Gly His Thr Thr Leu Arg
65 70 75 80
Leu Leu Pro His Phe Glu Thr Ile Ser Tyr Gly Glu Leu Trp Asp Arg
85 90 95
Ile Ser Ala Leu Ala Asp Val Leu Ser Thr Glu Gln Thr Val Lys Pro
100 105 110
Gly Asp Arg Val Cys Leu Leu Gly Phe Asn Ser Val Asp Tyr Ala Thr
115 120 125
Ile Asp Met Thr Leu Ala Arg Leu Gly Ala Val Ala Val Pro Leu Gln
130 135 140
Thr Ser Ala Ala Ile Thr Gln Leu Gln Pro Ile Val Ala Glu Thr Gln
145 150 155 160
Pro Thr Met Ile Ala Ala Ser Val Asp Ala Leu Ala Asp Ala Thr Glu
165 170 175
Leu Ala Leu Ser Gly Gln Thr Ala Thr Arg Val Leu Val Phe Asp His
180 185 190
His Arg Gln Val Asp Ala His Arg Ala Ala Val Glu Ser Ala Arg Glu
195 200 205
Arg Leu Ala Gly Ser Ala Val Val Glu Thr Leu Ala Glu Ala Ile Ala
210 215 220
Arg Gly Asp Val Pro Arg Gly Ala Ser Ala Gly Ser Ala Pro Gly Thr
225 230 235 240
Asp Val Ser Asp Asp Ser Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser
245 250 255
Thr Gly Ala Pro Lys Gly Ala Met Tyr Pro Arg Arg Asn Val Ala Thr
260 265 270
Phe Trp Arg Lys Arg Thr Trp Phe Glu Gly Gly Tyr Glu Pro Ser Ile
275 280 285
Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gln Ile Leu
290 295 300
Tyr Gly Thr Leu Cys Asn Gly Gly Thr Ala Tyr Phe Val Ala Lys Ser
305 310 315 320
Asp Leu Ser Thr Leu Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu
325 330 335
Leu Thr Phe Val Pro Arg Val Trp Asp Met Val Phe Asp Glu Phe Gln
340 345 350
Ser Glu Val Asp Arg Arg Leu Val Asp Gly Ala Asp Arg Val Ala Leu
355 360 365
Glu Ala Gln Val Lys Ala Glu Ile Arg Asn Asp Val Leu Gly Gly Arg
370 375 380
Tyr Thr Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Asp Glu Met Lys
385 390 395 400
Ala Trp Val Glu Glu Leu Leu Asp Met His Leu Val Glu Gly Tyr Gly
405 410 415
Ser Thr Glu Ala Gly Met Ile Leu Ile Asp Gly Ala Ile Arg Arg Pro
420 425 430
Ala Val Leu Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe
435 440 445
Leu Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp
450 455 460
Ser Leu Phe Pro Gly Tyr Tyr Gln Arg Ala Glu Val Thr Ala Asp Val
465 470 475 480
Phe Asp Ala Asp Gly Phe Tyr Arg Thr Gly Asp Ile Met Ala Glu Val
485 490 495
Gly Pro Glu Gln Phe Val Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys
500 505 510
Leu Ser Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe
515 520 525
Gly Asp Ser Pro Leu Val Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Ala
530 535 540
Arg Ala Tyr Leu Leu Ala Val Ile Val Pro Thr Gln Glu Ala Leu Asp
545 550 555 560
Ala Val Pro Val Glu Glu Leu Lys Ala Arg Leu Gly Asp Ser Leu Gln
565 570 575
Glu Val Ala Lys Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp
580 585 590
Phe Ile Ile Glu Thr Thr Pro Trp Thr Leu Glu Asn Gly Leu Leu Thr
595 600 605
Gly Ile Arg Lys Leu Ala Arg Pro Gln Leu Lys Lys His Tyr Gly Glu
610 615 620
Leu Leu Glu Gln Ile Tyr Thr Asp Leu Ala His Gly Gln Ala Asp Glu
625 630 635 640
Leu Arg Ser Leu Arg Gln Ser Gly Ala Asp Ala Pro Val Leu Val Thr
645 650 655
Val Cys Arg Ala Ala Ala Ala Leu Leu Gly Gly Ser Ala Ser Asp Val
660 665 670
Gln Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala
675 680 685
Leu Ser Phe Thr Asn Leu Leu His Glu Ile Phe Asp Ile Glu Val Pro
690 695 700
Val Gly Val Ile Val Ser Pro Ala Asn Asp Leu Gln Ala Leu Ala Asp
705 710 715 720
Tyr Val Glu Ala Ala Arg Lys Pro Gly Ser Ser Arg Pro Thr Phe Ala
725 730 735
Ser Val His Gly Ala Ser Asn Gly Gln Val Thr Glu Val His Ala Gly
740 745 750
Asp Leu Ser Leu Asp Lys Phe Ile Asp Ala Ala Thr Leu Ala Glu Ala
755 760 765
Pro Arg Leu Pro Ala Ala Asn Thr Gln Val Arg Thr Val Leu Leu Thr
770 775 780
Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu
785 790 795 800
Arg Met Asp Leu Val Asp Gly Lys Leu Ile Cys Leu Val Arg Ala Lys
805 810 815
Ser Asp Thr Glu Ala Arg Ala Arg Leu Asp Lys Thr Phe Asp Ser Gly
820 825 830
Asp Pro Glu Leu Leu Ala His Tyr Arg Ala Leu Ala Gly Asp His Leu
835 840 845
Glu Val Leu Ala Gly Asp Lys Gly Glu Ala Asp Leu Gly Leu Asp Arg
850 855 860
Gln Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Leu Ile Val Asp Pro
865 870 875 880
Ala Ala Leu Val Asn His Val Leu Pro Tyr Ser Gln Leu Phe Gly Pro
885 890 895
Asn Ala Leu Gly Thr Ala Glu Leu Leu Arg Leu Ala Leu Thr Ser Lys
900 905 910
Ile Lys Pro Tyr Ser Tyr Thr Ser Thr Ile Gly Val Ala Asp Gln Ile
915 920 925
Pro Pro Ser Ala Phe Thr Glu Asp Ala Asp Ile Arg Val Ile Ser Ala
930 935 940
Thr Arg Ala Val Asp Asp Ser Tyr Ala Asn Gly Tyr Ser Asn Ser Lys
945 950 955 960
Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu
965 970 975
Pro Val Ala Val Phe Arg Cys Asp Met Ile Leu Ala Asp Thr Thr Trp
980 985 990
Ala Gly Gln Leu Asn Val Pro Asp Met Phe Thr Arg Met Ile Leu Ser
995 1000 1005
Leu Ala Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Glu Leu Ala Ala
1010 1015 1020
Asp Gly Ala Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe
1025 1030 1035 1040
Ile Ala Glu Ala Ile Ser Thr Leu Gly Ala Gln Ser Gln Asp Gly Phe
1045 1050 1055
His Thr Tyr His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp
1060 1065 1070
Glu Phe Val Asp Trp Leu Asn Glu Ser Gly Cys Pro Ile Gln Arg Ile
1075 1080 1085
Ala Asp Tyr Gly Asp Trp Leu Gln Arg Phe Glu Thr Ala Leu Arg Ala
1090 1095 1100
Leu Pro Asp Arg Gln Arg His Ser Ser Leu Leu Pro Leu Leu His Asn
1105 1110 1115 1120
Tyr Arg Gln Pro Glu Arg Pro Val Arg Gly Ser Ile Ala Pro Thr Asp
1125 1130 1135
Arg Phe Arg Ala Ala Val Gln Glu Ala Lys Ile Gly Pro Asp Lys Asp
1140 1145 1150
Ile Pro His Val Gly Ala Pro Ile Ile Val Lys Tyr Val Ser Asp Leu
1155 1160 1165
Arg Leu Leu Gly Leu Leu
1170
<210> 3
<211> 1173
<212> PRT
<213> 耻垢分枝杆菌
<400> 3
Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala
1 5 10 15
Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr
20 25 30
Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala
35 40 45
Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe
50 55 60
Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu
65 70 75 80
Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe
85 90 95
Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala
100 105 110
Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala
115 120 125
Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu
130 135 140
Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala
145 150 155 160
Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile
165 170 175
Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg
180 185 190
Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu
195 200 205
Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala
210 215 220
Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly
225 230 235 240
Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg
245 250 255
Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly
260 265 270
Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe
275 280 285
Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu
290 295 300
Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly
305 310 315 320
Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu
325 330 335
Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val
340 345 350
Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val
355 360 365
Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu
370 375 380
Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser
385 390 395 400
Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu
405 410 415
Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val
420 425 430
Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu
435 440 445
Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro
450 455 460
Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr
465 470 475 480
Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr
485 490 495
His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr
500 505 510
Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val
515 520 525
Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg
530 535 540
Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val
545 550 555 560
Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu
565 570 575
Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu
580 585 590
Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro
595 600 605
Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg
610 615 620
Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala
625 630 635 640
Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala
645 650 655
Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr
660 665 670
Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp
675 680 685
Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser
690 695 700
Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala
705 710 715 720
Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala
725 730 735
Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr
740 745 750
Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu
755 760 765
Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg
770 775 780
Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr
785 790 795 800
Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr
805 810 815
Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln
820 825 830
Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala
835 840 845
Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu
850 855 860
Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu
865 870 875 880
Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln
885 890 895
Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala
900 905 910
Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val
915 920 925
Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val
930 935 940
Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn
945 950 955 960
Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys
965 970 975
Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro
980 985 990
Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu
995 1000 1005
Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile Gly
1010 1015 1020
Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val Asp Phe
1025 1030 1035 1040
Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg Glu Gly Tyr
1045 1050 1055
Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly Ile Ser Leu Asp
1060 1065 1070
Val Phe Val Asp Trp Leu Ile Arg Ala Gly His Pro Ile Asp Arg Val
1075 1080 1085
Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe Glu Thr Ala Leu Thr Ala
1090 1095 1100
Leu Pro Glu Lys Arg Arg Ala Gln Thr Val Leu Pro Leu Leu His Ala
1105 1110 1115 1120
Phe Arg Ala Pro Gln Ala Pro Leu Arg Gly Ala Pro Glu Pro Thr Glu
1125 1130 1135
Val Phe His Ala Ala Val Arg Thr Ala Lys Val Gly Pro Gly Asp Ile
1140 1145 1150
Pro His Leu Asp Glu Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg
1155 1160 1165
Glu Phe Gly Leu Ile
1170
<210> 4
<211> 1148
<212> PRT
<213> Segniliparus rugosus
<400> 4
Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly
1 5 10 15
Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro
20 25 30
Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro
85 90 95
Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala
100 105 110
Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu
130 135 140
Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala
145 150 155 160
Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu
165 170 175
Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala
180 185 190
Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val
195 200 205
Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu
210 215 220
Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly
260 265 270
Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe
325 330 335
Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser
355 360 365
Pro Glu Met Arg Ala Phe Met Glu Glu Val Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys
420 425 430
Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile
435 440 445
Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala
530 535 540
Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu
545 550 555 560
Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn
565 570 575
Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala
580 585 590
Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly
595 600 605
Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Gly Ala Gly Gln Arg Pro
610 615 620
Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu
625 630 635 640
Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp
645 650 655
Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu
660 665 670
Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala
675 680 685
Gly Ile Ala Lys His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro
690 695 700
Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser
705 710 715 720
Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala
725 730 735
Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly
740 745 750
Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg
755 760 765
Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg
770 775 780
Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly
785 790 795 800
Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg
805 810 815
Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp
820 825 830
Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His
835 840 845
Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly
850 855 860
Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala
865 870 875 880
Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly
885 890 895
Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val
900 905 910
Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser
915 920 925
Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly
930 935 940
Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg
945 950 955 960
Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu
965 970 975
Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly
980 985 990
Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp
995 1000 1005
Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp Phe
1010 1015 1020
Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro His His
1025 1030 1035 1040
Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile Glu Ala Gly
1045 1050 1055
His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp Phe Ala Arg Phe
1060 1065 1070
Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln Arg Gln His Ser Leu
1075 1080 1085
Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro His Pro Pro Val Asp Gly
1090 1095 1100
Ser Val Tyr Pro Thr Gly Lys Phe Gln Gly Ala Val Lys Ala Ala Gln
1105 1110 1115 1120
Val Gly Ser Asp His Asp Val Pro His Leu Gly Lys Ala Leu Ile Val
1125 1130 1135
Lys Tyr Ala Asp Asp Leu Lys Ala Leu Gly Leu Leu
1140 1145
<210> 5
<211> 1185
<212> PRT
<213> 马赛分枝杆菌
<400> 5
Met Thr Asn Glu Thr Asn Pro Gln Gln Glu Gln Leu Ser Arg Arg Ile
1 5 10 15
Glu Ser Leu Arg Glu Ser Asp Pro Gln Phe Arg Ala Ala Gln Pro Asp
20 25 30
Pro Ala Val Ala Glu Gln Val Leu Arg Pro Gly Leu His Leu Ser Glu
35 40 45
Ala Ile Ala Ala Leu Met Thr Gly Tyr Ala Glu Arg Pro Ala Leu Gly
50 55 60
Glu Arg Ala Arg Glu Leu Val Ile Asp Gln Asp Gly Arg Thr Thr Leu
65 70 75 80
Arg Leu Leu Pro Arg Phe Asp Thr Thr Thr Tyr Gly Glu Leu Trp Ser
85 90 95
Arg Thr Thr Ser Val Ala Ala Ala Trp His His Asp Ala Thr His Pro
100 105 110
Val Lys Ala Gly Asp Leu Val Ala Thr Leu Gly Phe Thr Ser Ile Asp
115 120 125
Tyr Thr Val Leu Asp Leu Ala Ile Met Ile Leu Gly Gly Val Ala Val
130 135 140
Pro Leu Gln Thr Ser Ala Pro Ala Ser Gln Trp Thr Thr Ile Leu Ala
145 150 155 160
Glu Ala Glu Pro Asn Thr Leu Ala Val Ser Ile Glu Leu Ile Gly Ala
165 170 175
Ala Met Glu Ser Val Arg Ala Thr Pro Ser Ile Lys Gln Val Val Val
180 185 190
Phe Asp Tyr Thr Pro Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala
195 200 205
Ala Ser Thr Gln Leu Ala Gly Thr Gly Ile Ala Leu Glu Thr Leu Asp
210 215 220
Ala Val Ile Ala Arg Gly Ala Ala Leu Pro Ala Ala Pro Leu Tyr Ala
225 230 235 240
Pro Ser Ala Gly Asp Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly
245 250 255
Ser Thr Gly Ala Pro Lys Gly Ala Met His Ser Glu Asn Ile Val Arg
260 265 270
Arg Trp Trp Ile Arg Glu Asp Val Met Ala Gly Thr Glu Asn Leu Pro
275 280 285
Met Ile Gly Leu Asn Phe Met Pro Met Ser His Ile Met Gly Arg Gly
290 295 300
Thr Leu Thr Ser Thr Leu Ser Thr Gly Gly Thr Gly Tyr Phe Ala Ala
305 310 315 320
Ser Ser Asp Met Ser Thr Leu Phe Glu Asp Met Glu Leu Ile Arg Pro
325 330 335
Thr Ala Leu Ala Leu Val Pro Arg Val Cys Asp Met Val Phe Gln Arg
340 345 350
Phe Gln Thr Glu Val Asp Arg Arg Leu Ala Ser Gly Asp Thr Ala Ser
355 360 365
Ala Glu Ala Val Ala Ala Glu Val Lys Ala Asp Ile Arg Asp Asn Leu
370 375 380
Phe Gly Gly Arg Val Ser Ala Val Met Val Gly Ser Ala Pro Leu Ser
385 390 395 400
Glu Glu Leu Gly Glu Phe Ile Glu Ser Cys Phe Glu Leu Asn Leu Thr
405 410 415
Asp Gly Tyr Gly Ser Thr Glu Ala Gly Met Val Phe Arg Asp Gly Ile
420 425 430
Val Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
435 440 445
Leu Gly Tyr Phe Ser Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu
450 455 460
Leu Lys Thr Asp Gly Met Phe Leu Gly Tyr Tyr Lys Arg Pro Glu Val
465 470 475 480
Thr Ala Ser Val Phe Asp Ala Asp Gly Phe Tyr Met Thr Gly Asp Ile
485 490 495
Val Ala Glu Leu Ala His Asp Asn Ile Glu Ile Ile Asp Arg Arg Asn
500 505 510
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Thr Leu
515 520 525
Glu Ala Glu Tyr Ala Asn Ser Pro Val Val His Gln Ile Tyr Val Tyr
530 535 540
Gly Ser Ser Glu Arg Ser Tyr Leu Leu Ala Val Val Val Pro Thr Pro
545 550 555 560
Glu Ala Val Ala Ala Ala Lys Gly Asp Ala Ala Ala Leu Lys Thr Thr
565 570 575
Ile Ala Asp Ser Leu Gln Asp Ile Ala Lys Glu Ile Gln Leu Gln Ser
580 585 590
Tyr Glu Val Pro Arg Asp Phe Ile Ile Glu Pro Gln Pro Phe Thr Gln
595 600 605
Gly Asn Gly Leu Leu Thr Gly Ile Ala Lys Leu Ala Arg Pro Asn Leu
610 615 620
Lys Ala His Tyr Gly Pro Arg Leu Glu Gln Met Tyr Ala Glu Ile Ala
625 630 635 640
Glu Gln Gln Ala Ala Glu Leu Arg Ala Leu His Gly Val Asp Pro Asp
645 650 655
Lys Pro Ala Leu Glu Thr Val Leu Lys Ala Ala Gln Ala Leu Leu Gly
660 665 670
Val Ser Ser Ala Glu Leu Ala Ala Asp Ala His Phe Thr Asp Leu Gly
675 680 685
Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser Asp Leu Leu Arg Asp Ile
690 695 700
Phe Ala Val Glu Val Pro Val Gly Val Ile Val Ser Ala Ala Asn Asp
705 710 715 720
Leu Gly Gly Val Ala Lys Phe Val Asp Glu Gln Arg His Ser Gly Gly
725 730 735
Thr Arg Pro Thr Ala Glu Thr Val His Gly Ala Gly His Thr Glu Ile
740 745 750
Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile Asp Glu Ala Thr Leu
755 760 765
His Ala Ala Pro Ser Leu Pro Lys Ala Ala Gly Ile Pro His Thr Val
770 775 780
Leu Leu Thr Gly Ser Asn Gly Tyr Leu Gly His Tyr Leu Ala Leu Glu
785 790 795 800
Trp Leu Glu Arg Leu Asp Lys Thr Asp Gly Lys Leu Ile Val Ile Val
805 810 815
Arg Gly Lys Asn Ala Glu Ala Ala Tyr Gly Arg Leu Glu Glu Ala Phe
820 825 830
Asp Thr Gly Asp Thr Glu Leu Leu Ala His Phe Arg Ser Leu Ala Asp
835 840 845
Lys His Leu Glu Val Leu Ala Gly Asp Ile Gly Asp Pro Asn Leu Gly
850 855 860
Leu Asp Ala Asp Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Val Ile
865 870 875 880
Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Asn Gln Leu
885 890 895
Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile Ile Lys Leu Ala Ile
900 905 910
Thr Thr Lys Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala
915 920 925
Ala Tyr Val Asp Pro Thr Thr Phe Asp Glu Glu Ser Asp Ile Arg Leu
930 935 940
Ile Ser Ala Val Arg Pro Ile Asp Asp Gly Tyr Ala Asn Gly Tyr Gly
945 950 955 960
Asn Ala Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu
965 970 975
Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His
980 985 990
Ser Arg Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu
995 1000 1005
Ile Leu Ser Leu Ile Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Gln
1010 1015 1020
Ala Gln Thr Thr Gly Glu Arg Pro Leu Ala His Tyr Asp Gly Leu Pro
1025 1030 1035 1040
Gly Asp Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Thr Gln Val Pro
1045 1050 1055
Glu Gly Ser Glu Gly Phe Val Thr Tyr Asp Cys Val Asn Pro His Ala
1060 1065 1070
Asp Gly Ile Ser Leu Asp Asn Phe Val Asp Trp Leu Ile Glu Ala Gly
1075 1080 1085
Tyr Pro Ile Ala Arg Ile Asp Asn Tyr Thr Glu Trp Phe Thr Arg Phe
1090 1095 1100
Asp Thr Ala Ile Arg Gly Leu Ser Glu Lys Gln Lys Gln His Ser Leu
1105 1110 1115 1120
Leu Pro Leu Leu His Ala Phe Glu Gln Pro Ser Ala Ala Glu Asn His
1125 1130 1135
Gly Val Val Pro Ala Lys Arg Phe Gln His Ala Val Gln Ala Ala Gly
1140 1145 1150
Ile Gly Pro Val Gly Gln Asp Gly Thr Thr Asp Ile Pro His Leu Ser
1155 1160 1165
Arg Arg Leu Ile Val Lys Tyr Ala Lys Asp Leu Glu Gln Leu Gly Leu
1170 1175 1180
Leu
1185
<210> 6
<211> 1186
<212> PRT
<213> Segniliparus rotundus
<400> 6
Met Thr Gln Ser His Thr Gln Gly Pro Gln Ala Ser Ala Ala His Ser
1 5 10 15
Arg Leu Ala Arg Arg Ala Ala Glu Leu Leu Ala Thr Asp Pro Gln Ala
20 25 30
Ala Ala Thr Leu Pro Asp Pro Glu Val Val Arg Gln Ala Thr Arg Pro
35 40 45
Gly Leu Arg Leu Ala Glu Arg Val Asp Ala Ile Leu Ser Gly Tyr Ala
50 55 60
Asp Arg Pro Ala Leu Gly Gln Arg Ser Phe Gln Thr Val Lys Asp Pro
65 70 75 80
Ile Thr Gly Arg Ser Ser Val Glu Leu Leu Pro Thr Phe Asp Thr Ile
85 90 95
Thr Tyr Arg Glu Leu Arg Glu Arg Ala Thr Ala Ile Ala Ser Asp Leu
100 105 110
Ala His His Pro Gln Ala Pro Ala Lys Pro Gly Asp Phe Leu Ala Ser
115 120 125
Ile Gly Phe Ile Ser Val Asp Tyr Val Ala Ile Asp Ile Ala Gly Val
130 135 140
Phe Ala Gly Leu Thr Ala Val Pro Leu Gln Thr Gly Ala Thr Leu Ala
145 150 155 160
Thr Leu Thr Ala Ile Thr Ala Glu Thr Ala Pro Thr Leu Phe Ala Ala
165 170 175
Ser Ile Glu His Leu Pro Thr Ala Val Asp Ala Val Leu Ala Thr Pro
180 185 190
Ser Val Arg Arg Leu Leu Val Phe Asp Tyr Arg Ala Gly Ser Asp Glu
195 200 205
Asp Arg Glu Ala Val Glu Ala Ala Lys Arg Lys Ile Ala Asp Ala Gly
210 215 220
Ser Ser Val Leu Val Asp Val Leu Asp Glu Val Ile Ala Arg Gly Lys
225 230 235 240
Ser Ala Pro Lys Ala Pro Leu Pro Pro Ala Thr Asp Ala Gly Asp Asp
245 250 255
Ser Leu Ser Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys
260 265 270
Gly Ala Met Tyr Pro Glu Arg Asn Val Ala His Phe Trp Gly Gly Val
275 280 285
Trp Ala Ala Ala Phe Asp Glu Asp Ala Ala Pro Pro Val Pro Ala Ile
290 295 300
Asn Ile Thr Phe Leu Pro Leu Ser His Val Ala Ser Arg Leu Ser Leu
305 310 315 320
Met Pro Thr Leu Ala Arg Gly Gly Leu Met His Phe Val Ala Lys Ser
325 330 335
Asp Leu Ser Thr Leu Phe Glu Asp Leu Lys Leu Ala Arg Pro Thr Asn
340 345 350
Leu Phe Leu Val Pro Arg Val Val Glu Met Leu Tyr Gln His Tyr Gln
355 360 365
Ser Glu Leu Asp Arg Arg Gly Val Gln Asp Gly Thr Arg Glu Ala Glu
370 375 380
Ala Val Lys Asp Asp Leu Arg Thr Gly Leu Leu Gly Gly Arg Ile Leu
385 390 395 400
Thr Ala Gly Phe Gly Ser Ala Pro Leu Ser Ala Glu Leu Ala Gly Phe
405 410 415
Ile Glu Ser Leu Leu Gln Ile His Leu Val Asp Gly Tyr Gly Ser Thr
420 425 430
Glu Ala Gly Pro Val Trp Arg Asp Gly Tyr Leu Val Lys Pro Pro Val
435 440 445
Thr Asp Tyr Lys Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr
450 455 460
Asp Ser Pro His Pro Arg Gly Glu Leu Ala Ile Lys Thr Gln Thr Ile
465 470 475 480
Leu Pro Gly Tyr Tyr Lys Arg Pro Glu Thr Thr Ala Glu Val Phe Asp
485 490 495
Glu Asp Gly Phe Tyr Leu Thr Gly Asp Val Val Ala Gln Ile Gly Pro
500 505 510
Glu Gln Phe Ala Tyr Val Asp Arg Arg Lys Asn Val Leu Lys Leu Ser
515 520 525
Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Ala Tyr Ser Ser
530 535 540
Ser Pro Leu Val Arg Gln Leu Phe Val Tyr Gly Ser Ser Glu Arg Ser
545 550 555 560
Tyr Leu Leu Ala Val Ile Val Pro Thr Pro Asp Ala Leu Lys Lys Phe
565 570 575
Gly Val Gly Glu Ala Ala Lys Ala Ala Leu Gly Glu Ser Leu Gln Lys
580 585 590
Ile Ala Arg Asp Glu Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp Phe
595 600 605
Ile Ile Glu Thr Asp Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Asp
610 615 620
Ala Arg Lys Ser Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg
625 630 635 640
Leu Glu Ala Met Tyr Lys Glu Leu Ala Asp Gly Gln Ala Asn Glu Leu
645 650 655
Arg Asp Ile Arg Arg Gly Val Gln Gln Arg Pro Thr Leu Glu Thr Val
660 665 670
Arg Arg Ala Ala Ala Ala Met Leu Gly Ala Ser Ala Ala Glu Ile Lys
675 680 685
Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu
690 695 700
Thr Phe Ser Asn Phe Leu His Asp Leu Phe Glu Val Asp Val Pro Val
705 710 715 720
Gly Val Ile Val Ser Ala Ala Asn Thr Leu Gly Ser Val Ala Glu His
725 730 735
Ile Asp Ala Gln Leu Ala Gly Gly Arg Ala Arg Pro Thr Phe Ala Thr
740 745 750
Val His Gly Lys Gly Ser Thr Thr Ile Lys Ala Ser Asp Leu Thr Leu
755 760 765
Asp Lys Phe Ile Asp Glu Gln Thr Leu Glu Ala Ala Lys His Leu Pro
770 775 780
Lys Pro Ala Asp Pro Pro Arg Thr Val Leu Leu Thr Gly Ala Asn Gly
785 790 795 800
Trp Leu Gly Arg Phe Leu Ala Leu Glu Trp Leu Glu Arg Leu Ala Pro
805 810 815
Ala Gly Gly Lys Leu Ile Thr Ile Val Arg Gly Lys Asp Ala Ala Gln
820 825 830
Ala Lys Ala Arg Leu Asp Ala Ala Tyr Glu Ser Gly Asp Pro Lys Leu
835 840 845
Ala Gly His Tyr Gln Asp Leu Ala Ala Thr Thr Leu Glu Val Leu Ala
850 855 860
Gly Asp Phe Ser Glu Pro Arg Leu Gly Leu Asp Glu Ala Thr Trp Asn
865 870 875 880
Arg Leu Ala Asp Glu Val Asp Phe Ile Ser His Pro Gly Ala Leu Val
885 890 895
Asn His Val Leu Pro Tyr Asn Gln Leu Phe Gly Pro Asn Val Ala Gly
900 905 910
Val Ala Glu Ile Ile Lys Leu Ala Ile Thr Thr Arg Ile Lys Pro Val
915 920 925
Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly Val Glu Pro Ser Ala
930 935 940
Leu Asp Glu Asp Gly Asp Ile Arg Thr Val Ser Ala Glu Arg Ser Val
945 950 955 960
Asp Glu Gly Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Gly Gly Glu
965 970 975
Val Leu Leu Arg Glu Ala His Asp Arg Thr Gly Leu Pro Val Arg Val
980 985 990
Phe Arg Ser Asp Met Ile Leu Ala His Gln Lys Tyr Thr Gly Gln Val
995 1000 1005
Asn Ala Thr Asp Gln Phe Thr Arg Leu Val Gln Ser Leu Leu Ala Thr
1010 1015 1020
Gly Leu Ala Pro Lys Ser Phe Tyr Glu Leu Asp Ala Gln Gly Asn Arg
1025 1030 1035 1040
Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp Phe Thr Ala Glu Ser
1045 1050 1055
Ile Thr Thr Leu Gly Gly Asp Gly Leu Glu Gly Tyr Arg Ser Tyr Asn
1060 1065 1070
Val Phe Asn Pro His Arg Asp Gly Val Gly Leu Asp Glu Phe Val Asp
1075 1080 1085
Trp Leu Ile Glu Ala Gly His Pro Ile Thr Arg Ile Asp Asp Tyr Asp
1090 1095 1100
Gln Trp Leu Ser Arg Phe Glu Thr Ser Leu Arg Gly Leu Pro Glu Ser
1105 1110 1115 1120
Lys Arg Gln Ala Ser Val Leu Pro Leu Leu His Ala Phe Ala Arg Pro
1125 1130 1135
Gly Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Thr Val Phe Arg Thr
1140 1145 1150
Asp Val Gln Lys Ala Lys Ile Gly Ala Glu His Asp Ile Pro His Leu
1155 1160 1165
Gly Lys Ala Leu Val Leu Lys Tyr Ala Asp Asp Ile Lys Gln Leu Gly
1170 1175 1180
Leu Leu
1185
<210> 7
<211> 459
<212> PRT
<213> 青紫色杆菌
<400> 7
Met Gln Lys Gln Arg Thr Thr Ser Gln Trp Arg Glu Leu Asp Ala Ala
1 5 10 15
His His Leu His Pro Phe Thr Asp Thr Ala Ser Leu Asn Gln Ala Gly
20 25 30
Ala Arg Val Met Thr Arg Gly Glu Gly Val Tyr Leu Trp Asp Ser Glu
35 40 45
Gly Asn Lys Ile Ile Asp Gly Met Ala Gly Leu Trp Cys Val Asn Val
50 55 60
Gly Tyr Gly Arg Lys Asp Phe Ala Glu Ala Ala Arg Arg Gln Met Glu
65 70 75 80
Glu Leu Pro Phe Tyr Asn Thr Phe Phe Lys Thr Thr His Pro Ala Val
85 90 95
Val Glu Leu Ser Ser Leu Leu Ala Glu Val Thr Pro Ala Gly Phe Asp
100 105 110
Arg Val Phe Tyr Thr Asn Ser Gly Ser Glu Ser Val Asp Thr Met Ile
115 120 125
Arg Met Val Arg Arg Tyr Trp Asp Val Gln Gly Lys Pro Glu Lys Lys
130 135 140
Thr Leu Ile Gly Arg Trp Asn Gly Tyr His Gly Ser Thr Ile Gly Gly
145 150 155 160
Ala Ser Leu Gly Gly Met Lys Tyr Met His Glu Gln Gly Asp Leu Pro
165 170 175
Ile Pro Gly Met Ala His Ile Glu Gln Pro Trp Trp Tyr Lys His Gly
180 185 190
Lys Asp Met Thr Pro Asp Glu Phe Gly Val Val Ala Ala Arg Trp Leu
195 200 205
Glu Glu Lys Ile Leu Glu Ile Gly Ala Asp Lys Val Ala Ala Phe Val
210 215 220
Gly Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Ala Thr
225 230 235 240
Tyr Trp Pro Glu Ile Glu Arg Ile Cys Arg Lys Tyr Asp Val Leu Leu
245 250 255
Val Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Glu Trp Phe
260 265 270
Gly His Gln His Phe Gly Phe Gln Pro Asp Leu Phe Thr Ala Ala Lys
275 280 285
Gly Leu Ser Ser Gly Tyr Leu Pro Ile Gly Ala Val Phe Val Gly Lys
290 295 300
Arg Val Ala Glu Gly Leu Ile Ala Gly Gly Asp Phe Asn His Gly Phe
305 310 315 320
Thr Tyr Ser Gly His Pro Val Cys Ala Ala Val Ala His Ala Asn Val
325 330 335
Ala Ala Leu Arg Asp Glu Gly Ile Val Gln Arg Val Lys Asp Asp Ile
340 345 350
Gly Pro Tyr Met Gln Lys Arg Trp Arg Glu Thr Phe Ser Arg Phe Glu
355 360 365
His Val Asp Asp Val Arg Gly Val Gly Met Val Gln Ala Phe Thr Leu
370 375 380
Val Lys Asn Lys Ala Lys Arg Glu Leu Phe Pro Asp Phe Gly Glu Ile
385 390 395 400
Gly Thr Leu Cys Arg Asp Ile Phe Phe Arg Asn Asn Leu Ile Met Arg
405 410 415
Ala Cys Gly Asp His Ile Val Ser Ala Pro Pro Leu Val Met Thr Arg
420 425 430
Ala Glu Val Asp Glu Met Leu Ala Val Ala Glu Arg Cys Leu Glu Glu
435 440 445
Phe Glu Gln Thr Leu Lys Ala Arg Gly Leu Ala
450 455
<210> 8
<211> 468
<212> PRT
<213> 铜绿假单胞菌
<400> 8
Met Asn Ala Arg Leu His Ala Thr Ser Pro Leu Gly Asp Ala Asp Leu
1 5 10 15
Val Arg Ala Asp Gln Ala His Tyr Met His Gly Tyr His Val Phe Asp
20 25 30
Asp His Arg Val Asn Gly Ser Leu Asn Ile Ala Ala Gly Asp Gly Ala
35 40 45
Tyr Ile Tyr Asp Thr Ala Gly Asn Arg Tyr Leu Asp Ala Val Gly Gly
50 55 60
Met Trp Cys Thr Asn Ile Gly Leu Gly Arg Glu Glu Met Ala Arg Thr
65 70 75 80
Val Ala Glu Gln Thr Arg Leu Leu Ala Tyr Ser Asn Pro Phe Cys Asp
85 90 95
Met Ala Asn Pro Arg Ala Ile Glu Leu Cys Arg Lys Leu Ala Glu Leu
100 105 110
Ala Pro Gly Asp Leu Asp His Val Phe Leu Thr Thr Gly Gly Ser Thr
115 120 125
Ala Val Asp Thr Ala Ile Arg Leu Met His Tyr Tyr Gln Asn Cys Arg
130 135 140
Gly Lys Arg Ala Lys Lys His Val Ile Thr Arg Ile Asn Ala Tyr His
145 150 155 160
Gly Ser Thr Phe Leu Gly Met Ser Leu Gly Gly Lys Ser Ala Asp Arg
165 170 175
Pro Ala Glu Phe Asp Phe Leu Asp Glu Arg Ile His His Leu Ala Cys
180 185 190
Pro Tyr Tyr Tyr Arg Ala Pro Glu Gly Leu Gly Glu Ala Glu Phe Leu
195 200 205
Asp Gly Leu Val Asp Glu Phe Glu Arg Lys Ile Leu Glu Leu Gly Ala
210 215 220
Asp Arg Val Gly Ala Phe Ile Ser Glu Pro Val Phe Gly Ser Gly Gly
225 230 235 240
Val Ile Val Pro Pro Ala Gly Tyr His Arg Arg Met Trp Glu Leu Cys
245 250 255
Gln Arg Tyr Asp Val Leu Tyr Ile Ser Asp Glu Val Val Thr Ser Phe
260 265 270
Gly Arg Leu Gly His Phe Phe Ala Ser Gln Ala Val Phe Gly Val Gln
275 280 285
Pro Asp Ile Ile Leu Thr Ala Lys Gly Leu Thr Ser Gly Tyr Gln Pro
290 295 300
Leu Gly Ala Cys Ile Phe Ser Arg Arg Ile Trp Glu Val Ile Ala Glu
305 310 315 320
Pro Asp Lys Gly Arg Cys Phe Ser His Gly Phe Thr Tyr Ser Gly His
325 330 335
Pro Val Ala Cys Ala Ala Ala Leu Lys Asn Ile Glu Ile Ile Glu Arg
340 345 350
Glu Gly Leu Leu Ala His Ala Asp Glu Val Gly Arg Tyr Phe Glu Glu
355 360 365
Arg Leu Gln Ser Leu Arg Asp Leu Pro Ile Val Gly Asp Val Arg Gly
370 375 380
Met Arg Phe Met Ala Cys Val Glu Phe Val Ala Asp Lys Ala Ser Lys
385 390 395 400
Ala Leu Phe Pro Glu Ser Leu Asn Ile Gly Glu Trp Val His Leu Arg
405 410 415
Ala Gln Lys Arg Gly Leu Leu Val Arg Pro Ile Val His Leu Asn Val
420 425 430
Met Ser Pro Pro Leu Ile Leu Thr Arg Glu Gln Val Asp Thr Val Val
435 440 445
Arg Val Leu Arg Glu Ser Ile Glu Glu Thr Val Glu Asp Leu Val Arg
450 455 460
Ala Gly His Arg
465
<210> 9
<211> 454
<212> PRT
<213> 丁香假单胞菌
<400> 9
Met Ser Ala Asn Asn Pro Gln Thr Leu Glu Trp Gln Ala Leu Ser Ser
1 5 10 15
Glu His His Leu Ala Pro Phe Ser Asp Tyr Lys Gln Leu Lys Glu Lys
20 25 30
Gly Pro Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Leu Trp Asp Ser
35 40 45
Glu Gly Asn Lys Ile Leu Asp Gly Met Ser Gly Leu Trp Cys Val Ala
50 55 60
Ile Gly Tyr Gly Arg Glu Glu Leu Ala Asp Ala Ala Ser Lys Gln Met
65 70 75 80
Arg Glu Leu Pro Tyr Tyr Asn Leu Phe Phe Gln Thr Ala His Pro Pro
85 90 95
Val Leu Glu Leu Ala Lys Ala Ile Ser Asp Ile Ala Pro Glu Gly Met
100 105 110
Asn His Val Phe Phe Thr Gly Ser Gly Ser Glu Gly Asn Asp Thr Met
115 120 125
Leu Arg Met Val Arg His Tyr Trp Ala Leu Lys Gly Gln Pro Asn Lys
130 135 140
Lys Thr Ile Ile Ser Arg Val Asn Gly Tyr His Gly Ser Thr Val Ala
145 150 155 160
Gly Ala Ser Leu Gly Gly Met Thr Tyr Met His Glu Gln Gly Asp Leu
165 170 175
Pro Ile Pro Gly Val Val His Ile Pro Gln Pro Tyr Trp Phe Gly Glu
180 185 190
Gly Gly Asp Met Thr Pro Asp Glu Phe Gly Ile Trp Ala Ala Glu Gln
195 200 205
Leu Glu Lys Lys Ile Leu Glu Leu Gly Val Glu Asn Val Gly Ala Phe
210 215 220
Ile Ala Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Asp
225 230 235 240
Ser Tyr Trp Pro Lys Ile Lys Glu Ile Leu Ser Arg Tyr Asp Ile Leu
245 250 255
Phe Ala Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Ser Glu Trp
260 265 270
Phe Gly Ser Asp Phe Tyr Gly Leu Arg Pro Asp Met Met Thr Ile Ala
275 280 285
Lys Gly Leu Thr Ser Gly Tyr Val Pro Met Gly Gly Leu Ile Val Arg
290 295 300
Asp Glu Ile Val Ala Val Leu Asn Glu Gly Gly Asp Phe Asn His Gly
305 310 315 320
Phe Thr Tyr Ser Gly His Pro Val Ala Ala Ala Val Ala Leu Glu Asn
325 330 335
Ile Arg Ile Leu Arg Glu Glu Lys Ile Val Glu Arg Val Arg Ser Glu
340 345 350
Thr Ala Pro Tyr Leu Gln Lys Arg Leu Arg Glu Leu Ser Asp His Pro
355 360 365
Leu Val Gly Glu Val Arg Gly Val Gly Leu Leu Gly Ala Ile Glu Leu
370 375 380
Val Lys Asp Lys Thr Thr Arg Glu Arg Tyr Thr Asp Lys Gly Ala Gly
385 390 395 400
Met Ile Cys Arg Thr Phe Cys Phe Asp Asn Gly Leu Ile Met Arg Ala
405 410 415
Val Gly Asp Thr Met Ile Ile Ala Pro Pro Leu Val Ile Ser Phe Ala
420 425 430
Gln Ile Asp Glu Leu Val Glu Lys Ala Arg Thr Cys Leu Asp Leu Thr
435 440 445
Leu Ala Val Leu Gln Gly
450
<210> 10
<211> 467
<212> PRT
<213> 球形红杆菌
<400> 10
Met Thr Arg Asn Asp Ala Thr Asn Ala Ala Gly Ala Val Gly Ala Ala
1 5 10 15
Met Arg Asp His Ile Leu Leu Pro Ala Gln Glu Met Ala Lys Leu Gly
20 25 30
Lys Ser Ala Gln Pro Val Leu Thr His Ala Glu Gly Ile Tyr Val His
35 40 45
Thr Glu Asp Gly Arg Arg Leu Ile Asp Gly Pro Ala Gly Met Trp Cys
50 55 60
Ala Gln Val Gly Tyr Gly Arg Arg Glu Ile Val Asp Ala Met Ala His
65 70 75 80
Gln Ala Met Val Leu Pro Tyr Ala Ser Pro Trp Tyr Met Ala Thr Ser
85 90 95
Pro Ala Ala Arg Leu Ala Glu Lys Ile Ala Thr Leu Thr Pro Gly Asp
100 105 110
Leu Asn Arg Ile Phe Phe Thr Thr Gly Gly Ser Thr Ala Val Asp Ser
115 120 125
Ala Leu Arg Phe Ser Glu Phe Tyr Asn Asn Val Leu Gly Arg Pro Gln
130 135 140
Lys Lys Arg Ile Ile Val Arg Tyr Asp Gly Tyr His Gly Ser Thr Ala
145 150 155 160
Leu Thr Ala Ala Cys Thr Gly Arg Thr Gly Asn Trp Pro Asn Phe Asp
165 170 175
Ile Ala Gln Asp Arg Ile Ser Phe Leu Ser Ser Pro Asn Pro Arg His
180 185 190
Ala Gly Asn Arg Ser Gln Glu Ala Phe Leu Asp Asp Leu Val Gln Glu
195 200 205
Phe Glu Asp Arg Ile Glu Ser Leu Gly Pro Asp Thr Ile Ala Ala Phe
210 215 220
Leu Ala Glu Pro Ile Leu Ala Ser Gly Gly Val Ile Ile Pro Pro Ala
225 230 235 240
Gly Tyr His Ala Arg Phe Lys Ala Ile Cys Glu Lys His Asp Ile Leu
245 250 255
Tyr Ile Ser Asp Glu Val Val Thr Gly Phe Gly Arg Cys Gly Glu Trp
260 265 270
Phe Ala Ser Glu Lys Val Phe Gly Val Val Pro Asp Ile Ile Thr Phe
275 280 285
Ala Lys Gly Val Thr Ser Gly Tyr Val Pro Leu Gly Gly Leu Ala Ile
290 295 300
Ser Glu Ala Val Leu Ala Arg Ile Ser Gly Glu Asn Ala Lys Gly Ser
305 310 315 320
Trp Phe Thr Asn Gly Tyr Thr Tyr Ser Asn Gln Pro Val Ala Cys Ala
325 330 335
Ala Ala Leu Ala Asn Ile Glu Leu Met Glu Arg Glu Gly Ile Val Asp
340 345 350
Gln Ala Arg Glu Met Ala Asp Tyr Phe Ala Ala Ala Leu Ala Ser Leu
355 360 365
Arg Asp Leu Pro Gly Val Ala Glu Thr Arg Ser Val Gly Leu Val Gly
370 375 380
Cys Val Gln Cys Leu Leu Asp Pro Thr Arg Ala Asp Gly Thr Ala Glu
385 390 395 400
Asp Lys Ala Phe Thr Leu Lys Ile Asp Glu Arg Cys Phe Glu Leu Gly
405 410 415
Leu Ile Val Arg Pro Leu Gly Asp Leu Cys Val Ile Ser Pro Pro Leu
420 425 430
Ile Ile Ser Arg Ala Gln Ile Asp Glu Met Val Ala Ile Met Arg Gln
435 440 445
Ala Ile Thr Glu Val Ser Ala Ala His Gly Leu Thr Ala Lys Glu Pro
450 455 460
Ala Ala Val
465
<210> 11
<211> 459
<212> PRT
<213> 大肠杆菌
<400> 11
Met Asn Arg Leu Pro Ser Ser Ala Ser Ala Leu Ala Cys Ser Ala His
1 5 10 15
Ala Leu Asn Leu Ile Glu Lys Arg Thr Leu Asp His Glu Glu Met Lys
20 25 30
Ala Leu Asn Arg Glu Val Ile Glu Tyr Phe Lys Glu His Val Asn Pro
35 40 45
Gly Phe Leu Glu Tyr Arg Lys Ser Val Thr Ala Gly Gly Asp Tyr Gly
50 55 60
Ala Val Glu Trp Gln Ala Gly Ser Leu Asn Thr Leu Val Asp Thr Gln
65 70 75 80
Gly Gln Glu Phe Ile Asp Cys Leu Gly Gly Phe Gly Ile Phe Asn Val
85 90 95
Gly His Arg Asn Pro Val Val Val Ser Ala Val Gln Asn Gln Leu Ala
100 105 110
Lys Gln Pro Leu His Ser Gln Glu Leu Leu Asp Pro Leu Arg Ala Met
115 120 125
Leu Ala Lys Thr Leu Ala Ala Leu Thr Pro Gly Lys Leu Lys Tyr Ser
130 135 140
Phe Phe Cys Asn Ser Gly Thr Glu Ser Val Glu Ala Ala Leu Lys Leu
145 150 155 160
Ala Lys Ala Tyr Gln Ser Pro Arg Gly Lys Phe Thr Phe Ile Ala Thr
165 170 175
Ser Gly Ala Phe His Gly Lys Ser Leu Gly Ala Leu Ser Ala Thr Ala
180 185 190
Lys Ser Thr Phe Arg Lys Pro Phe Met Pro Leu Leu Pro Gly Phe Arg
195 200 205
His Val Pro Phe Gly Asn Ile Glu Ala Met Arg Thr Ala Leu Asn Glu
210 215 220
Cys Lys Lys Thr Gly Asp Asp Val Ala Ala Val Ile Leu Glu Pro Ile
225 230 235 240
Gln Gly Glu Gly Gly Val Ile Leu Pro Pro Pro Gly Tyr Leu Thr Ala
245 250 255
Val Arg Lys Leu Cys Asp Glu Phe Gly Ala Leu Met Ile Leu Asp Glu
260 265 270
Val Gln Thr Gly Met Gly Arg Thr Gly Lys Met Phe Ala Cys Glu His
275 280 285
Glu Asn Val Gln Pro Asp Ile Leu Cys Leu Ala Lys Ala Leu Gly Gly
290 295 300
Gly Val Met Pro Ile Gly Ala Thr Ile Ala Thr Glu Glu Val Phe Ser
305 310 315 320
Val Leu Phe Asp Asn Pro Phe Leu His Thr Thr Thr Phe Gly Gly Asn
325 330 335
Pro Leu Ala Cys Ala Ala Ala Leu Ala Thr Ile Asn Val Leu Leu Glu
340 345 350
Gln Asn Leu Pro Ala Gln Ala Glu Gln Lys Gly Asp Met Leu Leu Asp
355 360 365
Gly Phe Arg Gln Leu Ala Arg Glu Tyr Pro Asp Leu Val Gln Glu Ala
370 375 380
Arg Gly Lys Gly Met Leu Met Ala Ile Glu Phe Val Asp Asn Glu Ile
385 390 395 400
Gly Tyr Asn Phe Ala Ser Glu Met Phe Arg Gln Arg Val Leu Val Ala
405 410 415
Gly Thr Leu Asn Asn Ala Lys Thr Ile Arg Ile Glu Pro Pro Leu Thr
420 425 430
Leu Thr Ile Glu Gln Cys Glu Leu Val Ile Lys Ala Ala Arg Lys Ala
435 440 445
Leu Ala Ala Met Arg Val Ser Val Glu Glu Ala
450 455
<210> 12
<211> 453
<212> PRT
<213> 河流弧菌
<400> 12
Met Asn Lys Pro Gln Ser Trp Glu Ala Arg Ala Glu Thr Tyr Ser Leu
1 5 10 15
Tyr Gly Phe Thr Asp Met Pro Ser Leu His Gln Arg Gly Thr Val Val
20 25 30
Val Thr His Gly Glu Gly Pro Tyr Ile Val Asp Val Asn Gly Arg Arg
35 40 45
Tyr Leu Asp Ala Asn Ser Gly Leu Trp Asn Met Val Ala Gly Phe Asp
50 55 60
His Lys Gly Leu Ile Asp Ala Ala Lys Ala Gln Tyr Glu Arg Phe Pro
65 70 75 80
Gly Tyr His Ala Phe Phe Gly Arg Met Ser Asp Gln Thr Val Met Leu
85 90 95
Ser Glu Lys Leu Val Glu Val Ser Pro Phe Asp Ser Gly Arg Val Phe
100 105 110
Tyr Thr Asn Ser Gly Ser Glu Ala Asn Asp Thr Met Val Lys Met Leu
115 120 125
Trp Phe Leu His Ala Ala Glu Gly Lys Pro Gln Lys Arg Lys Ile Leu
130 135 140
Thr Arg Trp Asn Ala Tyr His Gly Val Thr Ala Val Ser Ala Ser Met
145 150 155 160
Thr Gly Lys Pro Tyr Asn Ser Val Phe Gly Leu Pro Leu Pro Gly Phe
165 170 175
Val His Leu Thr Cys Pro His Tyr Trp Arg Tyr Gly Glu Glu Gly Glu
180 185 190
Thr Glu Glu Gln Phe Val Ala Arg Leu Ala Arg Glu Leu Glu Glu Thr
195 200 205
Ile Gln Arg Glu Gly Ala Asp Thr Ile Ala Gly Phe Phe Ala Glu Pro
210 215 220
Val Met Gly Ala Gly Gly Val Ile Pro Pro Ala Lys Gly Tyr Phe Gln
225 230 235 240
Ala Ile Leu Pro Ile Leu Arg Lys Tyr Asp Ile Pro Val Ile Ser Asp
245 250 255
Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Asn Thr Trp Gly Cys Val
260 265 270
Thr Tyr Asp Phe Thr Pro Asp Ala Ile Ile Ser Ser Lys Asn Leu Thr
275 280 285
Ala Gly Phe Phe Pro Met Gly Ala Val Ile Leu Gly Pro Glu Leu Ser
290 295 300
Lys Arg Leu Glu Thr Ala Ile Glu Ala Ile Glu Glu Phe Pro His Gly
305 310 315 320
Phe Thr Ala Ser Gly His Pro Val Gly Cys Ala Ile Ala Leu Lys Ala
325 330 335
Ile Asp Val Val Met Asn Glu Gly Leu Ala Glu Asn Val Arg Arg Leu
340 345 350
Ala Pro Arg Phe Glu Glu Arg Leu Lys His Ile Ala Glu Arg Pro Asn
355 360 365
Ile Gly Glu Tyr Arg Gly Ile Gly Phe Met Trp Ala Leu Glu Ala Val
370 375 380
Lys Asp Lys Ala Ser Lys Thr Pro Phe Asp Gly Asn Leu Ser Val Ser
385 390 395 400
Glu Arg Ile Ala Asn Thr Cys Thr Asp Leu Gly Leu Ile Cys Arg Pro
405 410 415
Leu Gly Gln Ser Val Val Leu Cys Pro Pro Phe Ile Leu Thr Glu Ala
420 425 430
Gln Met Asp Glu Met Phe Asp Lys Leu Glu Lys Ala Leu Asp Lys Val
435 440 445
Phe Ala Glu Val Ala
450
<210> 13
<211> 418
<212> PRT
<213> 极胞菌属物种JS666
<400> 13
Met Ser Glu Ala Ile Val Val Asn Asn Gln Asn Asp Gln Ser Arg Ala
1 5 10 15
Tyr Ala Ile Pro Leu Glu Asp Ile Asp Val Ser Asn Pro Glu Leu Phe
20 25 30
Arg Asp Asn Thr Met Trp Gly Tyr Phe Glu Arg Leu Arg Arg Glu Asp
35 40 45
Pro Val His Tyr Cys Lys Asp Ser Leu Phe Gly Pro Tyr Trp Ser Val
50 55 60
Thr Lys Phe Lys Asp Ile Met Gln Val Glu Thr His Pro Glu Ile Phe
65 70 75 80
Ser Ser Glu Gly Asn Ile Thr Ile Met Glu Ser Asn Ala Ala Val Thr
85 90 95
Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg
100 105 110
Met Ala Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Lys Leu Glu
115 120 125
Gly Leu Ile Arg Glu Arg Thr Gly Arg Ala Leu Asp Gly Leu Pro Ile
130 135 140
Asn Glu Thr Phe Asp Trp Val Lys Leu Val Ser Ile Asn Leu Thr Thr
145 150 155 160
Gln Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Glu Asp Arg Ala Lys
165 170 175
Leu Thr Arg Trp Ser Asp Val Ala Thr Ala Leu Val Gly Thr Gly Ile
180 185 190
Ile Asp Ser Glu Glu Gln Arg Met Glu Glu Leu Lys Gly Cys Val Gln
195 200 205
Tyr Met Thr Arg Leu Trp Asn Glu Arg Val Asn Val Pro Pro Gly Asn
210 215 220
Asp Leu Ile Ser Met Met Ala His Thr Glu Ser Met Arg Asn Met Thr
225 230 235 240
Pro Glu Glu Phe Leu Gly Asn Leu Ile Leu Leu Ile Val Gly Gly Asn
245 250 255
Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu Asn Glu
260 265 270
Asn Pro Asp Glu Tyr Arg Lys Leu Cys Ala Asn Pro Ala Leu Ile Ala
275 280 285
Ser Met Val Pro Glu Ile Val Arg Trp Gln Thr Pro Leu Ala His Met
290 295 300
Arg Arg Thr Ala Leu Gln Asp Thr Glu Leu Gly Gly Lys Ser Ile Arg
305 310 315 320
Lys Gly Asp Lys Val Ile Met Trp Tyr Val Ser Gly Asn Arg Asp Pro
325 330 335
Glu Ala Ile Glu Asn Pro Asp Ala Phe Ile Ile Asp Arg Ala Lys Pro
340 345 350
Arg His His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val Gly Asn
355 360 365
Arg Leu Ala Glu Leu Gln Leu Arg Ile Val Trp Glu Glu Leu Leu Lys
370 375 380
Arg Trp Pro Asn Pro Gly Gln Ile Glu Val Val Gly Ala Pro Glu Arg
385 390 395 400
Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val Arg Ile
405 410 415
Asn Ala
<210> 14
<211> 420
<212> PRT
<213> 分枝杆菌属物种 HXN-1500
<400> 14
Met Thr Glu Met Thr Val Ala Ala Ser Asp Ala Thr Asn Ala Ala Tyr
1 5 10 15
Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg
20 25 30
Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro
35 40 45
Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr
50 55 60
Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser
65 70 75 80
Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala
85 90 95
Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val
100 105 110
Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr
115 120 125
Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu
130 135 140
Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Glu Leu
145 150 155 160
Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg
165 170 175
Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly
180 185 190
Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys
195 200 205
Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro
210 215 220
Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His
225 230 235 240
Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly
245 250 255
Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu
260 265 270
Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu
275 280 285
Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser
290 295 300
His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His
305 310 315 320
Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg
325 330 335
Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala
340 345 350
Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val
355 360 365
Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile
370 375 380
Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro
385 390 395 400
Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val
405 410 415
Arg Ile Asn Ala
420
<210> 15
<211> 420
<212> PRT
<213> 南非分枝杆菌
<400> 15
Met Thr Glu Met Thr Val Ala Ala Asn Asp Ala Thr Asn Ala Ala Tyr
1 5 10 15
Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg
20 25 30
Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro
35 40 45
Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr
50 55 60
Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser
65 70 75 80
Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala
85 90 95
Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val
100 105 110
Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr
115 120 125
Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu
130 135 140
Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Asp Leu
145 150 155 160
Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg
165 170 175
Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly
180 185 190
Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys
195 200 205
Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro
210 215 220
Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His
225 230 235 240
Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly
245 250 255
Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu
260 265 270
Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu
275 280 285
Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser
290 295 300
His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His
305 310 315 320
Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg
325 330 335
Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala
340 345 350
Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val
355 360 365
Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile
370 375 380
Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro
385 390 395 400
Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val
405 410 415
Arg Ile Asn Ala
420
<210> 16
<211> 405
<212> PRT
<213> 极胞菌属物种JS666
<400> 16
Met Ser Glu Thr Val Ile Ile Ala Gly Ala Gly Gln Ala Ala Gly Gln
1 5 10 15
Ala Val Ala Ser Leu Arg Gln Glu Gly Phe Asp Gly Arg Ile Val Leu
20 25 30
Val Gly Ala Glu Pro Val Leu Pro Tyr Gln Arg Pro Pro Leu Ser Lys
35 40 45
Ala Phe Leu Ala Gly Thr Leu Pro Leu Glu Arg Leu Phe Leu Lys Pro
50 55 60
Pro Ala Phe Tyr Glu Gln Ala Arg Val Asp Thr Leu Leu Gly Val Ala
65 70 75 80
Val Thr Glu Leu Asp Ala Ala Arg Arg Gln Val Arg Leu Asp Asp Gly
85 90 95
Arg Glu Leu Ala Phe Asp His Leu Leu Leu Ala Thr Gly Gly Arg Ala
100 105 110
Arg Arg Leu Asp Cys Pro Gly Ala Asp His Pro Arg Leu His Tyr Leu
115 120 125
Arg Thr Val Ala Asp Val Asp Gly Ile Arg Ala Ala Leu Arg Pro Gly
130 135 140
Ala Arg Leu Val Leu Ile Gly Gly Gly Tyr Val Gly Leu Glu Ile Ala
145 150 155 160
Ala Val Ala Ala Lys Leu Gly Leu Ala Val Thr Val Leu Glu Ala Ala
165 170 175
Pro Thr Val Leu Ala Arg Val Thr Cys Pro Ala Val Ala Arg Phe Phe
180 185 190
Glu Ser Val His Arg Gln Ala Gly Val Thr Ile Arg Cys Ala Thr Thr
195 200 205
Val Ser Gly Ile Glu Gly Asp Ala Ser Leu Ala Arg Val Val Thr Gly
210 215 220
Asp Gly Glu Arg Ile Asp Ala Asp Leu Val Ile Ala Gly Ile Gly Leu
225 230 235 240
Leu Pro Asn Val Glu Leu Ala Gln Ala Ala Gly Leu Val Cys Asp Asn
245 250 255
Gly Ile Val Val Asp Glu Glu Cys Arg Thr Ser Val Pro Gly Ile Phe
260 265 270
Ala Ala Gly Asp Cys Thr Gln His Pro Asn Ala Ile Tyr Asp Ser Arg
275 280 285
Leu Arg Leu Glu Ser Val His Asn Ala Ile Glu Gln Gly Lys Thr Ala
290 295 300
Ala Ala Ala Met Cys Gly Lys Ala Arg Pro Tyr Arg Gln Val Pro Trp
305 310 315 320
Phe Trp Ser Asp Gln Tyr Asp Leu Lys Leu Gln Thr Ala Gly Leu Asn
325 330 335
Arg Gly Tyr Asp Gln Val Val Met Arg Gly Ser Thr Asp Asn Arg Ser
340 345 350
Phe Ala Ala Phe Tyr Leu Arg Asp Gly Arg Leu Leu Ala Val Asp Ala
355 360 365
Val Asn Arg Pro Val Glu Phe Met Val Ala Lys Ala Leu Ile Ala Asn
370 375 380
Arg Thr Val Ile Ala Pro Glu Arg Leu Ala Asp Glu Arg Ile Ala Ala
385 390 395 400
Lys Asp Leu Ala Gly
405
<210> 17
<211> 424
<212> PRT
<213> 分枝杆菌属物种HXN-1500
<400> 17
Met Ile His Thr Gly Val Thr Glu Ala Val Val Val Val Gly Ala Gly
1 5 10 15
Gln Ala Gly Ala Gln Thr Val Thr Ser Leu Arg Gln Arg Gly Phe Glu
20 25 30
Gly Gln Ile Thr Leu Leu Gly Asp Glu Pro Ala Leu Pro Tyr Gln Arg
35 40 45
Pro Pro Leu Ser Lys Ala Phe Leu Ala Gly Thr Leu Pro Leu Asp Arg
50 55 60
Leu Tyr Leu Arg Pro Ala Ala Phe Tyr Gln Gln Ala His Val Asp Val
65 70 75 80
Met Val Asp Thr Gly Val Ser Glu Leu Asp Thr Glu Asn Arg Arg Ile
85 90 95
Arg Leu Thr Asp Gly Arg Ala Ile Ser Phe Asp His Leu Val Leu Ala
100 105 110
Thr Gly Gly Arg Pro Arg Pro Leu Ala Cys Pro Gly Ala Asp His Pro
115 120 125
Arg Val His Tyr Leu Arg Thr Val Thr Asp Val Asp Arg Ile Arg Ser
130 135 140
Gln Phe His Pro Gly Thr Arg Leu Val Leu Val Gly Gly Gly Tyr Ile
145 150 155 160
Gly Leu Glu Ile Ala Ala Val Ala Ala Glu Leu Gly Leu Thr Val Thr
165 170 175
Val Leu Glu Ala Gln Thr Thr Val Leu Ala Arg Val Thr Cys Pro Thr
180 185 190
Val Ala Arg Phe Phe Glu His Thr His Arg Arg Ala Gly Val Thr Ile
195 200 205
Arg Cys Ala Thr Thr Val Thr Arg Ile His Asp Ser Ser Ser Thr Ala
210 215 220
Arg Ile Glu Leu Asp Ser Gly Glu Tyr Ile Asp Ala Asp Leu Val Ile
225 230 235 240
Val Gly Ile Gly Leu Leu Pro Asn Val Asp Leu Ala Ser Ala Ala Gly
245 250 255
Leu Thr Cys Glu Ser Gly Ile Val Val Asp Ser Arg Cys Gln Thr Ser
260 265 270
Ala Pro Gly Ile Tyr Ala Ala Gly Asp Cys Thr Gln Tyr Pro Ser Pro
275 280 285
Ile Tyr Gly Arg Pro Leu His Leu Glu Ser Val His Asn Ala Ile Glu
290 295 300
Gln Ala Lys Thr Ala Ala Ala Ala Ile Leu Gly Arg Asp Glu Pro Phe
305 310 315 320
Arg Gln Val Pro Trp Phe Trp Ser Asp Gln Tyr Asn Ile Lys Leu Gln
325 330 335
Thr Ala Gly Val Asn Glu Gly Tyr Asp Asp Val Ile Ile Arg Gly Asp
340 345 350
Pro Ala Ser Ala Ser Phe Ala Ala Phe Tyr Leu Arg Ala Gly Lys Leu
355 360 365
Leu Ala Val Asp Ala Ile Asn Arg Pro Arg Glu Phe Met Ala Ser Lys
370 375 380
Thr Leu Ile Ala Glu Arg Ala Glu Val Asp Pro Thr Gln Leu Ala Asp
385 390 395 400
Glu Ser Leu Pro Pro Thr Ala Leu Ala Ala Ala Val Asn Gly Pro Thr
405 410 415
Arg Ala Thr Ser Pro Thr Ser Leu
420
<210> 18
<211> 106
<212> PRT
<213> 极胞菌属物种 JS666
<400> 18
Met Thr Lys Val Thr Phe Ile Glu His Asn Gly Thr Val Arg Asn Val
1 5 10 15
Asp Val Asp Asp Gly Leu Ser Val Met Glu Ala Ala Val Asn Asn Leu
20 25 30
Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Ala Cys Ala Cys Ala Thr
35 40 45
Cys His Val His Ile Asp Ala Ala Trp Leu Asp Lys Leu Pro Pro Met
50 55 60
Glu Ala Met Glu Lys Ser Met Leu Glu Phe Ala Glu Gly Arg Asn Glu
65 70 75 80
Ser Ser Arg Leu Gly Cys Gln Ile Lys Leu Ser Pro Ala Leu Asp Gly
85 90 95
Ile Val Val Arg Thr Pro Leu Gly Gln His
100 105
<210> 19
<211> 106
<212> PRT
<213> 分枝杆菌属物种 HXN-1500
<400> 19
Met Pro Lys Ile Thr Tyr Ile Asp Tyr Thr Gly Thr Ser Arg Cys Val
1 5 10 15
Asp Ala Glu Asn Gly Met Ser Leu Met Glu Ile Ala Ile Asn Asn Asn
20 25 30
Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Glu Cys Ala Cys Ala Thr
35 40 45
Cys His Val His Val Asp Ala Asp Trp Leu Asp Lys Leu Pro Pro Ser
50 55 60
Ser Asp Gln Glu Val Ser Met Leu Glu Phe Cys Asp Gly Val Asp His
65 70 75 80
Thr Ser Arg Leu Gly Cys Gln Ile Lys Ile Cys Pro Thr Leu Asp Gly
85 90 95
Ile Val Val Arg Thr Pro Ala Ala Gln His
100 105
<210> 20
<211> 224
<212> PRT
<213> 枯草芽孢杆菌
<400> 20
Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu
1 5 10 15
Asn Glu Arg Phe Met Ser Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys
20 25 30
Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp
35 40 45
Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser
50 55 60
Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp
65 70 75 80
Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile
85 90 95
Cys Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys
100 105 110
Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr
115 120 125
Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr
130 135 140
His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly
145 150 155 160
Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly
165 170 175
Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys
180 185 190
Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His
195 200 205
Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu
210 215 220
<210> 21
<211> 222
<212> PRT
<213> 诺卡氏菌属物种NRRL 5646
<400> 21
Met Ile Glu Thr Ile Leu Pro Ala Gly Val Glu Ser Ala Glu Leu Leu
1 5 10 15
Glu Tyr Pro Glu Asp Leu Lys Ala His Pro Ala Glu Glu His Leu Ile
20 25 30
Ala Lys Ser Val Glu Lys Arg Arg Arg Asp Phe Ile Gly Ala Arg His
35 40 45
Cys Ala Arg Leu Ala Leu Ala Glu Leu Gly Glu Pro Pro Val Ala Ile
50 55 60
Gly Lys Gly Glu Arg Gly Ala Pro Ile Trp Pro Arg Gly Val Val Gly
65 70 75 80
Ser Leu Thr His Cys Asp Gly Tyr Arg Ala Ala Ala Val Ala His Lys
85 90 95
Met Arg Phe Arg Ser Ile Gly Ile Asp Ala Glu Pro His Ala Thr Leu
100 105 110
Pro Glu Gly Val Leu Asp Ser Val Ser Leu Pro Pro Glu Arg Glu Trp
115 120 125
Leu Lys Thr Thr Asp Ser Ala Leu His Leu Asp Arg Leu Leu Phe Cys
130 135 140
Ala Lys Glu Ala Thr Tyr Lys Ala Trp Trp Pro Leu Thr Ala Arg Trp
145 150 155 160
Leu Gly Phe Glu Glu Ala His Ile Thr Phe Glu Ile Glu Asp Gly Ser
165 170 175
Ala Asp Ser Gly Asn Gly Thr Phe His Ser Glu Leu Leu Val Pro Gly
180 185 190
Gln Thr Asn Asp Gly Gly Thr Pro Leu Leu Ser Phe Asp Gly Arg Trp
195 200 205
Leu Ile Ala Asp Gly Phe Ile Leu Thr Ala Ile Ala Tyr Ala
210 215 220
<210> 22
<211> 368
<212> PRT
<213> 海分枝杆菌
<400> 22
Met Pro Arg Glu Ile Arg Leu Pro Glu Ser Ser Val Val Val Arg Pro
1 5 10 15
Ala Pro Met Glu Ser Ala Thr Tyr Ser Gln Ser Ser Arg Leu Gln Ala
20 25 30
Ala Gly Leu Ser Pro Ala Ile Thr Leu Phe Glu Lys Ala Ala Gln Thr
35 40 45
Val Pro Leu Pro Asp Ala Pro Gln Pro Val Val Ile Ala Asp Tyr Gly
50 55 60
Val Ala Thr Gly His Asn Ser Leu Lys Pro Met Met Ala Ala Ile Asn
65 70 75 80
Ala Leu Arg Arg Arg Ile Arg Glu Asp Arg Ala Ile Met Val Ala His
85 90 95
Thr Asp Val Pro Asp Asn Asp Phe Thr Ala Leu Phe Arg Thr Leu Ala
100 105 110
Asp Asp Pro Asp Ser Tyr Leu His His Asp Ser Ala Ser Phe Ala Ser
115 120 125
Ala Val Gly Arg Ser Phe Tyr Thr Gln Ile Leu Pro Ser Asn Thr Val
130 135 140
Ser Leu Gly Trp Ser Ser Trp Ala Ile Gln Trp Leu Ser Arg Ile Pro
145 150 155 160
Ala Gly Ala Pro Glu Leu Thr Asp His Val Gln Val Ala Tyr Ser Lys
165 170 175
Asp Glu Arg Ala Arg Ala Ala Tyr Ala His Gln Ala Ala Thr Asp Trp
180 185 190
Gln Asp Phe Leu Ala Phe Arg Gly Arg Glu Leu Cys Pro Gly Gly Arg
195 200 205
Leu Val Val Leu Thr Met Ala Leu Asp Glu His Gly His Phe Gly Tyr
210 215 220
Arg Pro Met Asn Asp Ala Leu Val Ala Ala Leu Asn Asp Gln Val Arg
225 230 235 240
Asp Gly Leu Leu Arg Pro Glu Glu Leu Arg Arg Met Ala Ile Pro Val
245 250 255
Val Ala Arg Ala Glu Lys Asp Leu Arg Ala Pro Phe Ala Pro Arg Gly
260 265 270
Trp Phe Glu Gly Leu Thr Ile Glu Gln Leu Asp Val Phe Asn Ala Glu
275 280 285
Asp Arg Phe Trp Ala Ala Phe Gln Ser Asp Gly Asp Ala Glu Ser Phe
290 295 300
Gly Ala Gln Trp Ala Gly Phe Ala Arg Ala Ala Leu Phe Pro Thr Leu
305 310 315 320
Ala Ala Ala Leu Asp Cys Gly Thr Gly Asp Pro Arg Ala Thr Ala Phe
325 330 335
Ile Glu Gln Leu Glu Ala Ser Val Ala Asp Arg Leu Ala Ser Gln Pro
340 345 350
Glu Pro Met Arg Ile Pro Leu Ala Ser Leu Val Leu Ala Lys Arg Ala
355 360 365
<210> 23
<211> 360
<212> PRT
<213> 耻垢分枝杆菌
<400> 23
Met Pro Lys Phe Arg Val Ala Val Asp Pro Glu Pro Asp Asp Pro Thr
1 5 10 15
Pro Lys Met Arg Ala Pro Arg Pro His Ala Ala Gly Leu Asn Ser Ala
20 25 30
Ile Ala Leu Leu Glu Glu Ala Ala Arg Thr Val Pro Leu Pro Glu Ala
35 40 45
Pro Tyr Pro Ile Val Ile Ala Asp Tyr Gly Val Gly Thr Gly Arg Asn
50 55 60
Ser Met Arg Pro Ile Ala Ala Ala Ile Ala Ala Leu Arg Gly Arg Thr
65 70 75 80
Arg Pro Glu His Ser Val Leu Val Thr His Thr Asp Asn Ala Asp Asn
85 90 95
Asp Phe Thr Ala Val Phe Arg Gly Leu Ala Asp Asn Pro Asp Ser Tyr
100 105 110
Leu Arg Arg Asp Thr Ser Thr Tyr Pro Ser Ala Val Gly Arg Ser Phe
115 120 125
Tyr Thr Gln Ile Leu Pro Ser Lys Ser Val His Val Gly Trp Ser Ala
130 135 140
Trp Ala Ile Val Arg Val Gly Arg Met Pro Met Pro Val Pro Asp His
145 150 155 160
Val Ala Ala Ser Phe Ser Gly Asp Pro Gln Val Val Ala Ala Tyr Ala
165 170 175
Arg Gln Ala Ala Phe Asp Trp His Glu Phe Val Ala Phe Arg Gly Arg
180 185 190
Glu Leu Ala Ser Gly Ala Gln Leu Val Val Leu Thr Ala Ala Leu Gly
195 200 205
Asp Asp Gly Asp Phe Gly Tyr Arg Pro Leu Phe Ala Ala Val Met Asp
210 215 220
Thr Leu Arg Glu Leu Thr Ala Asp Gly Val Leu Arg Gln Asp Glu Leu
225 230 235 240
His Arg Met Ser Leu Pro Ile Val Gly Arg Arg Ala Asn Asp Phe Met
245 250 255
Ala Pro Phe Ala Pro Ser Gly Arg Phe Glu Arg Leu Ser Ile Ser His
260 265 270
Leu Glu Val Tyr Asp Ala Glu Asp Val Ile Tyr Ser Ser Tyr Gln Lys
275 280 285
Asp Arg Asp Thr Asp Val Phe Gly Leu Arg Trp Ala Asp Phe Cys Arg
290 295 300
Phe Thr Phe Phe Ser Asp Leu Cys Thr Ala Leu Asp Asp Asp Ala Ala
305 310 315 320
Arg Cys Thr Gln Phe Gln Asp Arg Leu His Ala Gly Ile Ala Ala Arg
325 330 335
Leu Ser Ala Gln Pro Glu Gln Met Arg Ile Pro Leu Ala Gln Leu Val
340 345 350
Leu Glu Arg Arg Arg Arg Ser Gly
355 360
<210> 24
<211> 394
<212> PRT
<213> 恶臭假单胞菌
<400> 24
Met Leu Ala Gln Leu Pro Pro Ala Leu Gln Ser Leu His Leu Pro Leu
1 5 10 15
Arg Leu Lys Leu Trp Asp Gly Asn Gln Phe Asp Leu Gly Pro Ser Pro
20 25 30
Gln Val Thr Ile Leu Val Lys Glu Pro Gln Leu Ile Gly Gln Leu Thr
35 40 45
His Pro Ser Met Glu Gln Leu Gly Thr Ala Phe Val Glu Gly Lys Leu
50 55 60
Glu Leu Glu Gly Asp Ile Gly Glu Ala Ile Arg Val Cys Asp Glu Leu
65 70 75 80
Ser Glu Ala Leu Phe Thr Asp Glu Asp Glu Gln Pro Pro Glu Arg Arg
85 90 95
Ser His Asp Lys Arg Thr Asp Ala Glu Ala Ile Ser Tyr His Tyr Asp
100 105 110
Val Ser Asn Ala Phe Tyr Gln Leu Trp Leu Asp Gln Asp Met Ala Tyr
115 120 125
Ser Cys Ala Tyr Phe Arg Glu Pro Asp Asn Thr Leu Asp Gln Ala Gln
130 135 140
Gln Asp Lys Phe Asp His Leu Cys Arg Lys Leu Arg Leu Asn Ala Gly
145 150 155 160
Asp Tyr Leu Leu Asp Val Gly Cys Gly Trp Gly Gly Leu Ala Arg Phe
165 170 175
Ala Ala Arg Glu Tyr Asp Ala Lys Val Phe Gly Ile Thr Leu Ser Lys
180 185 190
Glu Gln Leu Lys Leu Gly Arg Gln Arg Val Lys Ala Glu Gly Leu Thr
195 200 205
Asp Lys Val Asp Leu Gln Ile Leu Asp Tyr Arg Asp Leu Pro Gln Asp
210 215 220
Gly Arg Phe Asp Lys Val Val Ser Val Gly Met Phe Glu His Val Gly
225 230 235 240
His Ala Asn Leu Ala Leu Tyr Cys Gln Lys Leu Phe Gly Ala Val Arg
245 250 255
Glu Gly Gly Leu Val Met Asn His Gly Ile Thr Ala Lys His Val Asp
260 265 270
Gly Arg Pro Val Gly Arg Gly Ala Gly Glu Phe Ile Asp Arg Tyr Val
275 280 285
Phe Pro His Gly Glu Leu Pro His Leu Ser Met Ile Ser Ala Ser Ile
290 295 300
Cys Glu Ala Gly Leu Glu Val Val Asp Val Glu Ser Leu Arg Leu His
305 310 315 320
Tyr Ala Lys Thr Leu His His Trp Ser Glu Asn Leu Glu Asn Gln Leu
325 330 335
His Lys Ala Ala Ala Leu Val Pro Glu Lys Thr Leu Arg Ile Trp Arg
340 345 350
Leu Tyr Leu Ala Gly Cys Ala Tyr Ala Phe Glu Lys Gly Trp Ile Asn
355 360 365
Leu His Gln Ile Leu Ala Val Lys Pro Tyr Ala Asp Gly His His Asp
370 375 380
Leu Pro Trp Thr Arg Glu Asp Met Tyr Arg
385 390
<210> 25
<211> 451
<212> PRT
<213> 酿酒酵母
<400> 25
Met Ser Glu Val Ser Lys Trp Pro Ala Ile Asn Pro Phe His Trp Gly
1 5 10 15
Tyr Asn Gly Thr Val Ser His Ile Val Gly Glu Asn Gly Ser Ile Lys
20 25 30
Leu His Leu Lys Asp Asn Lys Glu Gln Val Asp Phe Asp Glu Phe Ala
35 40 45
Asn Lys Tyr Val Pro Thr Leu Lys Asn Gly Ala Gln Phe Lys Leu Ser
50 55 60
Pro Tyr Leu Phe Thr Gly Ile Leu Gln Thr Leu Tyr Leu Gly Ala Ala
65 70 75 80
Asp Phe Ser Lys Lys Phe Pro Val Phe Tyr Gly Arg Glu Ile Val Lys
85 90 95
Phe Ser Asp Gly Gly Val Cys Thr Ala Asp Trp Leu Ile Asp Ser Trp
100 105 110
Lys Lys Asp Tyr Glu Phe Asp Gln Ser Thr Thr Ser Phe Asp Lys Lys
115 120 125
Lys Phe Asp Lys Asp Glu Lys Ala Thr His Pro Glu Gly Trp Pro Arg
130 135 140
Leu Gln Pro Arg Thr Arg Tyr Leu Lys Asp Asn Glu Leu Glu Glu Leu
145 150 155 160
Arg Glu Val Asp Leu Pro Leu Val Val Ile Leu His Gly Leu Ala Gly
165 170 175
Gly Ser His Glu Pro Ile Ile Arg Ser Leu Ala Glu Asn Leu Ser Arg
180 185 190
Ser Gly Arg Phe Gln Val Val Val Leu Asn Thr Arg Gly Cys Ala Arg
195 200 205
Ser Lys Ile Thr Thr Arg Asn Leu Phe Thr Ala Tyr His Thr Met Asp
210 215 220
Ile Arg Glu Phe Leu Gln Arg Glu Lys Gln Arg His Pro Asp Arg Lys
225 230 235 240
Leu Tyr Ala Val Gly Cys Ser Phe Gly Ala Thr Met Leu Ala Asn Tyr
245 250 255
Leu Gly Glu Glu Gly Asp Lys Ser Pro Leu Ser Ala Ala Ala Thr Leu
260 265 270
Cys Asn Pro Trp Asp Leu Leu Leu Ser Ala Ile Arg Met Ser Gln Asp
275 280 285
Trp Trp Ser Arg Thr Leu Phe Ser Lys Asn Ile Ala Gln Phe Leu Thr
290 295 300
Arg Thr Val Gln Val Asn Met Gly Glu Leu Gly Val Pro Asn Gly Ser
305 310 315 320
Leu Pro Asp His Pro Pro Thr Val Lys Asn Pro Ser Phe Tyr Met Phe
325 330 335
Thr Pro Glu Asn Leu Ile Lys Ala Lys Ser Phe Lys Ser Thr Arg Glu
340 345 350
Phe Asp Glu Val Tyr Thr Ala Pro Ala Leu Gly Phe Pro Asn Ala Met
355 360 365
Glu Tyr Tyr Lys Ala Ala Ser Ser Ile Asn Arg Val Asp Thr Ile Arg
370 375 380
Val Pro Thr Leu Val Ile Asn Ser Arg Asp Asp Pro Val Val Gly Pro
385 390 395 400
Asp Gln Pro Tyr Ser Ile Val Glu Lys Asn Pro Arg Ile Leu Tyr Cys
405 410 415
Arg Thr Asp Leu Gly Gly His Leu Ala Tyr Leu Asp Lys Asp Asn Asn
420 425 430
Ser Trp Ala Thr Lys Ala Ile Ala Glu Phe Phe Thr Lys Phe Asp Glu
435 440 445
Leu Val Val
450
<210> 26
<211> 382
<212> PRT
<213> 荧光假单胞菌
<400> 26
Met Gln Ile Gln Gly His Tyr Glu Leu Gln Phe Glu Ala Val Arg Glu
1 5 10 15
Ala Phe Ala Ala Leu Phe Asp Asp Pro Gln Glu Arg Gly Ala Gly Leu
20 25 30
Cys Ile Gln Ile Gly Gly Glu Thr Val Val Asp Leu Trp Ala Gly Thr
35 40 45
Ala Asp Lys Asp Gly Thr Glu Ala Trp His Ser Asp Thr Ile Val Asn
50 55 60
Leu Phe Ser Cys Thr Lys Thr Phe Thr Ala Val Thr Ala Leu Gln Leu
65 70 75 80
Val Ala Glu Gly Lys Leu Gln Leu Asp Ala Pro Val Ala Asn Tyr Trp
85 90 95
Pro Glu Phe Ala Ala Ala Gly Lys Glu Ala Ile Thr Leu Arg Gln Leu
100 105 110
Leu Cys His Gln Ala Gly Leu Pro Ala Ile Arg Glu Met Leu Pro Thr
115 120 125
Glu Ala Leu Tyr Asp Trp Arg Leu Met Val Asp Thr Leu Ala Ala Glu
130 135 140
Ala Pro Trp Trp Thr Pro Gly Gln Gly His Gly Tyr Glu Ala Ile Thr
145 150 155 160
Tyr Gly Trp Leu Val Gly Glu Leu Leu Arg Arg Ala Asp Gly Arg Gly
165 170 175
Pro Gly Glu Ser Ile Val Ala Arg Val Ala Arg Pro Leu Gly Leu Asp
180 185 190
Phe His Val Gly Leu Ala Asp Glu Glu Phe Tyr Arg Val Ala His Ile
195 200 205
Ala Arg Ser Lys Gly Asn Met Gly Asp Glu Ala Ala Gln Arg Leu Leu
210 215 220
Gln Val Met Met Arg Glu Pro Thr Ala Met Thr Thr Arg Ala Phe Ala
225 230 235 240
Asn Pro Pro Ser Ile Leu Thr Ser Thr Asn Lys Pro Glu Trp Arg Arg
245 250 255
Met Gln Gln Pro Ala Ala Asn Gly His Gly Asn Ala Arg Ser Leu Ala
260 265 270
Gly Phe Tyr Ser Gly Leu Leu Asp Gly Ser Leu Leu Glu Ala Asp Met
275 280 285
Leu Glu Gln Leu Thr Arg Glu His Ser Ile Gly Pro Asp Lys Thr Leu
290 295 300
Leu Thr Gln Thr Arg Phe Gly Leu Gly Cys Met Leu Asp Gln Gln Pro
305 310 315 320
Gln Leu Pro Asn Ala Thr Phe Gly Leu Gly Pro Arg Ala Phe Gly His
325 330 335
Pro Arg Ser Ala Pro Val Val Arg Trp Val Leu Pro Glu His Asp Val
340 345 350
Ala Phe Gly Phe Val Thr Asn Thr Leu Gly Pro Tyr Val Leu Met Asp
355 360 365
Pro Arg Ala Gln Lys Leu Val Gly Ile Leu Ala Gly Cys Leu
370 375 380
<210> 27
<211> 402
<212> PRT
<213> 恶臭假单胞菌
<400> 27
Met Asn Gly Lys Ser Ser Val Leu Asp Ser Ala Pro Glu Tyr Val Asp
1 5 10 15
Lys Lys Lys Tyr Phe Trp Ile Leu Ser Thr Phe Trp Pro Ala Thr Pro
20 25 30
Met Ile Gly Ile Trp Leu Ala Asn Glu Thr Gly Trp Gly Ile Phe Tyr
35 40 45
Gly Leu Val Leu Ala Val Trp Tyr Gly Val Leu Pro Leu Leu Asp Ala
50 55 60
Met Phe Gly Glu Asp Phe Asn Asn Pro Pro Glu Glu Val Val Glu Lys
65 70 75 80
Leu Glu Lys Glu Arg Tyr Tyr Arg Val Leu Thr Tyr Leu Thr Val Pro
85 90 95
Met His Tyr Ala Ala Leu Ile Val Ser Ala Trp Trp Val Gly Thr Gln
100 105 110
Ser Met Ser Trp Phe Glu Ile Val Ala Leu Ala Leu Ser Leu Gly Ile
115 120 125
Val Asn Gly Leu Ala Leu Asn Thr Gly His Glu Leu Gly His Lys Lys
130 135 140
Glu Ala Phe Asp Arg Trp Met Ala Lys Ile Val Leu Ala Val Val Gly
145 150 155 160
Tyr Gly His Phe Phe Ile Glu His Asn Lys Gly His His Arg Asp Val
165 170 175
Ala Thr Pro Met Asp Pro Ala Thr Ser Arg Met Gly Glu Asn Ile Tyr
180 185 190
Lys Phe Ser Thr Arg Glu Ile Pro Gly Ala Phe Arg Arg Ala Trp Gly
195 200 205
Leu Glu Glu Gln Arg Leu Ser Arg Arg Gly Gln Ser Val Trp Ser Phe
210 215 220
Asp Asn Glu Ile Leu Gln Pro Met Val Ile Thr Val Val Leu Tyr Thr
225 230 235 240
Leu Leu Leu Ala Phe Phe Gly Pro Lys Met Leu Val Phe Leu Pro Ile
245 250 255
Gln Met Ala Phe Gly Trp Trp Gln Leu Thr Ser Ala Asn Tyr Ile Glu
260 265 270
His Tyr Gly Leu Leu Arg Glu Lys Met Ala Asp Gly Arg Tyr Glu His
275 280 285
Gln Lys Pro His His Ser Trp Asn Ser Asn His Ile Val Ser Asn Leu
290 295 300
Val Leu Phe His Leu Gln Arg His Ser Asp His His Ala His Pro Thr
305 310 315 320
Arg Ser Tyr Gln Ser Leu Arg Asp Phe Pro Gly Leu Pro Ala Leu Pro
325 330 335
Thr Gly Tyr Pro Gly Ala Phe Leu Met Ala Met Ile Pro Gln Trp Phe
340 345 350
Arg Ser Val Met Asp Pro Lys Val Val Asn Trp Ala Asn Gly Asp Leu
355 360 365
Ser Lys Ile Gln Ile Glu Asp Ser Met Arg Ala Glu Tyr Ile Lys Lys
370 375 380
Phe Thr His Asn Val Gly Ala Asp Asp Lys Arg Gly Ala Thr Ala Val
385 390 395 400
Ala Ser
<210> 28
<211> 523
<212> PRT
<213> 麦芽糖假丝酵母
<400> 28
Met Ala Ile Glu Gln Ile Ile Glu Glu Val Leu Pro Tyr Leu Thr Lys
1 5 10 15
Trp Tyr Thr Ile Leu Phe Gly Ala Ala Val Thr Tyr Phe Leu Ser Ile
20 25 30
Ala Leu Arg Asn Lys Phe Tyr Glu Tyr Lys Leu Lys Cys Glu Asn Pro
35 40 45
Val Tyr Phe Glu Asp Ala Gly Leu Phe Gly Ile Pro Ala Leu Ile Asp
50 55 60
Ile Ile Lys Val Arg Lys Ala Gly Gln Leu Ala Asp Tyr Thr Asp Thr
65 70 75 80
Thr Phe Asp Lys Tyr Pro Asn Leu Ser Ser Tyr Met Thr Val Ala Gly
85 90 95
Val Leu Lys Ile Val Phe Thr Val Asp Pro Glu Asn Ile Lys Ala Val
100 105 110
Leu Ala Thr Gln Phe Asn Asp Phe Ala Leu Gly Ala Arg His Ala His
115 120 125
Phe Asp Pro Leu Leu Gly Asp Gly Ile Phe Thr Leu Asp Gly Glu Gly
130 135 140
Trp Lys Leu Ser Arg Ala Met Leu Arg Pro Gln Phe Ala Arg Glu Gln
145 150 155 160
Ile Ala His Val Lys Ala Leu Glu Pro His Val Gln Ile Leu Ala Lys
165 170 175
Gln Ile Lys Leu Asn Lys Gly Lys Thr Phe Asp Leu Gln Glu Leu Phe
180 185 190
Phe Arg Phe Thr Val Asp Thr Ala Thr Glu Phe Leu Phe Gly Glu Ser
195 200 205
Val His Ser Leu Tyr Asp Glu Lys Leu Gly Ile Pro Ala Pro Asn Asp
210 215 220
Ile Pro Gly Arg Glu Asn Phe Ala Glu Ala Phe Asn Thr Ser Gln His
225 230 235 240
Tyr Leu Ala Thr Arg Thr Tyr Ser Gln Ile Phe Tyr Trp Leu Thr Asn
245 250 255
Pro Lys Glu Phe Arg Asp Cys Asn Ala Lys Val His Lys Leu Ala Gln
260 265 270
Tyr Phe Val Asn Thr Ala Leu Asn Ala Thr Glu Lys Glu Val Glu Glu
275 280 285
Lys Ser Lys Gly Gly Tyr Val Phe Leu Tyr Glu Leu Val Lys Gln Thr
290 295 300
Arg Asp Pro Lys Val Leu Gln Asp Gln Leu Leu Asn Ile Met Val Ala
305 310 315 320
Gly Arg Asp Thr Thr Ala Gly Leu Leu Ser Phe Ala Met Phe Glu Leu
325 330 335
Ala Arg Asn Pro Lys Ile Trp Asn Lys Leu Arg Glu Glu Val Glu Val
340 345 350
Asn Phe Gly Leu Gly Asp Glu Ala Arg Val Asp Glu Ile Ser Phe Glu
355 360 365
Thr Leu Lys Lys Cys Glu Tyr Leu Lys Ala Val Leu Asn Glu Thr Leu
370 375 380
Arg Met Tyr Pro Ser Val Pro Ile Asn Phe Arg Thr Ala Thr Arg Asp
385 390 395 400
Thr Thr Leu Pro Arg Gly Gly Gly Lys Asp Gly Asn Ser Pro Ile Phe
405 410 415
Val Pro Lys Gly Ser Ser Val Val Tyr Ser Val Tyr Lys Thr His Arg
420 425 430
Leu Lys Gln Phe Tyr Gly Glu Asp Ala Tyr Glu Phe Arg Pro Glu Arg
435 440 445
Trp Phe Glu Pro Ser Thr Arg Lys Leu Gly Trp Ala Tyr Leu Pro Phe
450 455 460
Asn Gly Gly Pro Arg Ile Cys Leu Gly Gln Gln Phe Ala Leu Thr Glu
465 470 475 480
Ala Ser Tyr Val Ile Ala Arg Leu Ala Gln Met Phe Glu His Leu Glu
485 490 495
Ser Lys Asp Glu Thr Tyr Pro Pro Asn Lys Cys Ile His Leu Thr Met
500 505 510
Asn His Asn Glu Gly Val Phe Ile Ser Ala Lys
515 520
<210> 29
<211> 464
<212> PRT
<213> 肠沙门氏菌肠亚种鼠伤寒血清型
<400> 29
Met Asn Thr Ser Glu Leu Glu Thr Leu Ile Arg Thr Ile Leu Ser Glu
1 5 10 15
Gln Leu Thr Thr Pro Ala Gln Thr Pro Val Gln Pro Gln Gly Lys Gly
20 25 30
Ile Phe Gln Ser Val Ser Glu Ala Ile Asp Ala Ala His Gln Ala Phe
35 40 45
Leu Arg Tyr Gln Gln Cys Pro Leu Lys Thr Arg Ser Ala Ile Ile Ser
50 55 60
Ala Met Arg Gln Glu Leu Thr Pro Leu Leu Ala Pro Leu Ala Glu Glu
65 70 75 80
Ser Ala Asn Glu Thr Gly Met Gly Asn Lys Glu Asp Lys Phe Leu Lys
85 90 95
Asn Lys Ala Ala Leu Asp Asn Thr Pro Gly Val Glu Asp Leu Thr Thr
100 105 110
Thr Ala Leu Thr Gly Asp Gly Gly Met Val Leu Phe Glu Tyr Ser Pro
115 120 125
Phe Gly Val Ile Gly Ser Val Ala Pro Ser Thr Asn Pro Thr Glu Thr
130 135 140
Ile Ile Asn Asn Ser Ile Ser Met Leu Ala Ala Gly Asn Ser Ile Tyr
145 150 155 160
Phe Ser Pro His Pro Gly Ala Lys Lys Val Ser Leu Lys Leu Ile Ser
165 170 175
Leu Ile Glu Glu Ile Ala Phe Arg Cys Cys Gly Ile Arg Asn Leu Val
180 185 190
Val Thr Val Ala Glu Pro Thr Phe Glu Ala Thr Gln Gln Met Met Ala
195 200 205
His Pro Arg Ile Ala Val Leu Ala Ile Thr Gly Gly Pro Gly Ile Val
210 215 220
Ala Met Gly Met Lys Ser Gly Lys Lys Val Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Cys Ile Val Asp Glu Thr Ala Asp Leu Val Lys Ala Ala
245 250 255
Glu Asp Ile Ile Asn Gly Ala Ser Phe Asp Tyr Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Ser Leu Ile Val Val Glu Ser Val Ala Glu Arg Leu Val
275 280 285
Gln Gln Met Gln Thr Phe Gly Ala Leu Leu Leu Ser Pro Ala Asp Thr
290 295 300
Asp Lys Leu Arg Ala Val Cys Leu Pro Glu Gly Gln Ala Asn Lys Lys
305 310 315 320
Leu Val Gly Lys Ser Pro Ser Ala Met Leu Glu Ala Ala Gly Ile Ala
325 330 335
Val Pro Ala Lys Ala Pro Arg Leu Leu Ile Ala Leu Val Asn Ala Asp
340 345 350
Asp Pro Trp Val Thr Ser Glu Gln Leu Met Pro Met Leu Pro Val Val
355 360 365
Lys Val Ser Asp Phe Asp Ser Ala Leu Ala Leu Ala Leu Lys Val Glu
370 375 380
Glu Gly Leu His His Thr Ala Ile Met His Ser Gln Asn Val Ser Arg
385 390 395 400
Leu Asn Leu Ala Ala Arg Thr Leu Gln Thr Ser Ile Phe Val Lys Asn
405 410 415
Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Thr
420 425 430
Phe Thr Ile Ala Thr Pro Thr Gly Glu Gly Thr Thr Ser Ala Arg Thr
435 440 445
Phe Ala Arg Ser Arg Arg Cys Val Leu Thr Asn Gly Phe Ser Ile Arg
450 455 460
<210> 30
<211> 471
<212> PRT
<213> 少动鞘氨醇单胞菌
<400> 30
Met Ser Thr Pro Thr Asn Leu Glu Gln Val Leu Ala Ala Gly Gly Asn
1 5 10 15
Thr Val Glu Met Leu Arg Asn Ser Gln Ile Gly Ala Tyr Val Tyr Pro
20 25 30
Val Val Ala Pro Glu Phe Ser Asn Trp Arg Thr Glu Gln Trp Ala Trp
35 40 45
Arg Asn Ser Ala Val Leu Phe Asp Gln Thr His His Met Val Asp Leu
50 55 60
Tyr Ile Arg Gly Lys Asp Ala Leu Lys Leu Leu Ser Asp Thr Met Ile
65 70 75 80
Asn Ser Pro Lys Gly Trp Glu Pro Asn Lys Ala Lys Gln Tyr Val Pro
85 90 95
Val Thr Pro Tyr Gly His Val Ile Gly Asp Gly Ile Ile Phe Tyr Leu
100 105 110
Ala Glu Glu Glu Phe Val Tyr Val Gly Arg Ala Pro Ala Ala Asn Trp
115 120 125
Leu Met Tyr His Ala Gln Thr Gly Gly Tyr Asn Val Asp Ile Val His
130 135 140
Asp Asp Arg Ser Pro Ser Arg Pro Met Gly Lys Pro Val Gln Arg Ile
145 150 155 160
Ser Trp Arg Phe Gln Ile Gln Gly Pro Lys Ala Trp Asp Val Ile Glu
165 170 175
Lys Leu His Gly Gly Thr Leu Glu Lys Leu Lys Phe Phe Asn Met Ala
180 185 190
Glu Met Asn Ile Ala Gly Met Lys Ile Arg Thr Leu Arg His Gly Met
195 200 205
Ala Gly Ala Pro Gly Leu Glu Ile Trp Gly Pro Tyr Glu Thr Gln Glu
210 215 220
Lys Ala Arg Asn Ala Ile Leu Glu Ala Gly Lys Glu Phe Gly Leu Ile
225 230 235 240
Pro Val Gly Ser Arg Ala Tyr Pro Ser Asn Thr Leu Glu Ser Gly Trp
245 250 255
Ile Pro Ser Pro Leu Pro Ala Ile Tyr Thr Gly Asp Lys Leu Lys Ala
260 265 270
Tyr Arg Glu Trp Leu Pro Ala Asn Ser Tyr Glu Ala Ser Gly Ala Ile
275 280 285
Gly Gly Ser Phe Val Ser Ser Asn Ile Glu Asp Tyr Tyr Val Asn Pro
290 295 300
Tyr Glu Ile Gly Tyr Gly Pro Phe Val Lys Phe Asp His Asp Phe Ile
305 310 315 320
Gly Arg Asp Ala Leu Glu Ala Ile Asp Pro Ala Thr Gln Arg Lys Lys
325 330 335
Val Thr Leu Ala Trp Asn Gly Asp Asp Met Ala Lys Ile Tyr Ala Ser
340 345 350
Leu Phe Asp Thr Glu Ala Asp Ala His Tyr Lys Phe Phe Asp Leu Pro
355 360 365
Leu Ala Asn Tyr Ala Asn Thr Asn Ala Asp Ala Val Leu Asp Ala Ala
370 375 380
Gly Asn Val Val Gly Met Ser Met Phe Thr Gly Tyr Ser Tyr Asn Glu
385 390 395 400
Lys Arg Ala Leu Ser Leu Ala Thr Ile Asp His Glu Ile Pro Val Gly
405 410 415
Thr Glu Leu Thr Val Leu Trp Gly Glu Glu Asn Gly Gly Thr Arg Lys
420 425 430
Thr Thr Val Glu Pro His Lys Gln Met Ala Val Arg Ala Val Val Ser
435 440 445
Pro Val Pro Tyr Ser Val Thr Ala Arg Glu Thr Tyr Glu Gly Gly Trp
450 455 460
Arg Lys Ala Ala Val Thr Ala
465 470
<210> 31
<211> 462
<212> PRT
<213> 少动鞘氨醇单胞菌
<400> 31
Met Ala Lys Ser Leu Gln Asp Val Leu Asp Asn Ala Gly Asn Ala Val
1 5 10 15
Asp Phe Leu Arg Asn Gln Gln Thr Gly Pro Asn Val Tyr Pro Gly Val
20 25 30
Pro Ala Glu Tyr Ser Asn Trp Arg Asn Glu Gln Arg Ala Trp Ala Lys
35 40 45
Thr Ala Val Leu Phe Asn Gln Ser Tyr His Met Val Glu Leu Met Val
50 55 60
Glu Gly Pro Asp Ala Phe Ala Phe Leu Asn Tyr Leu Gly Ile Asn Ser
65 70 75 80
Phe Lys Asn Phe Ala Pro Gly Lys Ala Lys Gln Trp Val Pro Val Thr
85 90 95
Ala Glu Gly Tyr Val Ile Gly Asp Val Ile Leu Phe Tyr Leu Ala Glu
100 105 110
Asn Gln Phe Asn Leu Val Gly Arg Ala Pro Ala Ile Glu Trp Ala Glu
115 120 125
Phe His Ala Ala Thr Gly Lys Trp Asn Val Thr Leu Thr Arg Asp Glu
130 135 140
Arg Thr Ala Leu Arg Thr Asp Gly Val Arg Arg His Tyr Arg Phe Gln
145 150 155 160
Leu Gln Gly Pro Asn Ala Met Ala Ile Leu Thr Asp Ala Met Gly Gln
165 170 175
Thr Pro Pro Asp Leu Lys Phe Phe Asn Met Ala Asp Ile Gln Ile Ala
180 185 190
Gly Lys Thr Val Gly Ala Leu Arg His Gly Met Ala Gly Gln Pro Gly
195 200 205
Tyr Glu Leu Tyr Gly Pro Trp Ala Asp Tyr Glu Ala Val His Ser Ala
210 215 220
Leu Val Ala Ala Gly Lys Asn His Gly Leu Ala Leu Val Gly Gly Arg
225 230 235 240
Ala Tyr Ser Ser Asn Thr Leu Glu Ser Gly Trp Val Pro Ser Pro Phe
245 250 255
Pro Gly Tyr Leu Phe Gly Glu Gly Ser Ala Asp Phe Arg Lys Trp Ala
260 265 270
Gly Glu Asn Ser Tyr Gly Ala Lys Cys Ser Ile Gly Gly Ser Tyr Val
275 280 285
Pro Glu Ser Leu Glu Gly Tyr Gly Leu Thr Pro Trp Asp Ile Gly Tyr
290 295 300
Gly Ile Ile Val Lys Phe Asp His Asp Phe Ile Gly Lys Glu Ala Leu
305 310 315 320
Glu Lys Met Ala Asn Glu Pro His Leu Glu Lys Val Thr Leu Ala Leu
325 330 335
Asp Asp Glu Asp Met Leu Arg Val Met Ser Ser Tyr Phe Ser Asp Ser
340 345 350
Gly Arg Ala Lys Tyr Phe Glu Phe Pro Ser Ala Val Tyr Ser Met His
355 360 365
Pro Tyr Asp Ser Val Leu Val Asp Gly Lys His Val Gly Val Ser Thr
370 375 380
Trp Val Gly Tyr Ser Ser Asn Glu Gly Lys Met Leu Thr Leu Ala Met
385 390 395 400
Ile Asp Pro Lys Tyr Ala Lys Pro Gly Thr Glu Val Ser Leu Leu Trp
405 410 415
Gly Glu Pro Asn Gly Gly Thr Ser Lys Pro Thr Val Glu Pro His Glu
420 425 430
Gln Thr Glu Ile Lys Ala Val Val Ala Pro Val Pro Tyr Ser Ala Val
435 440 445
Ala Arg Thr Gly Tyr Ala Asp Ser Trp Arg Thr Lys Lys Ala
450 455 460
<210> 32
<211> 246
<212> PRT
<213> 短乳杆菌
<400> 32
Met Ala Ala Asn Glu Phe Ser Glu Thr His Arg Val Val Tyr Tyr Glu
1 5 10 15
Ala Asp Asp Thr Gly Gln Leu Thr Leu Ala Met Leu Ile Asn Leu Phe
20 25 30
Val Leu Val Ser Glu Asp Gln Asn Asp Ala Leu Gly Leu Ser Thr Ala
35 40 45
Phe Val Gln Ser His Gly Val Gly Trp Val Val Thr Gln Tyr His Leu
50 55 60
His Ile Asp Glu Leu Pro Arg Thr Gly Ala Gln Val Thr Ile Lys Thr
65 70 75 80
Arg Ala Thr Ala Tyr Asn Arg Tyr Phe Ala Tyr Arg Glu Tyr Trp Leu
85 90 95
Leu Asp Asp Ala Gly Gln Val Leu Ala Tyr Gly Glu Gly Ile Trp Val
100 105 110
Thr Met Ser Tyr Ala Thr Arg Lys Ile Thr Thr Ile Pro Ala Glu Val
115 120 125
Met Ala Pro Tyr His Ser Glu Glu Gln Thr Arg Leu Pro Arg Leu Pro
130 135 140
Arg Pro Asp His Phe Asp Glu Ala Val Asn Gln Thr Leu Lys Pro Tyr
145 150 155 160
Thr Val Arg Tyr Phe Asp Ile Asp Gly Asn Gly His Val Asn Asn Ala
165 170 175
His Tyr Phe Asp Trp Met Leu Asp Val Leu Pro Ala Thr Phe Leu Arg
180 185 190
Ala His His Pro Thr Asp Val Lys Ile Arg Phe Glu Asn Glu Val Gln
195 200 205
Tyr Gly His Gln Val Thr Ser Glu Leu Ser Gln Ala Ala Ala Leu Thr
210 215 220
Thr Gln His Met Ile Lys Val Gly Asp Leu Thr Ala Val Lys Ala Thr
225 230 235 240
Ile Gln Trp Asp Asn Arg
245
<210> 33
<211> 261
<212> PRT
<213> 植物乳杆菌
<400> 33
Met Ala Thr Leu Gly Ala Asn Ala Ser Leu Tyr Ser Glu Gln His Arg
1 5 10 15
Ile Thr Tyr Tyr Glu Cys Asp Arg Thr Gly Arg Ala Thr Leu Thr Thr
20 25 30
Leu Ile Asp Ile Ala Val Leu Ala Ser Glu Asp Gln Ser Asp Ala Leu
35 40 45
Gly Leu Thr Thr Glu Met Val Gln Ser His Gly Val Gly Trp Val Val
50 55 60
Thr Gln Tyr Ala Ile Asp Ile Thr Arg Met Pro Arg Gln Asp Glu Val
65 70 75 80
Val Thr Ile Ala Val Arg Gly Ser Ala Tyr Asn Pro Tyr Phe Ala Tyr
85 90 95
Arg Glu Phe Trp Ile Arg Asp Ala Asp Gly Gln Gln Leu Ala Tyr Ile
100 105 110
Thr Ser Ile Trp Val Met Met Ser Gln Thr Thr Arg Arg Ile Val Lys
115 120 125
Ile Leu Pro Glu Leu Val Ala Pro Tyr Gln Ser Glu Val Val Lys Arg
130 135 140
Ile Pro Arg Leu Pro Arg Pro Ile Ser Phe Glu Ala Thr Asp Thr Thr
145 150 155 160
Ile Thr Lys Pro Tyr His Val Arg Phe Phe Asp Ile Asp Pro Asn Arg
165 170 175
His Val Asn Asn Ala His Tyr Phe Asp Trp Leu Val Asp Thr Leu Pro
180 185 190
Ala Thr Phe Leu Leu Gln His Asp Leu Val His Val Asp Val Arg Tyr
195 200 205
Glu Asn Glu Val Lys Tyr Gly Gln Thr Val Thr Ala His Ala Asn Ile
210 215 220
Leu Pro Ser Glu Val Ala Asp Gln Val Thr Thr Ser His Leu Ile Glu
225 230 235 240
Val Asp Asp Glu Lys Cys Cys Glu Val Thr Ile Gln Trp Arg Thr Leu
245 250 255
Pro Glu Pro Ile Gln
260