通过氧化切割从长链脂肪酸生产6‑碳化学物的方法与流程

文档序号:12070539阅读:527来源:国知局
通过氧化切割从长链脂肪酸生产6‑碳化学物的方法与流程

本申请要求2014年5月13日提交的美国临时申请系列号61/992,794的优先权,其公开通过引用以其整体并入本文。

技术领域

本文公开了从十二酰-[acp]生物合成己二酰-[acp]和己酸的方法和从辛酰-[acp]生物合成己二酰-[acp]的方法。使用具有庚二酰-[acp]合酶活性的多肽和例如具有醛脱氢酶活性的多肽,如在表达一种或多种此类多肽的重组宿主细胞中生物合成该产物。本文还公开了使用具有脱氢酶,还原酶,单加氧酶,转氨酶,N-乙酰转移酶,脱酰基酶或硫酯酶活性的一种或多种分离的多肽,或使用表达一种或多种此类多肽的重组宿主细胞将己二酰-[acp]和/或己酸转化为C6单体,如己二酸,6-氨基己酸,六亚甲基二胺,6-羟基己酸,己内酰胺或1,6-己二醇(下文称为“C6结构单元”(buiding blocks))的方法。

发明背景

尼龙是聚酰胺,其有时通过二胺与二羧酸的缩聚(condensation polymerization)合成。类似地,尼龙可通过内酰胺的缩聚生成。一种普遍存在的尼龙是尼龙6,6,其通过六亚甲基二胺(HMD)和己二酸的反应生成。尼龙6可通过己内酰胺的开环聚合生成。因此,己二酸,六亚甲基二胺和己内酰胺是尼龙的生产中的重要中间体(Anton&Baird,Polyamides Fibers,Encyclopedia of Polymer Science and Technology,2001)。

工业上,己二酸和己内酰胺通过环己烷的空气氧化生产。环己烷的空气氧化在一系列的步骤中产生环己酮(K)和环己醇(A)的混合物,命名为KA油。KA油的硝酸氧化产生己二酸(Musser,Adipic acid,Ullmann’s Encyclopedia of Industrial Chemistry,2000)。己内酰胺由环己酮经它的肟重排和随后的酸重排制备(Fuchs,Kieczka and Moran,Caprolactam,Ullmann’s Encyclopedia of Industrial Chemistry,2000)。

工业上,通过将C6结构单元氢氰化成己二腈,然后氢化成HMD来制备六亚甲基二胺(HMD)(Herzog and Smiley,Hexamethylenediamine,Ullmann’s Encyclopedia of Industrial Chemistry,2012)。

鉴于对石油化学原料的依赖;生物技术提供了通过生物催化的替代方法。生物催化是使用生物催化剂如酶来进行有机化合物的生物化学转化。

生物衍生的原料和石油化工原料两者都是生物催化工艺的可行起始材料。

因而,针对此背景,明显的是需要用于生产己二酸、己内酰胺、6-氨基己酸、6-羟基己酸、六亚甲基二胺和1,6-己二醇(下文称为“C6结构单元”)的可持续的方法,其中所述方法是基于生物催化的(Jang等,Biotechnol.Bioeng.,2012,109(10),2437–2459)。

然而,无野生型的原核生物或真核生物天然地过度生产或分泌C6结构单元到细胞外环境。但是,己二酸和己内酰胺的代谢已有报道(Ramsay等,Appl.Environ.Microbiol.,1986,52(1),152–156;以及Kulkarni和Kanekar,Current Microbiology,1998,37,191–194)。

一些细菌和酵母将二羧酸,己二酸作为碳源通过β-氧化高效转化为中心代谢产物。CoA己二酸至3-氧代己二酸的β-氧化促进经由与例如芳香族底物降解相关的邻位裂解途径的。由几种细菌和真菌将3-氧代己二酰-CoA转化为乙酰-CoA和琥珀酰-CoA的分解代谢已经全面表征(Harwood和Parales,Annual Review of Microbiology,1996,50,553–590)。己二酸和6-氨基己酸都是己内酰胺的分解代谢中的中间物,最终经3-氧代己二酰-CoA降解为中心代谢产物。

已经提出了由生物质-糖生产己二酸的潜在的代谢途径:(1)以生物化学的方式通过邻位裂解芳香族降解途径从葡萄糖转化成顺式,顺式-粘康酸,然后化学催化成己二酸;(2)通过琥珀酰-CoA和乙酰-CoA的缩合的可逆己二酸降解途径和(3)组合β-氧化、脂肪酸合成酶和ω-氧化。然而,没有报道过使用这些策略的信息(Jang等,Biotechnology&Bioengineering,2012,109(10),2437–2459)。

最优性原理指出,微生物调节它们的生物化学网络来支持最大生物质(biomass)生长。超出在宿主生物体中表达异源性途径的需要,将碳通量引导至充当碳源的C6结构单元而非生物质生长组分与最优性原理矛盾。例如,将1-丁醇途径从梭菌属物种转移至其它生产菌株中,其与天然生产者(native producer)的生产性能相比,经常缺乏一个数量级(Shen等,Appl.Environ.Microbiol.,2011,77(9),2905–2915)。

在C6脂族主链上形成末端官能团如羧基、胺或者羟基之前,作为中心前体的六碳脂族主链的高效合成是合成C6结构单元中的关键考虑因素。

发明简述

本申请至少部分地基于以下发现:可构建用于生产六碳链式脂族主链前体的生物化学途径,在其中可形成一个或两个官能团,即羧基、胺或者羟基,导致以下一种或者多种物质的合成:己二酸、6-氨基己酸、六亚甲基二胺、6-羟基己酸、己内酰胺或1,6-己二醇(下文称为“C6结构单元”)。己二酸和己二酸盐(酯),乙酸和乙酸盐(酯),6-羟基己酸和6-羟基己酸盐(酯),6-氨基己酸和6-氨基己酸盐(酯)在本文中可替换使用,指代以其任意中性或离子化形式的化合物,包括其任意的盐形式。本领域的技术人员应当理解具体的形式将依赖于pH。本文描述的这些途径、代谢工程和培养策略依赖于脂肪酸合成酶或类似酶或和多肽,其具有接受C8或C12酰基-[acp]底物并氧化切割所述底物的C6和C7碳之间的C-C键的能力,以在当辛酰基-[acp]是底物时产生6-氧己酰-[acp]和乙醛或当十二酰基-[acp]是底物时产生6-氧己酰-[acp]和己醛。具有接受C8或C12酰基-[acp]底物并氧化切割所述底物的C6和C7碳之间的C-C键的能力的多肽(本文称为庚二酰-[acp]合酶)可以与由来自枯草芽孢杆菌(bacillus subtilis)的bioI编码的野生型庚二酰-[acp]合酶具有至少70%的序列同一性。野生型庚二酰-[acp]合酶通常氧化切割酰基-[acp]底物的C7和C8碳之间的C-C键。

面对最优性原理,令人惊讶地发现,可将适当的非天然途径、原料、宿主微生物、对宿主的生物化学网络的弱化策略和培养策略组合起来,从而高效地生产一种或多种C6结构单元。

在一些实施方案中,用于转化为C6结构单元的C6脂族主链可以从脂肪酸合成中产生的十二酰基-[acp]或辛酰基-[acp]形成。见图1。

在一些实施方案中,可以使用具有硫酯酶活性的多肽或具有醛脱氢酶活性的多肽酶促形成末端羧基。见图2。

在一些实施方案中,可以使用具有ω-转氨酶活性的多肽或具有二胺转氨酶活性的多肽酶促形成末端胺基。见图3,图4,图5和图6。与己内酰胺相关的酰胺键是首先在直链碳链上具有末端羧基和末端胺基以形成键的结果。

在一些实施方案中,可以使用具有烷烃1-单加氧酶活性或具有醇脱氢酶活性的多肽酶促形成末端羟基。见图7和图8。

在一个方面,本申请特征在于在重组宿主中生物合成己二酰-[acp]的方法。所述方法包括使用具有庚二酰-[acp]合酶活性的多肽在宿主中将十二酰基-[acp]酶转化为己二酰-[acp]和己酸,其中具有庚二酰-[acp]合酶活性的多肽接受十二酰基-[acp]作为底物并氧化切割底物的C6和C7碳之间的C-C键;或使用具有庚二酰-[acp]合酶活性的多肽在宿主中将辛酰基-[acp]酶促转化成己二酰-[acp]和乙酸,其中具有庚二酰-[acp]合酶活性的多肽接受辛酰基-[acp]并氧化切割底物的C6和C7碳之间的C-C键。具有庚二酰-[acp]合酶活性的多肽可以与SEQ ID NO:23所示的氨基酸序列具有至少70%,至少80%或至少90%的序列同一性。该方法可以包括使用具有醛脱氢酶活性的多肽以将具有庚二酰-[acp]合酶活性的多肽的切割产物转化为(i)己二酰-[acp]和己酸或(ii)己二酰-[acp]和乙酸酯。具有醛脱氢酶活性的多肽可以分类在EC 1.2.1.4或EC 1.2.1.3下。

本文公开的方法还可以包括使用至少一种具有选自醛脱氢酶,烷烃1-单加氧酶,硫酯酶,ω-转氨酶,羧酸还原酶,N-酰基转移酶,脱酰基酶,和醇脱氢酶的活性的多肽,酶促转化己二酰-[acp]或己酸为选自下组的产物:己酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺和1,6-己二醇。

例如,该方法进一步可以包括使用具有硫酯酶活性的多肽将己二酰-[acp]酶促转化为己二酸。具有硫酯酶活性的多肽可以与SEQ ID NO:1或SEQ ID NO:2中列出的氨基酸序列具有至少70%的序列同一性。

例如,本文所述的任何方法还可以包括使用至少一种具有选自(i)烷烃1-单加氧酶;(ii)醇脱氢酶;和(iii)醛脱氢酶的活性的多肽,将己酸酶促转化为己二酸。具有醛脱氢酶活性的多肽可以分类在EC 1.2.1.3,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79下和/或具有醇脱氢酶活性的多肽可以分类在EC 1.1.1.2或EC 1.1.1.258下。

例如,本文所述的任何方法还可以包括使用至少一种具有选自下组活性的多肽将己酸酶促转化成6-氨基己酸:(i)烷烃1-单加氧酶;(ii)醇脱氢酶;和(iii)ω-转氨酶。

例如,本文所述的任何方法还可以包括使用至少一种具有选自以下的活性的多肽将己二酸酶促转化为6-氨基己酸:(i)羧酸还原酶;和(ii)ω-转氨酶。

例如,本文所述的任何方法还可以包括使用至少一种具有选自以下的活性的多肽将己二酸或6-氨基己酸酶促转化为六亚甲基二胺:(i)羧酸还原酶;和(ii)ω-转氨酶。

例如,本文所述的任何方法还可以包括使用至少一种具有选自以下的活性的多肽将6-氨基己酸酶促转化为六亚甲基二胺:(i)N-乙酰转移酶;(ii)羧酸还原酶;(iii)ω-转氨酶;和(iv)脱酰基酶。

例如,本文所述的任何方法还可以包括使用具有烷烃1-单加氧酶活性的多肽将己酸酶促转化成6-羟基己酸。具有烷烃1-单加氧酶活性的多肽可以与SEQ ID NO:16-18中任一项所示的氨基酸序列具有至少70%的序列同一性。

例如,本文所述的任何方法还可以包括使用至少一种具有选自下组的活性的多肽将己二酸酶促转化为6-羟基己酸:(i)羧酸还原酶;和(ii)醇脱氢酶。

例如,本文所述的任何方法还可以包括使用至少一种具有选自下组的活性的多肽将6-羟基己酸酶促转化为六亚甲基二胺:(i)羧酸还原酶;(ii)ω-转氨酶;和(iii)醇脱氢酶。

例如,本文所述的任何方法还可以包括使用至少一种具有选自下组的活性的多肽将6-羟基己酸酶促转化为1,6-己二醇:(i)羧酸还原酶和(ii)醇脱氢酶。

例如,本文所述的任何方法还可以包括使用具有羧酸还原酶活性的多肽将己二酸酶促转化为己二酸半醛。

例如,本文所述的任何方法还可以包括使用具有醇脱氢酶活性的多肽将6-羟基己酸酶促转化为己二酸半醛。

例如,本文所述的任何方法还可包括使用至少一种具有选自(i)羧酸还原酶和(ii)转氨酶的活性的多肽将己二酸半醛酶促转化为六亚甲基二胺。

在任何所述方法中,具有羧酸还原酶活性的多肽可以与SEQ ID NO:3-7中中任一项所示的氨基酸序列具有至少70%的序列同一性,或者具有ω-转氨酶活性的多肽可以具有与SEQ ID NO:8-13中中任一项所示的氨基酸序列具有至少70%的序列同一性。

在一些是实施方案中,生物原料可以是或源自单糖,二糖,木质纤维素、半纤维素、纤维素、木质素、乙酰丙酸和甲酸、甘油三酯、甘油、脂肪酸、农业废物、浓缩酒糟(condensed distillers'solubles)或城市废物。

在一些实施方案中,非生物原料可以是或可以源自天然气、合成气、CO2/H2、甲醇、乙醇、苯甲酸盐(酯)、非挥发性残留物(NVR)或来自环己烷氧化过程的碱洗液(caustic wash)废物流、或对苯二甲酸/异酞酸混合物废物流。

本文所述途径的反应可以在一种或多种细胞(例如宿主细胞)株中进行,所述细胞株(a)天然表达一种或多种相关酶,(b)经遗传工程化而表达一种或多种相关酶,或(c)天然表达一种或多种相关酶并经遗传工程化而表达一种或多种相关酶。或者,可以从以上任意类型的宿主细胞中提取相关酶,并以纯化或半纯化形式使用。提取的酶可选地固定在固体基质上,例如适合的反应容器的底和/或壁。此外,这些提取物包括可以作为相关酶来源使用的裂解物(如细胞裂解物)。在本申请提供的方法中,所有步骤可以在细胞(例如宿主细胞)中进行,所有步骤可以使用提取的酶进行,或一些步骤可以在细胞中进行,而其它步骤可以使用提取的酶进行。

本文所述的多种酶催化可逆反应,并且感兴趣的反应可以是所述反应的反向。图1-8所示的示意性途径阐明了对于每种中间物感兴趣的反应。

在一些实施方案中,经由在选择性环境中的连续培养改善所述宿主对高浓度一种或多种C6结构单元的耐受性。

在一些实施方案中,弱化或增强所述宿主的内源性生物化学网络,来(1)保证乙酰-CoA和丙二酰-CoA的细胞内可用度,(2)创造NADH不平衡,其仅可通过脂肪酸合成和一种或多种C6结构单元的形成平衡,(3)阻止通向并包括C6结构单元的中心代谢物和中心前体的降解和(4)保证从细胞的高效流出。

在一些实施方案中,培养策略需要达到需氧或微氧的培养条件。

在一些实施方案中,培养策略需要经由氮,磷酸盐或氧限制的营养限制。

在一些实施方案中,培养策略需要防止脂肪酸掺入脂质体或其它碳储存单元中。

在一些实施方案中,使用例如发酵策略,通过单一类型的微生物,例如含有一种或多种外源核酸的重组宿主,产生一种或多种C6结构单元。

本申请的特征还在于包含至少一种编码具有庚二酰-[acp]合酶活性的多肽的外源核酸的重组宿主,所述宿主产生:(a)己二酰-[acp]和己酸,其中所述具有庚二酰-[acp]合酶活性的多肽接受十二酰基-[acp]作为底物并氧化切割底物的C6和C7碳之间的CC键;或[b]己二酰-[acp],其中具有庚二酰-[acp]合酶活性的多肽接受辛酰基-[acp]作为底物,并氧化切割底物的C6和C7碳之间的C-C键。具有庚二酰-[acp]合酶活性的多肽可以与SEQ ID NO:23所示的氨基酸序列具有至少70%,至少80%或至少90%的序列同一性。

宿主还可以包括具有醛脱氢酶活性的外源多肽。

宿主还可以包括一种或多种具有选自烷烃1-单加氧酶,硫酯酶,醇脱氢酶和醛脱氢酶的活性的外源多肽,所述宿主产生己二酸。

宿主还可以包括具有羧酸还原酶活性的外源多肽和具有ω-转氨酶活性的外源多肽,所述宿主产生6-氨基己酸。

产生6-氨基己酸的重组宿主还可以包括具有水解酶活性的外源多肽,所述宿主产生己内酰胺。

宿主还可以包括一种或多种具有选自烷烃1-单加氧酶,硫酯酶,羧酸还原酶和醇脱氢酶的活性的外源多肽,所述宿主产生6-羟基己酸。

宿主还可以包括至少一种具有选自烷烃1-单加氧酶,硫酯酶,羧酸还原酶和醇脱氢酶的活性的外源多肽,所述宿主产生己二酸半醛。宿主还可以包括至少一种具有ω-转氨酶活性的外源多肽,所述宿主产生六亚甲基二胺。

宿主还可以包括至少一种具有选自N-乙酰转移酶和脱酰基酶的活性的外源多肽,所述宿主产生六亚甲基二胺。

宿主可以包括(i)至少一种具有烷烃1-单加氧酶活性的外源多肽,至少一种具有醇脱氢酶活性的外源多肽,至少一种具有ω-转氨酶活性的外源多肽和至少一种具有羧酸还原酶活性的多肽或(ii)至少一种具有硫酯酶活性的外源多肽,至少一种具有羧酸还原酶活性的多肽和至少一种具有ω-转氨酶活性的外源多肽,宿主产生六亚甲基二胺。

宿主可以包括(i)至少一种具有羧酸还原酶活性的外源多肽,至少一种具有醇脱氢酶活性的外源多肽和至少一种具有烷烃1-单加氧酶活性的多肽,或(ii)至少一种具有羧酸还原酶活性的多肽,至少一种具有醇脱氢酶活性的外源多肽和至少一种具有硫酯酶活性的外源多肽,所述宿主产生1,6己二醇。

在任何方法或宿主中,具有硫酯酶活性的多肽可以与SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少70%的序列同一性。

在任何方法或宿主中,具有烷烃1-单加氧酶活性的多肽可以与SEQ ID NO:16-18中中任一项所示的氨基酸序列具有至少70%的序列同一性。

在任何方法或宿主中,具有羧酸还原酶活性的多肽与SEQ ID NO:3-7中中任一项所示的氨基酸序列具有至少70%的序列同一性。

在任何方法或宿主中,具有ω-转氨酶活性的多肽可以与SEQ ID NO:8-13中中任一项所示的氨基酸序列具有至少70%的序列同一性。

任何重组宿主可以是原核生物,如来自选自下组的属的原核生物:埃希氏菌属(Escherichia);梭菌属(Clostridia);棒状杆菌属(Corynebacteria);贪铜菌属(Cupriavidus);假单胞菌属(Pseudomonas);代尔夫特菌属(Delftia);芽孢杆菌属(Bacilluss);乳杆菌属(Lactobacillus);乳球菌属(Lactococcus);和红球菌属(Rhodococcus)。例如,所述原核生物可以选自下组:大肠杆菌(Escherichia coli)、杨氏梭菌(Clostridium ljungdahlii)、自产乙醇梭菌(Clostridium autoethanogenum)、克鲁佛梭菌(Clostridium kluyveri)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、钩虫贪铜菌(Cupriavidus necator)、耐金属贪铜菌(Cupriavidus metallidurans)、荧光假单胞菌(Pseudomonas fluorescens)、恶臭假单胞菌(Pseudomonas putida)、食油假单胞菌(Pseudomonas oleavorans)、食酸代尔夫特菌(Delftia acidovorans)、枯草芽胞杆菌(Bacillus subtillis)、德氏乳杆菌(Lactobacillus delbrueckii)、乳酸乳球菌(Lactococcus lactis)、和马红球菌(Rhodococcus equi)。此类原核生物也可以是构建能够生成C6结构单元的本文中描述的重组宿主细胞的基因来源。

任何宿主可以是真核生物,例如来自选自下组的属的真核生物:曲霉属(Aspergillus)、酵母属(Saccharomyces)、毕赤氏酵属(Pichia)、耶罗维亚酵母属(Yarrowia)、伊萨酵母属(Issatchenkia)、德巴利酵母属(Debaryomyces)、Arxula、和克鲁维酵母菌属(Kluyveromyces)。例如,所述真核生物可以选自下组:黑曲霉(Aspergillus niger)、酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕赤酵母(Pichia pastoris)、解脂耶罗维亚酵母(Yarrowia lipolytica)、东方伊萨酵母(Issathenkia orientalis)、汉逊德巴利酵母(Debaryomyces hansenii)、Arxula adenoinivorans、和乳酸克鲁维酵母菌(Kluyveromyces lactis)。此类真核生物也可以是构建能够生成C6结构单元的本文中描述的重组宿主细胞的基因来源。

本文所述任何宿主还可以包含一种或多种以下酶的弱化:聚羟基烷酸酯(polyhydroxyalkanoate)合酶,形成乙酸的磷酸乙酸转移酶,乙酸激酶,乳酸脱氢酶,形成乙醇的醇脱氢酶,丙糖磷酸异构酶,NADH消耗型转氢酶,NADH特异性谷氨酸脱氢酶,和NADH/NADPH利用型谷氨酸脱氢酶。

本文所述任何宿主还可以过表达编码以下的一种或多种基因:乙酰-CoA合成酶,6-磷酸葡萄糖酸脱氢酶;转酮醇酶;吡啶(puridine)核苷酸转氢酶;甘油醛-3P-脱氢酶;苹果酸酶;葡萄糖-6-磷酸脱氢酶;葡萄糖脱氢酶;果糖1,6二磷酸酶;L-丙氨酸脱氢酶;L-谷氨酸脱氢酶;甲酸脱氢酶;L-谷氨酰胺合成酶;二胺转运体;二羧酸转运体;和/或多药物转运体。

此外,本文描述了包含具有庚二酰-[acp]合酶活性的多肽和十二烷酰基-[acp]的生物化学网络,其中具有庚二酰-[acp]合酶活性的多肽将十二酰基-[acp]酶促转化为己醛或6-氧代己酰-[acp]。生物化学网络可以进一步包括具有醛脱氢酶活性的多肽,其中具有醛脱氢酶活性的多肽进一步将己醛和6-氧代己酰-[acp]分别转化成己酸和己二酰-[acp]。

此外,本文描述了包含具有庚二酰基-[acp]合酶活性的多肽和辛酰基-[acp]的生物化学网络,其中具有庚二酰基-[acp]合酶活性的多肽将辛酰基-[acp]酶促转化为乙醛和6-氧代己酰基-[acp]。生物化学网络可以进一步包括具有醛脱氢酶活性的多肽,其中具有醛脱氢酶活性的多肽进一步分别将乙醛和6-氧代己酰基-[acp]转化为乙酸和己二酰基-[acp]。

任何生物化学网络可进一步包括具有醛脱氢酶活性的多肽,具有单加氧化酶活性的多肽,具有硫酯酶活性的多肽,具有ω-转氨酶活性的多肽,具有羧酸还原酶活性的多肽,具有二胺转氨酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有赖氨酸N-乙酰转移酶活性,具有脱酰酶活性的多肽或具有醇脱氢酶多肽活性的多肽,其中所述具有醛脱氢酶活性的多肽,所述具有单加氧酶活性的多肽,所述具有硫酯酶活性德多肽,所述具有ω-转氨酶活性的多肽,所述具有羧酸还原酶活性的多肽,具有二胺转氨酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有赖氨酸N-乙酰转移酶活性的多肽,具有脱酰基酶活性的多肽或具有醇脱氢酶活性的多肽将己二酰-[acp]和/或己酸酶转化为己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种。

此外,本文描述了使用具有庚二酰基-[acp]合酶的多肽获得己醛和6-氧己酰基-[acp]的手段(means)。该手段还可以包括将己醛和6-氧己酰基-[acp]分别转化为己酸和己二酰-[acp]的手段。

此外,本文描述了使用具有庚二酰-[acp]合酶活性的多肽获得乙醛和6-氧己酰基-[acp]的手段。该手段还可以包括将乙醛和6-氧代己酰基-[acp]分别转化成乙酸和己二酰基-[acp]的手段。

所述方法可以包括使用具有醛脱氢酶活性的多肽。该方法还可以包括将己二酰-[acp]或己酸转化成己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种的手段。所述手段可以包括具有醛脱氢酶活性的多肽,具有单硫氧化酶活性的多肽,具有硫酯酶活性的多肽,具有ω-转氨酶活性的多肽,具有羧酸还原酶活性的多肽,具有二胺转氨酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有赖氨酸N-乙酰转移酶活性的多肽,具有脱酰基酶活性的多肽或具有醇脱氢酶活性的多肽

此外,本文描述的是使用具有庚二酰基-[acp]合酶活性的多肽获得己二酰-[acp]或己酸的步骤。

另一方面,本申请的特征在于包含己醛和6-氧代己酰基-[acp]和具有庚二酰基-[acp]合酶活性的多肽的组合物。另一方面,本申请的特征在于包含乙醛和6-氧代己酰基-[acp]和具有庚二酰基-[acp]合酶活性的多肽的组合物。

组合物可以是无细胞的或细胞的。所述组合物还可包括具有醛脱氢酶活性的多肽,具有单加氧酶活性的多肽,具有硫酯酶活性的多肽,具有ω-转氨酶活性的多肽,具有羧酸还原酶活性的多肽,具有二胺转氨酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有赖氨酸N-乙酰转移酶活性的多肽,具有脱酰基酶活性的多肽或具有醇脱氢酶活性的多肽和己二酸,6-氨基己酸,己内酰胺,六亚甲基二胺,6-羟基己酸和1,6-己二醇中的至少一种。

本申请还描述了用于生产生物衍生的己二酰-[acp],己酸,己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇的方法,其包括在条件下培养或生长本文所述的任何重组宿主足够的时间段以产生生物衍生的己二酰-[acp],己酸,己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇。

在另一方面,本文特征为包含生物衍生的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇的培养基,其中生物衍生的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇具有反映大气二氧化碳摄取来源的碳-12,碳-13和碳-14同位素比率。可以从重组宿主分离培养基。

本申请的特征还在于生物衍生的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇,其具有反映大气二氧化碳摄取源的碳-12,碳-13和碳-14同位素比率,优选通过生长本文所述的重组宿主生产。生物衍生的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇可具有至少80%,至少85%,至少90%,至少95%或至少98%的Fm值。

在另一方面,本申请特征在于组合物,其包含生物衍生的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇和不同于生物来源的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇的化合物。不同于生物衍生的己二酰-[acp],己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇的化合物可以是痕量的本文所述重组宿主的细胞部分。

本申请特征还在于包含本文所述的生物衍生的己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇的生物基聚合物(biobased polymer)以及通过模制(molding)生物基聚合物获得的模制产品。

本申请特征还在于了包含本文所述的生物衍生的己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇的生物基树脂以及通过模制生物基树脂获得的模制产品。

在另一方面,本申请的特征在于生产生物基聚合物的方法,其包括使生物衍生的己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇与其自身或另一种化合物在聚合物生成反应中起化学反应。

在另一方面,该文献的特征在于生产生物基树脂的方法,其包括使生物衍生的己二酸,己内酰胺,6-羟基己酸,6-氨基己酸,六亚甲基二胺或1,6-己二醇与其自身或另一种化合物在树脂生成反应中起化学反应。

除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管与本文所述的方法和材料类似或等同的方法和材料可用于实施本发明,但下文描述了合适的方法和材料。本文提及的所有出版物,专利申请,专利和其它参考文献通过引用以其整体并入。在冲突的情况下,以本说明书包括定义为准。此外,材料,方法和实施例仅仅是说明性的,而不是限制性的。

在附图和下面的描述中阐述了本发明的一个或多个实施例的细节。本发明的其它特征,目的和优点将从说明书和附图以及权利要求书中显而易见。根据专利法中的标准实践,权利要求中的词语“包括”可以被“基本上由...组成”或由“由...组成”替代。

附图简述

图1是使用十二酰基-[acp]作为示例性长链脂肪酸中心代谢物导致己二酰-[acp]和己酸的示例性生物化学途径的示意图,以及使用辛酰基-[acp]作为示例性长链脂肪酸中心代谢物导致己二酰-[acp]和乙酸的示例性生物化学途径的示意图。

图2是使用己二酰-[acp]或己酸作为中心前体导致己二酸的示例性生物化学途径的示意图。

图3是使用己二酰-[acp]或己酸作为中心前体导致6-氨基己酸的示例性生物化学途径的示意图。图3还包含从6-氨基己酸产生己内酰胺的示意图。

图4是使用6-氨基己酸或己二酸半醛(也称为6-氧代己酸)作为中心前体导致六亚甲基二胺的示例性生物化学途径的示意图。

图5是使用6-氨基己酸作为中心前体导致六亚甲基二胺的示例性生物化学途径的示意图。

图6是使用6-羟基己酸作为中心前体的导致六亚甲基二胺的示例性生物化学途径的示意图。

图7是使用己二酰-[acp]或己酸作为中心前体导致6-羟基己酸的示例性生物化学途径的示意图。

图8是使用6-羟基己酸作为中心前体导致1,6-己二醇的示例性生物化学途径的示意图。

图9是总结20分钟后在340nm处的吸光度变化的柱状图,其是相对于仅酶对照(无底物)的NADPH的消耗和羧酸还原酶的活性的量度。

图10是20分钟后340nm处吸光度变化的柱状图,其是相对于空载体对照的NADPH的消耗和羧酸盐还原酶将己二酸转化为己二酸半醛的活性的量度。

图11是20分钟后340nm处吸光度变化的柱状图,其是相对于空载体对照的NADPH的消耗和将6-羟基己酸转化为6-羟基己醛的羧酸还原酶的活性的量度。

图12是20分钟后在340nm处的吸光度变化的柱状图,其是相对于空载体对照的NADPH的消耗和将N6-乙酰基-6-氨基己酸转化为N6-乙酰基-6-氨基己醛的羧酸还原酶的活性的量度。

图13是20分钟后340nm处吸光度变化的柱状图,其是相对于空载体对照的NADPH的消耗和将己二酸半醛转化为己二醛的羧酸还原酶的活性的量度。

图14是总结了4小时后丙酮酸转化为L-丙氨酸的转化百分比(mol/mol)的柱状图,作为仅酶对照(无底物)的ω-转氨酶活性的量度。

图15是24小时后丙酮酸盐转化为L-丙氨酸后的转化百分比(mol/mol)的柱状图,作为相对于空载体对照的将6-氨基己酸转化为己二酸半醛的ω-转氨酶活性的量度。

图16是4小时后L-丙氨酸转化为丙酮酸的转化百分比(mol/mol)的柱状图,作为相对于空载体对照,将己二酸半醛转化为6-氨基己酸的ω-转氨酶活性的量度。

图17是4小时后丙酮酸转化为L-丙氨酸的转化百分比(mol/mol)的柱状图,作为相对于空载体对照,将六亚甲基二胺转化为6-氨基己醛的ω-转氨酶活性的量度。

图18是4小时后丙酮酸转化为L-丙氨酸的转化百分比(mol/mol)的柱状图,作为相对于空载体对照,将N6-乙酰基-1,6-二氨基己烷转化为N6-乙酰基-6-氨基己醛的ω-转氨酶活性的量度。

图19是4小时后丙酮酸转化为L-丙氨酸的转化百分比(mol/mol)的柱状图,作为相对于空载体对照,将6-氨基己醇转化为6-氧代己醇的ω-转氨酶活性的量度。

图20是如通过LC-MS测定的6-羟基己酸的峰面积变化的柱状图,作为相对于空载体对照,将己酸转化为6-羟基己酸的单加氧酶活性的量度。

图21含有短乳杆菌硫酯酶(参见GenBank登录号ABJ63754.1,SEQ ID NO:1),植物乳杆菌硫酯酶(参见GenBank登录号CCC78182.1,SEQ ID NO:2),海分枝杆菌羧酸还原酶(参见Genbank登录号ACC40567.1,SEQ ID NO:3),耻垢分枝杆菌羧酸还原酶(参见Genbank登录号ABK71854.1,SEQ ID NO:4),Segniliparus rugosus羧酸还原酶(参见Genbank登录号EFV11917.1,SEQ ID NO:5),马赛分枝杆菌(Mycobacterium massiliense)羧酸还原酶(参见Genbank登录号EIV11143.1,SEQ ID NO:6),Segniliparus rotundus羧酸还原酶(参见Genbank登录号ADG98140.1,SEQ ID NO:7),紫色色杆菌ω-转氨酶(参见Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌ω-转氨酶(参见Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌ω-转移酶(参见Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌ω-转移酶(参见Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌ω-转移酶(参见Genbank登录号AAA57874.1,SEQ ID NO:12),河流孤菌ω-转移酶(参见Genbank登录号AEA39183.1,SEQ ID NO:13),枯草芽孢杆菌磷酸泛酰巯基乙胺基转移酶(参见Genbank登录号CAA44858.1,SEQ ID NO:14),诺卡氏菌属物种NRRL 5646磷酸泛酰巯基乙胺基转移酶(参见Genbank登录号ABI83656.1,SEQ ID NO:15),单胞菌属物种JS666单加氧酶(参见Genbank登录号ABE47160.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500单加氧酶(参见Genbank登录号CAH04396.1,SEQ ID NO:17),南非分支杆菌(Mycobacterium austroafricanum)单加氧酶(参见Genbank登录号ACJ06772.1,SEQ ID NO:18),单胞菌属物种JS666氧化还原酶(参见Genbank登录号ABE47159.1,SEQ ID NO:19),分枝杆菌属物种HXN-1500氧化还原酶(参见Genbank登录号CAH04397.1,SEQ ID NO:20),单胞菌属物种JS666铁氧还原蛋白(参见Genbank登录号ABE47158.1,SEQ ID NO:21),分枝杆菌属物种HXN-1500铁氧还蛋白(参见Genbank登录号CAH04398.1,SEQ ID NO:22)和由bioI编码的枯草芽孢杆菌庚二酰-[acp]合酶(参见Genbank登录号AAB17462.1,SEQ ID NO:23)。

发明详述

本文描述了酶、非天然途径、培养策略、原料、宿主微生物和对宿主的生物化学网络的弱化,从中心代谢产物生成六碳链式脂族主链,在所述六碳链式脂族主链中可形成一个或两个末端官能团,导致己二酸、6-氨基己酸、6-羟基乙酸、六亚甲基二胺、己内酰胺或1,6-己二醇(本文称为“C6结构单元”)的合成。如本文所使用的,术语“中心前体”用于表示本文所示的导致C6结构单元合成的任意代谢途径中的任意代谢产物。术语“中心代谢产物”用于本文表示在所有微生物中生产以支持生长的代谢产物。

本文所述的宿主微生物可以包括能够操作,使得能生产一种或多种C6结构单元的内源性途径。在内源性途径中,所述宿主微生物天然表达催化所述途径中反应的所有酶。含有工程化途径的宿主微生物不天然表达催化所述途径中反应的所有酶,但已经过工程化使得所述途径中的所有的酶在所述宿主中表达。

如本文中提及核酸(或蛋白质)和宿主使用的,术语“外源”指不像其在自然界中被发现一样存在于特定类型细胞中(并且不能从特定类型细胞获得)的核酸或由所述核酸编码的蛋白质。如此,非天然存在的核酸一旦在宿主中即视为对于宿主而言外源的。重要的是注意非天然存在的核酸可含有在自然界中发现的核酸序列的核酸亚序列或片段,只要该核酸作为整体不存在于自然界中。例如,表达载体内含有基因组DNA序列的核酸分子是非天然存在的核酸,如此一旦导入宿主中对于宿主细胞而言是外源的,因为该核酸分子作为整体(基因组DNA加载体DNA)不存在于自然界中。如此,作为整体不存在于自然界中的任何载体、自主复制的质粒或病毒(例如逆转录病毒、腺病毒、或疱疹病毒)视为非天然存在的核酸。由此得出结论通过PCR或限制内切性核酸酶处理产生的基因组DNA片段以及cDNA也视为非天然存在的核酸,因为它们作为未见于自然界的分开的分子存在。由此还得出结论任何以未见于自然界中的排布含有启动子序列和多肽编码序列(例如cDNA或基因组DNA)的任何核酸也是非天然存在的核酸。天然存在的核酸可以是对于特定宿主微生物而言外源的。例如,从酵母x的细胞分离的完整染色体一旦将该染色体导入酵母y的细胞中就酵母y细胞而言是外源核酸。

比较而言,如本文中提及核酸(例如基因)(或蛋白质)和宿主使用的,术语“内源的”指就像其在自然界中被发现一样的确存在于特定宿主中(并且可以从特定宿主获得)的核酸(或蛋白质)。此外,“内源表达”核酸(或蛋白质)的细胞就像其在自然界中被发现时相同特定类型的宿主那样表达所述核酸(或蛋白质)。此外,“内源生成”核酸、蛋白质、或其它化合物的宿主就像其在自然界中被发现时相同特定类型的宿主那样生成所述核酸、蛋白质、或化合物。

例如,根据宿主和由宿主产生的化合物,除了具有庚二酰-[acp]合酶活性的多肽之外,还可以在宿主中表达一种或多种以下多肽:具有醛脱氢酶活性的多肽,具有烷烃1-单加氧酶活性的多肽,具有硫酯酶活性的多肽,具有ω-转氨酶活性的多肽,具有羧酸还原酶活性的多肽,具有水解酶活性的多肽,具有二胺转氨酶活性的多肽,具有N-乙酰转移酶活性的多肽,具有赖氨酸N-乙酰转移酶活性的多肽,具有脱酰基酶活性的多肽,或具有醇脱氢酶活性的多肽。在表达具有羧酸还原酶活性的多肽的重组宿主中,也可以具有磷酸泛酰巯基乙胺基转移酶活性的多肽,因为它增强羧酸还原酶活性的活性。在表达具有单加氧酶活性的多肽的重组宿主中,还可以表达电子转移链蛋白,如具有氧化还原酶活性的多肽或铁氧还蛋白多肽。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽并产生6-氧代己酰-[acp]和己醛或乙醛,这取决于十二酰基-[acp]或辛酰基-[acp]是否是具有庚二酰-[acp]合酶活性的多肽的底物。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽和具有醛脱氢酶活性的外源多肽,并且产生(i)己二酰-[acp]和己酸或(ii)己二酰-[acp]和乙酸,这取决于十二酰基-[acp]或辛酰基-[acp]是否是具有庚二酰-[acp]合酶活性的多肽的底物。在其中十二酰基-[acp]是重组宿主中具有庚二酰-[acp]合酶活性的多肽的底物的实施方案中,可以产生己二酰基-[acp]和己酸。在其中辛酰基-[acp]是重组宿主中具有庚二酰-[acp]合酶活性的多肽的底物的实施方案中,可以产生己二酰-[acp]和乙酸。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽和具有硫酯酶活性的外源多肽,并产生己二酸。参见例如图2。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,以及至少一种选自下组的多肽:(i)具有烷烃1-单加氧酶活性的外源多肽,(ii)具有醇脱氢酶活性的外源多肽和(iii)具有醛脱氢酶活性的多肽并产生己二酸。在一些实施方案中,宿主包括具有不同醛脱氢酶活性的两种或更多种外源多肽。参见例如图2。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,以及至少一种选自下组的多肽(i)具有烷烃1-单加氧酶活性的外源多肽,(ii)具有醇脱氢酶活性的外源多肽,(iii)具有硫酯酶活性的外源多肽,并产生己二酸。在一些实施方案中,宿主包括具有不同醛脱氢酶活性的两种或更多种外源多肽。参见例如图2。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,具有烷烃1-单加氧酶活性的外源多肽和具有醇脱氢酶活性的外源多肽,并产生己二酸半醛。参见例如图2。

例如,重组体可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,具有硫酯酶活性的外源多肽和具有羧酸还原酶活性的外源多肽,并产生己二酸半醛。参见例如图3。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,以及至少一种选自下组的外源多肽:具有硫酯酶活性的外源多肽,具有羧酸还原酶活性的外源多肽,和具有ω-转氨酶活性的多肽,并产生6-氨基己酸。例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,具有硫酯酶活性的外源多肽,具有羧酸还原酶活性的外源多肽和具有ω-转氨酶活性的外源多肽,并产生6-氨基己酸。参见图3。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽和至少一种选自下组的外源多肽:具有烷烃1-单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有ω-转氨酶活性的多肽,并产生6-氨基己酸。参见图3。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,以及至少一种选自下组的外源多肽:具有烷烃1-单加氧酶活性的多肽,具有醇脱氢酶活性的多肽,具有ω-转氨酶活性的多肽,具有硫酯酶活性的外源多肽和具有羧酸还原酶活性的外源多肽,并产生6-氨基己酸。例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽,具有烷烃1-单加氧酶活性的外源多肽,具有醇脱氢酶活性的外源多肽,具有硫酯酶活性的外源多肽,具有羧酸还原酶活性的多肽,以及具有ω-转氨酶活性的外源多肽,并产生6-氨基己酸。参见图3。

例如,产生6-氨基己酸的重组宿主还可以包括具有酰胺水解酶(amidohydrolase)活性的外源多肽并产生己内酰胺。参见图3。

例如,产生6-氨基己酸的重组宿主可包括具有羧酸还原酶活性的外源多肽和具有ω转氨酶活性的外源多肽,并产生六亚甲基二胺。具有羧酸还原酶活性的外源多肽可以是具有羧酸还原酶活性的第二外源多肽。第二外源羧酸还原酶可以与第一外源羧酸还原酶相同或不同。具有ω转氨酶活性的外源多肽可以是具有ω转氨酶活性的第二外源多肽。具有ω转氨酶活性的第二外源多肽可以与具有ω转氨酶活性的第一外源多肽相同或不同。参见图4。

例如,产生己二酸半醛的重组宿主还可以包括具有羧酸还原酶活性的外源多肽和具有转氨酶活性的外源多肽,并产生六亚甲基二胺。具有羧酸还原酶活性的外源多肽可以是具有羧酸还原酶活性的第二外源多肽。第二外源羧酸还原酶可以与具有羧酸还原酶活性的第一外源多肽相同或不同。具有ω转氨酶活性的外源多肽可以是具有ω转氨酶活性的第二外源多肽。第二外源ω转氨酶可以与第一外源ω转氨酶相同或不同。参见图4。

例如,产生6-氨基己酸的重组宿主还可以包括具有N-乙酰转移酶活性的外源多肽,具有羧酸还原酶活性的外源多肽,具有转氨酶活性的外源多肽,具有脱酰基酶活性的外源多肽,并产生六亚甲基二胺。具有羧酸还原酶活性的多肽可以是具有羧酸还原酶活性的第二外源多肽。第二外源羧酸还原酶可以与具有羧酸还原酶活性的第一外源多肽相同或不同。具有ω转氨酶活性的外源多肽可以是具有ω转氨酶活性的第二外源多肽。第二外源ω转氨酶可以与第一外源ω转氨酶相同或不同。参见图5。

例如,重组宿主可以包括具有庚二酰-[acp]合酶活性的外源多肽,具有醛脱氢酶活性的外源多肽和至少一种选自下组的外源多肽:具有烷烃1-单加氧酶活性的外源多肽,具有硫酯酶活性的外源多肽,具有羧酸还原酶活性的外源多肽和具有醇脱氢酶活性的外源多肽,并产生6-羟基己酸。参见图7。

例如,产生己酸的重组宿主还可以包括具有烷烃1-单加氧酶活性的外源多肽,并产生6-羟基己酸。参见图7。

例如,产生己二酰-[acp]的重组宿主还可以包括具有硫酯酶活性的外源多肽,具有羧酸还原酶活性的外源多肽和具有醇脱氢酶活性的外源多肽,并产生6-羟基己酸。参见图7。

例如,产生6-羟基己酸的重组宿主可以进一步包括至少一种选自下组的外源酶:具有羧酸还原酶活性的外源多肽,具有转氨酶活性的外源多肽和具有醛脱氢酶活性的外源多肽,并产生六亚甲基二胺。具有羧酸还原酶活性的外源多肽可以是具有羧酸还原酶活性的第二外源多肽。第二外源羧酸还原酶可以与具有羧酸还原酶活性的第一外源多肽相同或不同。具有醇脱氢酶活性的外源多肽可以是具有醇脱氢酶活性的第二外源多肽。第二外源醇脱氢酶可以与第一外源醇脱氢酶相同或不同。参见图6。

在一些实施方案中,产生6-羟基己酸的重组宿主可以进一步包括具有羧酸还原酶活性的外源多肽和具有醇脱氢酶活性的外源多肽,并产生1,6己二醇。具有羧酸还原酶活性的外源多肽可以是具有羧酸还原酶活性的第二外源多肽。第二外源羧酸还原酶可以与具有羧酸还原酶活性的第一外源多肽相同或不同。具有醇脱氢酶活性的外源多肽可以是具有醇脱氢酶活性的第二外源多肽。第二外源醇脱氢酶可以与第一外源醇脱氢酶相同或不同。参见图8。

本文所述的可用于生产一种或多种C6结构单元的任何酶可以与对应的野生型酶具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。应当理解,可以基于成熟酶(例如,除去任何信号序列)或基于未成熟酶(例如,包括任何信号序列)确定序列同一性。还应当理解,起始甲硫氨酸残基可以存在于或可以不存在于本文所述的任何酶序列上。

例如,本文描述的具有硫酯酶活性的多肽可以与短乳杆菌硫酯酶的氨基酸序列(参见GenBank登录号ABJ63754.1,SEQ ID NO:1)或植物乳杆菌硫酯酶的氨基酸序列(参见GenBank登录号CCC78182.1,SEQ ID NO:NO:2)具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文所述的具有羧酸还原酶活性的多肽可以与海分枝杆菌羧酸还原酶(参见Genbank登录号ACC40567.1,SEQ ID NO:3),耻垢分枝杆菌羧酸还原酶(参见Genbank登录号ABK71854.1,SEQ ID NO:4),Segniliparus rugosus羧酸还原酶(参见Genbank登录号EFV11917.1,SEQ ID NO:5),马赛分枝杆菌羧酸还原酶(参见Genbank登录号EIV11143.1,SEQ ID NO:6)或Segniliparus rotundus羧酸还原酶(参见Genbank登录号ADG98140.1,SEQ ID NO:7)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文描述的具有ω-转氨酶活性的多肽可以与紫色色杆菌ω-转氨酶(参见Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌ω-转氨酶(参见Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌ω- 转移酶(参见Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌ω-转移酶(参见Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌ω-转移酶(参见Genbank登录号AAA57874.1,SEQ ID NO:12),或河流孤菌ω-转移酶(参见Genbank登录号AEA39183.1,SEQ ID NO:13)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文所述的具有磷酸泛酰巯基乙胺基转移酶活性的多肽可以与枯草芽孢杆菌磷酸泛酰巯基乙胺基转移酶(参见Genbank登录号CAA44858.1,SEQ ID NO:14)或诺卡氏菌属物种NRRL 5646磷酸泛酰巯基乙胺基转移酶(参见Genbank登录号ABI83656.1,SEQ ID NO:15)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文所述的具有烷烃1-单加氧酶活性的多肽可以与单胞菌属物种JS666单加氧酶(参见Genbank登录号ABE47160.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500单加氧酶(参见Genbank登录号CAH04396.1,SEQ ID NO:17)或南非分枝杆菌单加氧酶(参见Genbank登录号ACJ06772.1,SEQ ID NO:18)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文所述的具有氧化还原酶活性的多肽可以与单胞菌属物种JS666氧化还原酶(参见Genbank登录号ABE47159.1,SEQ ID NO:19)或分枝杆菌属物种HXN-1500氧化还原酶(参见Genbank登录号CAH04397.1,SEQ ID NO:20)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文所述的铁氧还蛋白多肽可以与单胞菌属物种JS666铁氧还原蛋白(参见Genbank登录号ABE47158.1,SEQ ID NO:21)或分枝杆菌属物种HXN-1500铁氧还蛋白(参见Genbank登录号CAH04398.1,SEQ ID NO:22)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

例如,本文所述的具有庚二酰-[acp]合酶活性的多肽可以与枯草芽孢杆菌庚二酰-[acp]合酶(参见Genbank登录号AAB17462.1,SEQ ID NO:23)的氨基酸序列具有至少70%的序列同一性(同源性)(例如至少75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%)。参见图21。

可以如下测定两种氨基酸序列间的百分比同一性(同源性)。首先,使用来自含有BLASTP第2.0.14版的单机版BLASTZ的BLAST 2Sequences(Bl2seq)程序比对氨基酸序列。此单机版BLASTZ可以获自Fish&Richardson的网站(例如www.fr.com/blast/)或美国政府国立生物技术信息中心网站(www.ncbi.nlm.nih.gov)。解释如何使用Bl2seq程序的用法说明可以参见伴随BLASTZ的自述文件。Bl2seq使用BLASTP算法实施两种氨基酸序列之间的比较。为了比较两种氨基酸序列,如下设置Bl2seq的选项:-i设置为含有要比较的第一氨基酸序列的文件(例如C:\seq1.txt);-j设置为含有要比较的第二氨基酸序列的文件(例如C:\seq2.txt);-p设置为blastp;-o设置为任何期望的文件名称(例如C:\output.txt);并且所有其它选项保持为其缺省设置。例如,可以使用以下命令来产生含有两种氨基酸序列间的比较的输出文件:C:\Bl2seq–i c:\seq1.txt–j c:\seq2.txt–p blastp–o c:\output.txt。如果两种比较序列共享同源性(同一性),那么指定的输出文件会呈现那些同源性区作为比对序列。如果两种比较序列不共享同源性(同一性),那么指定的输出文件不会呈现比对序列。可以对核酸序列遵循相似的规程,只是使用blastn。

一旦比对,通过计算相同氨基酸残基在这两种序列中呈现的位置的数目确定匹配数目。通过用匹配数目除以全长多肽氨基酸序列的长度,接着将所得的数值乘以100来确定百分比同一性(同源性)。注意到百分比同一性(同源性)值被四舍五入到最近的十分位。例如,78.11、78.12、78.13、和78.14被向下四舍五入到78.1,而78.15、78.16、78.17、78.18、和78.19被向上四舍五入到78.2。还注意到长度值会总是整数。

应当领会,许多核酸可以编码具有特定氨基酸序列的多肽。遗传密码的简并性是本领域中公知的;即对于许多氨基酸,存在有超过一种充当氨基酸密码子的核苷酸三联体。例如,可以修饰给定酶的编码序列中的密码子,从而获得特定物种(例如细菌或真菌)中的最佳表达,这使用适合于所述物种的密码子偏爱表进行。

也可以在本文件的方法中使用本文中描述的任何酶的功能性片段。如本文中使用的,术语“功能性片段”指具有至少25%(例如至少30%;40%;50%;60%;70%;75%;80%;85%;90%;95%;98%;99%;100%;或甚至大于100%)的相应的成熟、全长、野生型蛋白质活性的蛋白质的肽片段。功能性片段一般但不总是可以由蛋白质的连续区构成,其中该区具有功能性活性。

此文件还提供了(i)本文件的方法中使用的酶的功能性变体和(ii)上文描述的功能性片段的功能性变体。相对于相应的野生型序列,酶和功能性片段的功能性变体可以含有添加、缺失、或取代。具有取代的酶一般会具有不超过50(例如不超过1、2、3、4、5、6、7、8、9、10、12、15、20、25、30、35、40、或50)处氨基酸取代(例如保守取代)。这适用于本文中描述的任何酶和功能性片段。保守取代是用一种氨基酸取代具有相似特征的另一种。保守取代包括下列组内的取代:缬氨酸、丙氨酸和甘氨酸;亮氨酸、缬氨酸、和异亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;丝氨酸、半胱氨酸、和苏氨酸;赖氨酸和精氨酸;和苯丙氨酸和酪氨酸。非极性疏水性氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。带正电荷的(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸。带负电荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。上文提及的极性、碱性或酸性组的一种成员被相同组的另一种成员的任何取代可以视为保守取代。比较而言,非保守取代是用一种氨基酸取代具有不同特征的另一种。

缺失变体可以缺乏1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个氨基酸的区段(具有两种或更多种氨基酸)或非连续的单一氨基酸。添加(添加变体)包括融合蛋白,其含有:(a)本文中描述的任何酶或其片段;和(b)内部或末端(C或N)无关或异源氨基酸序列。在此类融合蛋白的背景中,术语“异源氨基酸序列”指与(a)不同的氨基酸序列。异源序列可以是例如用于纯化重组蛋白的序列(例如FLAG、多组氨酸(例如六组氨酸)、凝集素(HA)、谷胱甘肽-S-转移酶(GST)、或麦芽糖结合蛋白(MBP))。异源序列也可以是可用作可检测标志物的蛋白质,例如萤光素酶、绿色荧光蛋白(GFP)、或氯霉素乙酰基转移酶(CAT)。在一些实施方案中,融合蛋白含有来自另一种蛋白质的信号序列。在某些宿主细胞(例如酵母宿主细胞)中,可以经由使用异源信号序列提高靶蛋白的表达和/或分泌。在一些实施方案中,融合蛋白可以含有可用于例如引发免疫应答以生成抗体的载体(例如KLH)或ER或高尔基体保留信号。异源序列可以是不同长度的,并且在一些情况中可以是比与异源序列附接的全长靶蛋白质更长的序列。

在一些实施方案中,如下实现十二酰基-[acp]或辛酰基-[acp]氧化切割成一种或多种C6脂族主链:通过在特定宿主中酰基载体蛋白的蛋白质工程化,建立由BioI编码的庚二酰-[acp]合酶内的碳-6和碳-7位置的底物排列(alignment)。

在一些实施方案中,如下实现十二酰基-[acp]或辛酰基-[acp]氧化切割成一种或多种C6脂族主链:通过在特定宿主中合成酰基载体蛋白和脂肪酸之间的修饰的磷酸泛酰巯基乙胺接头,建立由BioI编码的庚二酰-[acp]合酶内的碳-6和碳-7位置的底物排列。

在一些实施方案中,如下实现十二酰基-[acp]或辛酰基-[acp]氧化切割成一种或多种C6脂肪族主链:通过由BioI编码的庚二酰-[acp]合酶(SEQ ID NO:23)的酶工程化,建立用于氧化切割的酶中的碳-6和碳-7位置的底物排列。

本文所述途径的反应可以在一种或多种细胞(例如宿主细胞)株中进行,所述细胞株(a)天然表达一种或多种相关酶,(b)经遗传工程化而表达一种或多种相关酶,或(c)天然表达一种或多种相关酶并经遗传工程化而表达一种或多种相关酶。或者,可以从以上任意类型的宿主细胞中提取相关酶,并以纯化或半纯化形式使用。此外,这些提取物包括可以作为相关酶来源使用的裂解物(如细胞裂解物)。在本申请提供的方法中,所有步骤可以在宿主细胞中进行,所有步骤可以使用提取的酶进行,或者一些步骤可以在细胞中进行,其它步骤可以使用提取的酶进行。如本文所述,重组宿主可包括核酸,该核酸编码如下文更详细描述的具有合酶活性的多肽,具有脱氢酶活性的多肽,具有还原酶活性的多肽,具有单加氧酶活性的多肽,具有硫酯酶活性的多肽,具有脱酰基酶活性的多肽,具有转移酶活性的多肽,或具有转氨酶活性的多肽的一种或多种。

另外,可以使用本文中描述的分离的酶,使用来自宿主微生物的裂解物(例如细胞裂解物)作为酶来源,或者使用来自不同宿主微生物的多种裂解物作为酶来源体外进行一种或多种C6结构单元的产生。

产生用于转化为C6结构单元的C6脂族主链的酶

用于转化为一种或多种C6结构单元的C6脂肪族主链可以自使用乙酰CoA和丙二酰CoA作为中心代谢物的脂肪酸生物合成,和具有用于十二酰基-[acp]或辛酰基-[acp]前体的氧化切割的庚二酰-[acp]合酶活性的多肽形成。适合的庚二酰-[acp]合酶具有接受C8或C12酰基-[acp]底物,并氧化切割底物的C6和C7碳之间的C-C键的能力,以产生6-氧代己酰-[acp]和乙醛(当辛酰基-[acp]是底物时)或6-氧代己酰-[acp]和己醛(当十二酰基-[acp]是底物时),并且可以与由来自枯草芽孢杆菌的bioI编码的野生型庚二酰-[acp]合酶具有至少70%的序列同一性。野生型庚二酰-[acp]合酶分类在EC 1.14.15.12下,并且通常氧化切割酰基-[acp]底物的C7和C8碳之间的C-C键。参见Green等,J.Biol.Inorg.Chem.,2001,6,523-533;Cryle and De Voss,Chem.Commun.(Camb.),2004,7,86-87;Cryle and Schlichting,Proc.Natl.Acad.Sci.USA,2008,105,15696–15701。

在一些实施方案中,由具有庚二酰-[acp]合酶活性(例如,与SEQ ID NO:23所示的氨基酸序列具有70%的序列同一性)的多肽产生的半醛产物通过具有醛脱氢酶活性的多肽转化为它们相应的羧酸。参见图1。

在一些实施方案中,醛脱氢酶归类在EC 1.2.1.3或EC 1.2.1.4下。参见图1。

在C6结构单元的生物合成中产生末端羧基的酶

如图1和图2中描绘,可以使用具有硫酯酶活性的多肽或具有醛脱氢酶活性的多肽来酶促形成末端羧基。

在一些实施方案中,导致C6结构单元合成的第一或第二末端羧基通过归类在EC 1.2.1.-(例如,EC 1.2.1.3,EC 1.2.1.4,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79)下的醛脱氢酶酶促形成。例如,第一末端羧基可以由分类在EC 1.2.1.4(Ho&Weiner,Journal of Bacteriology,2005,187(3),1067–1073)或分类为EC 1.2.1.3(Guerrillot&Vandecasteele,Eur.J.Biochem.,1977,81,185–192)下的醛脱氢酶酶促形成。例如,导致己二酸合成的第二末端羧基可以通过分类在EC 1.2.1.-(例如EC 1.2.1.3,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79)下的醛脱氢酶,如CpnE,ChnE或ThnG的基因产物酶促形成(参见例如Iwaki等,Appl.Environ.Microbiol.,1999,65(11),5158–5162;或López-Sánchez等,Appl.Environ.Microbiol.,2010,76(1),110-118)。ThnG的基因产物是7-氧代庚酸脱氢酶。ChnE的基因产物是6-氧代己酸脱氢酶。

在一些实施方案中,导致己二酸合成的第二末端羧基由归类在EC 3.1.2.-下的硫酯酶,如fatB,tesA的基因产物,或具有SEQ ID NO:1或SEQ ID NO:2中所示的氨基酸序列的硫酯酶酶促形成(参见例如Jing等,BMC Biochemistry,2011,12,44;Cantu等,Protein Science,2010,19,1281–1295;Zhuang等,Biochemistry,2008,47(9),2789–2796;或Naggert等,J.Biol.Chem.,1991,266(17),11044–11050)。

在C6结构单元的生物合成中产生末端胺基的酶

如图3、图4、图5和图6中描绘,可以使用具有ω-转氨酶活性的多肽或具有脱酰基酶活性的多肽酶促形成末端胺基。

在一些实施方案中,末端氨基可以由归类于例如EC 2.6.1.-,例如EC 2.6.1.18、EC 2.6.1.19、EC 2.6.1.29、EC 2.6.1.48或EC 2.6.1.82下的ω-转氨酶(如获得自紫色色杆菌(GenBank登录号AAQ59697.1,SEQ ID NO:8))、铜绿假单胞菌(GenBank登录号AAG08191.1,SEQ ID NO:9)、丁香假单胞菌(GenBank登录号AAY39893.1,SEQ ID NO:10)、球形红细菌(GenBank登录号ABA81135.1,SEQ ID NO:11)、河流弧菌(GenBank登录号AEA39183.1,AEA39183.1,SEQ ID NO:13)、灰色链霉菌(Streptomyces griseus)或Clostridium viride)酶促形成。参见图3。

可用于本文所述的方法和宿主中的另外的ω-转氨酶来自大肠杆菌(GenBank登录号AAA57874.1,SEQ ID NO:12)。一些归类于例如EC 2.6.1.29或EC 2.6.1.82下的ω-转氨酶是二胺ω-转氨酶。

在一些实施方案中,导致6-氨基己酸合成的第一末端胺基由归类于2.6.1.18下的ω-转氨酶(如获得自河流弧菌(SEQ ID NO:13)或紫色色杆菌(SEQ ID NO:8)),归类于EC 2.6.1.19下(如获得自灰色链霉菌),或分类于EC 2.6.1.48下(如获得自梭菌属)酶促形成。还可以使用具有SEQ ID NO:9,10,和11中所示的氨基酸序列的ω-转氨酶。

来自紫色色杆菌的可逆ω-转氨酶已经表明接受6-氨基己酸作为氨基供体,从而在己二酸半醛中形成第一末端胺基的类似活性(Kaulmann等,Enzyme and Microbial Technology,2007,41,628-637)。

来自灰色链霉菌的可逆的4-氨基丁酸:2-氧代戊二酸转氨酶已经表明用于将6-氨基己酸转化为己二酸半醛的类似活性(Yonaha等,Eur.J.Biochem.,1985,146,101-106)。

来自Clostridium viride的可逆的5-氨基戊酸转氨酶已经表明用于将6-氨基己酸转化为己二酸半醛的类似活性(Barker等,The Journal of Biological Chemistry,1987,262(19),8994-9003)。

在一些实施方案中,导致六亚甲基二胺合成的第二末端胺基由归类于EC 2.6.1.29或归类于EC 2.6.1.82下的二胺转氨酶,如YgjG的基因产物酶促形成。可以使用具有SEQ ID NO:8-13所示的氨基酸序列的ω-转氨酶可以用于生物合成六亚甲基二胺。

YgjG的基因产物接受宽范围的二胺碳链长度底物,诸如腐胺,尸胺和亚精胺(Samsonova等,BMC Microbiology,2003,3:2)。

来自大肠杆菌菌株B的二胺转氨酶已经表明对1,6-二氨基己烷的活性(Kim,The Journal of Chemistry,1963,239(3),783-786)。

在一些实施方案中,通过分类于例如EC 3.5.1.17下的脱酰基酶,如酰基赖氨酸脱酰基酶,在N 6-乙酰基-1,6-二氨基己烷中酶促形成第二末端胺基,其导致庚二胺的形成。

在C6结构单元的生物合成中产生末端羟基的酶

如图7和图8中描绘,可以使用具有烷烃1-单加氧酶活性的多肽或具有醇脱氢酶活性的多肽来酶促形成末端羟基。

在一些实施方案中,导致合成C6结构单元的第一末端羟基通过烷烃1-单加氧酶(如由alkBGT编码)或细胞色素P450(如来自CYP153家族(如CYP153A)酶促形成(参见,例如Van Beilen&Funhoff,Current Opinion in Biotechnology,2005,16,308–314;Koch et al.,Appl.Environ.Microbiol.,2009,75(2),337-344;or Nieder and Shapiro,Journal of Bacteriology,1975,122(1),93-98)。见例如SEQ ID NO.16-18。

CYP153A家族的末端烷烃1-单加氧酶和alkB单加氧酶的底物特异性已经成功地扩大(Koch等,2009,同上)。尽管在体外观察到CYP153A6的非末端羟基化,但在体内仅发生1-羟基化(Funhoff等,Journal of Bacteriology,2006,188(14),5220–5227)。

在一些实施方案中,导致6-羟基己酸合成的末端羟基通过归类在EC 1.1.1.-(例如EC 1.1.1.2)下的醇脱氢酶,如YMR318C,cpnD或gabD的基因产物,或分类在EC 1.1.1.258下,如ChnD的基因产物酶促形成。分类在EC 1.1.1.258下的醇脱氢酶是6-羟基己酸脱氢酶。

在一些实施方案中,导致1,6己二醇合成的第二末端羟基通过分类在EC 1.1.1.-(例如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21,或EC 1.1.1.184)下的醇脱氢酶,如YMR318C或YqhD的基因产物或具有GenBank登录号CAA81612.1的蛋白酶促合成。

生物化学途径

使用长链酰基-[acp]脂肪酸合成中间物作为前体,导致C6脂族主链,己二酰-[acp]和己酸的途径

在一些实施方案中,如下从十二酰基-[acp]合成己二酰-[acp]和己酸:通过具有庚二酰-[acp]合酶活性的多肽(例如,与BioI的基因产物具有至少70%的序列同一性,参见Genbank登录号AAB17462.1,SEQ ID NO:23),将十二酰基-[acp]转化成苏型-6,7-二羟基十二酰基-[acp];然后通过具有庚二酰-[acp]合酶活性的多肽(例如,与BioI的基因产物具有至少70%的序列同一性,参见Genbank登录号AAB17462.1,SEQ ID NO:23)转化为6-氧代己酰-[acp]和己醛;然后通过分类在例如EC 1.2.1.4或EC 1.2.1.3下的醛脱氢酶转化为己二酰-[acp]和己酸。参见例如图1。

在一些实施方案中,如下从辛酰基-[acp]合成己二酰-[acp]和乙酸:通过具有庚二酰基-[acp]合酶活性的多肽(例如,与BioI的基因产物具有至少70%的序列同一性,参见Genbank登录号AAB17462.1,SEQ ID NO:23)将辛酰基-[acp]转化成苏型-6,7-二羟基辛酰基-[acp];随后通过具有庚二酰基-[acp]合酶活性的多肽(例如,与BioI的基因产物具有至少70%的序列同一性,参见Genbank登录号AAB17462.1,SEQ ID NO:23)转化为6-氧代己酰-[acp]和乙醛;然后通过归类在例如EC 1.2.1.4或EC 1.2.1.3下的醛脱氢酶转化为己二酰-[acp]和乙酸。参见例如图1。

使用己酸或己二酰-[acp]中心前体到己二酸的途径

在一些实施方案中,如下从中心前体己酸合成己二酸:通过烷烃1-单加氧酶如alkBor或来自CYP153A家族,如单胞菌属物种JS666单加氧酶(参见Genbank登录号ABE47160.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500单加氧酶(参见Genbank登录号CAH04396.1,SEQ ID NO:17),或南非分枝杆菌单加氧酶(参见Genbank登录号ACJ06772.1,SEQ ID NO:18)将己酸转化为6-羟基己酸;随后通过醇脱氢酶(例如,分类在EC 1.1.1.2或EC 1.1.1.258下)如YMR318C,cpnD,gabD或ChnD的基因产物将6-羟基己酸转化为己二酸半醛;随后通过醛脱氢酶(例如,分类在EC 1.2.1.-,EC 1.2.1.3,EC 1.2.1.16,EC 1.2.1.20,EC 1.2.1.63或EC 1.2.1.79下)如ThnG,ChnE或CpnE的基因产物将己二酸半醛转化为己二酸。参见图2。

由YMR318C编码的醇脱氢酶具有广泛的底物特异性,包括C6醇的氧化。

在一些实施方案中,如下从中心前体己二酰-[acp]合成己二酸:通过硫酯酶(例如,分类在EC 3.1.2.-下),如来自短乳杆菌(参见GenBank登录号ABJ63754.1,SEQ ID NO:1),植物乳杆菌(参见GenBank登录号CCC78182.1,SEQ ID NO:2),或fatB或tesA的基因产物将己二酰-[acp]转化为己二酸。参见图2。

使用己二酰-[acp]或己酸作为中心前体到6-氨基己酸的途径

在一些实施方案中,如下从中心前体己酸合成6-氨基己酸:通过烷烃1-单加氧酶,如alkB或来自CYP153A家族,如单胞菌属物种JS666单加氧酶(参见Genbank登录号ABE47160.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500单加氧酶(参见Genbank登录号CAH04396.1,SEQ ID NO:17),或南非分枝杆菌单加氧酶(参见Genbank登录号ACJ06772.1,SEQ ID NO:18)将己酸转化为6-羟基己酸;随后通过醇脱氢酶(例如,分类在EC 1.1.1.2或EC 1.1.1.258下),如YMR318C,cpnD,gabD或ChnD的基因产物将6-羟基己酸转化为己二酸半醛;随后通过ω-转氨酶(例如,分类在EC 2.6.1.-下),如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank 登录号AAY39893.1,SEQ ID NO:10),球形红细菌酶(Genbank登录号ABA81135.1,SEQ ID NO:11),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)将己二酸半醛转化为6-氨基己酸。参见图3。

在一些实施方案中,如下从中心前体己二酰-[acp]合成6-氨基己酸:通过硫酯酶(例如分类在EC 3.1.2.-分类下),如来自短乳杆菌(参见GenBank登录号ABJ63754.1,SEQ ID NO:1),植物乳杆菌(参见GenBank登录号CCC78182.1,SEQ ID NO:2),或fatB或tesA的基因产物将己二酰-[acp]转化为己二酸;随后通过例如分类在例如EC 1.2.99.6下的羧酸还原酶例如car的基因产物(例如来自Segniliparus rugosus,Genbank登录号EFV11917.1,SEQ ID NO:5或来自Segniliparus rotundus,Genbank登录号ADG98140.1,SEQ ID NO:7,与磷酸泛酰巯基乙胺基转移酶增强剂(例如,由来自枯草芽孢杆菌的sfp基因(SEQ ID NO:14)或来自诺卡氏菌属的npt基因(SEQ ID NO:15)编码)组合或来自灰色链霉菌的GriC和GriD的基因产物将己二酸转化为己二酸半醛(Suzuki等人,J.Antibiot.,2007,60(6),380-387);随后通过ω-转氨酶,如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌(Genbank登录号ABA81135.1,SEQ ID NO:11),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)转化为6-氨基己酸。见图3。

在一些实施方案中,通过分类在EC 3.5.2.-下的酰胺水解酶将6-氨基己酸转化为己内酰胺。

使用6-氨基己酸作为中心前体到六亚甲基二胺的途径

在一些实施方案中,如下从中心前体6-氨基己酸合成六亚甲基二胺:通过羧酸还原酶(例如,分类在EC 1.2.99.6下),如car的基因产物(例如,SEQ ID NO:3-7)与npt(SEQ ID NO:15)或sfp(SEQ ID NO:14)的基因产物的组合将6-氨基己酸转化为6-氨基己醛,或者备选可以使用GriC&GriD的基因产物(Suzuki等人,2007,同上)代替car的基因产物;随后通过ω-转氨酶(例如,分类在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.48,EC 2.6.1.29或EC 2.6.1.82下),如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌酶(Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)将6-氨基己醛转化为六亚甲基二胺。见图4。

由car和增强剂npt的基因产物编码的羧酸还原酶具有广泛的底物特异性,包括末端双官能的C4和C5羧酸(Venkitasubramanian等,Enzyme and Microbial Technology,2008,42,130–137)。

在一些实施方案中,如下从中心前体6-氨基己酸合成六亚甲基二胺:通过N-乙酰基转移酶,如赖氨酸N-乙酰转移酶(其分类在例如EC 2.3.1.32下),将6-氨基己酸转化为N6-乙酰基-6-氨基己酸;随后通过分类在例如EC 1.2.99.6下的羧酸还原酶,如来自Segniliparus rugosus(参见Genbank登录号EFV11917.1,SEQ ID NO:5),马赛分枝杆菌(参见Genbank登录号EIV11143.1,SEQ ID NO:6)或Segniliparus rotundus(Genbank登录号ADG98140.1,SEQ ID NO:7)的羧酸还原酶与磷酸泛酰巯基乙胺基转移酶增强剂(例如,由来自枯草芽孢杆菌的sfp基因或来自诺卡氏菌属的npt基因编码)组合将N6-乙酰基-6-氨基己酸转化为N6-乙酰基-氨基己醛,或者备选可以使用来自灰色链霉菌的GriC和GriD的基因产物(Suzuki等人,2007,同上)代替car的基因产物;随后通过分类在例如EC 2.6.1.-下的ω-转氨酶,如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌酶(Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)将N6-乙酰基-氨基己醛转化为N6-乙酰基-1,6-二氨基己烷;随后通过例如分类在EC 3.5.1.17下的脱酰基酶将N6-乙酰基-1,6-二氨基己烷转化为六亚甲基二胺。见图5。

使用己二酸半醛作为中心前体到六亚甲基二胺的途径

在一些实施方案中,如下从中心前体己二酸半醛合成六亚甲基二胺:通过羧酸还原酶(例如分类在EC 1.2.99.6下),如来自Segniliparus rotundus(参见Genbank登录号ADG98140.1,SEQ ID NO:7)与磷酸泛酰巯基乙胺转移酶增强剂(例如由来自枯草芽孢杆菌的sfp基因或来自诺卡氏菌属的npt基因编码)的组合将己二酸半醛转化为1,6-己二醛,或者来自灰色链霉菌的GriC和GriD的基因产物(Suzuki等人,2007,同上)可以用于替换car的基因产物;随后通过分类在例如EC 2.6.1.18,EC 2.6.1.19,EC 2.3.1.29,EC 2.6.1.48或EC 2.3.1.82下的转氨酶将1,6-己二醛转化为6-氨基己醛;随后通过例如分类在EC 2.6.1.18,EC 2.6.1.19,EC 2.6.1.48,EC 2.6.1.29或EC 2.6.1.82下的ω-转氨酶,如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌酶(Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)将6-氨基己醛转化为六亚甲基二胺。见图4。

使用6-羟基己酸作为中心前体到六亚甲基二胺的途径

在一些实施方案中,如下从中心前体6-羟基己酸合成六亚甲基二胺:通过羧酸还原酶(分类在例如EC 1.2.99.6下),如来自海分枝杆菌(参见Genbank登录号ACC40567.1,SEQ ID NO:3),耻垢分枝杆菌(参见Genbank登录号ABK71854.1,SEQ ID NO:4),Segniliparus rugosus(参见Genbank登录号EFV11917.1,SEQ ID NO:5),马赛分枝杆菌(参见Genbank登录号EIV11143.1,SEQ ID NO:6),或Segniliparus rotundus(参见Genbank登录号ADG98140.1,SEQ ID NO:7)(例如与磷酸泛酰巯基乙胺基转移酶增强剂(如,由来自枯草芽孢杆菌的sfp基因或来自诺卡氏菌属的npt基因编码)组合),或者来自灰色链霉菌的GriC和GriD的基因产物(Suzuki等人,2007,同上)将6-羟基己酸转化为6-羟基己醛;随后通过分类在例如EC 2.6.1.-下的ω-转氨酶,如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌酶(Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)将6-羟基己醛转化为6-氨基己醇;随后通过分类在例如EC 1.1.1.1下的醇脱氢酶(例如来自嗜热脂肪地芽孢杆菌的具有GenBank登录号CAA81612.1或由YMR318C或YqhD编码的蛋白)将6-氨基己醇转化为6-氨基己醛;随后通过分类在例如EC 2.6.1.-下的ω-转氨酶,如来自紫色色杆菌(Genbank登录号AAQ59697.1,SEQ ID NO:8),铜绿假单胞菌(Genbank登录号AAG08191.1,SEQ ID NO:9),丁香假单胞菌(Genbank登录号AAY39893.1,SEQ ID NO:10),球形红细菌酶(Genbank登录号ABA81135.1,SEQ ID NO:11),大肠杆菌(参见Genbank登录号AAA57874.1,SEQ ID NO:12),或河流孤菌(Genbank登录号AEA39183.1,SEQ ID NO:13)将6-氨基己醛转化为六亚甲基二胺。见图6。

使用己二酰-[acp]或己酸作为中心前体到1,6-己二醇的途径

在一些实施方案中,如下从中心前体己酸合成6-羟基己酸:通过烷烃1-单加氧酶,如alkB或来自CYP153A家族,如单胞菌属物种JS666单加氧酶(参见Genbank登录号ABE47160.1,SEQ ID NO:16),分枝杆菌属物种HXN-1500单加氧酶(参见Genbank登录号CAH04396.1,SEQ ID NO:17),南非分枝杆菌单加氧酶(参见Genbank登录号ACJ06772.1,SEQ ID NO:18)将己酸转化为6-羟基己酸。见图7。

在一些实施方案中,如下从中心前体己二酰-[acp]合成6-羟基己酸:通过硫酯酶(例如,分类在EC 3.1.2.-下),如来自短乳杆菌(参见GenBank登录号ABJ63754.1,SEQ ID NO:1)或植物乳杆菌(参见GenBank登录号CCC78182.1,SEQ ID NO:2),或fatB或tesA的基因产物将己二酰-[acp]转化为己二酸;随后通过羧酸还原酶(例如,分类在EC 1.2.99.6下),如来自Segniliparus rugosus(参见Genbank登录号EFV11917.1,SEQ ID NO:5)或来自Segniliparus rotundus(参见Genbank登录号ADG98140.1,SEQ ID NO:7)与磷酸泛酰巯基乙胺基转移酶增强剂(例如,由来自枯草芽孢杆菌的sfp基因编码)或GriC&GriD的基因产物转化为己二酸半醛;随后通过醇脱氢酶(例如,分类在EC 1.1.1.2或EC 1.1.1.258下),如YMR318C,ChnD,cpnD或gabD的基因产物转化为6-羟基己酸。见图7。

在一些实施方案中,如下从中心前体6-羟基己酸合成1,6-己二醇:通过羧酸还原酶(例如分类在EC 1.2.99.6下),如来自海分枝杆菌(参见Genbank登录号ACC40567.1,SEQ ID NO:3),耻垢分枝杆菌(参见Genbank登录号ABK71854.1,SEQ ID NO:4),Segniliparus rugosus(参见Genbank登录号EFV11917.1,SEQ ID NO:5),马赛分枝杆菌(参见Genbank登录号EIV11143.1,SEQ ID NO:6),或Segniliparus rotundus(参见Genbank登录号ADG98140.1,SEQ ID NO:7)(例如与例如由来自枯草芽孢杆菌的sfp基因或来自诺卡氏菌属的npt基因编码的磷酸泛酰巯基乙胺基转移酶增强剂组合),或者GriC&GriD的基因产物将6-羟基己酸转化为6-羟基己醛;随后通过醇脱氢酶(例如分类在EC 1.1.1.-下如EC 1.1.1.1,EC 1.1.1.2,EC 1.1.1.21或EC 1.1.1.184),如由YMR318C或YqhD编码或具有GenBank登录号CAA81612.1的蛋白将6-羟基己醛转化为1,6己二醇(Liu等,Microbiology,2009,155,2078-2085)。见图8。

培养策略

在一些实施方案中,使用厌氧,需氧或微需氧培养条件在重组宿主中生物合成一种或多种C6结构单元。在一些实施方案中,培养策略需要营养限制,例如氮,磷酸盐或氧限制。

在一些实施方案中,可以采用使用例如陶瓷膜的细胞保留策略来实现并维持补料分批或连续发酵期间的高细胞密度。

在一些实施方案中,在一种或多种C6结构单元的合成中对发酵补料的主要碳源可以源自生物或非生物原料。

在一些实施方案中,生物原料可以是或可以源自单糖,二糖,木质纤维素,半纤维素,纤维素,木质素,乙酰丙酸和甲酸,甘油三酯,甘油,脂肪酸,农业废物,浓缩的酒糟,或城市废物。

已经在几种微生物,如大肠杆菌、钩虫贪铜菌、食油假单胞菌、恶臭假单胞菌和解脂耶罗维亚酵母中证明了对来自生物柴油生产的粗制甘油的有效分解代谢(Lee等,Appl.Biochem.Biotechnol.,2012,166:1801-1813;Yang等,Biotechnology for Biofuels,2012,5:13;Meijnen等,Appl.Microbiol.Biotechnol.,2011,90:885-893)。

已经在几种生物体,如钩虫贪铜菌和恶臭假单胞菌中证明了在经由前体丙酰基-CoA合成3-羟基戊酸中对木质纤维素衍生的乙酰丙酸的有效分解代谢(Jaremko and Yu,Journal of Biotechnology,2011,155,2011,293-298;Martin and Prather,Journal of Biotechnology,2009,139,61-67)。

已经在几种微生物,如恶臭假单胞菌、钩虫贪铜菌中证明了对木质素衍生的芳香族化合物诸如苯甲酸类似物的有效分解代谢(Bugg等,Current Opinion in Biotechnology,2011,22,394-400;Pérez-Pantoja等,FEMS Microbiol.Rev.,2008,32,736-794)。

已经在几种微生物,包括解脂耶罗维亚酵母中证明了对农业废物,如橄榄磨坊废水的有效利用(Papanikolaou等,Bioresour.Technol.,2008,99(7):2419–2428)。

已经对几种微生物,如大肠杆菌、谷氨酸棒状杆菌和德氏乳杆菌和乳酸乳球菌证明了可发酵糖类,如源自纤维素、半纤维素、甘蔗和甜菜糖蜜、木薯、玉米和其它农业来源的单糖和二糖的有效利用(参见例如Hermann等,Journal of Biotechnology,2003,104,155-172;Wee等,Food Technol.Biotechnol.,2006,44(2),163-172;Ohashi等,Journal of Bioscience and Bioengineering,1999,87(5),647–654)。

已经对钩虫贪铜菌证明了源自多种农业木质纤维素来源的糠醛的有效利用(Li等,Biodegradation,2011,22:1215-1225)。

在一些实施方案中,非生物原料可以是或者可以源自天然气、合成气、CO2/H2、甲醇,乙醇,苯甲酸甲酯,非挥发性残留物(NVR)或来自环己烷氧化过程的碱洗液(caustic wash)废物流,或对苯二甲酸/间苯二甲酸混合物废物流。

已经对甲基营养型酵母巴斯德毕赤酵母证明了甲醇的有效分解代谢。

已经对克氏梭菌证明了乙醇的有效分解代谢(Seedorf等,Proc.Natl.Acad.Sci.USA,2008,105(6)2128-2133)。

已经对钩虫贪铜菌证明了CO2和H2(其可以源自天然气和其它化学和石油化学来源)的有效分解代谢(Prybylski等,Energy,Sustainability and Society,2012,2:11)。

已经对多种微生物,如杨氏梭菌和自产乙醇梭菌(Clostridium autoethanogenum)证明了合成气的有效分解代谢(等,Applied and Environmental Microbiology,2011,77(15):5467-5475)。

已经对多种微生物,如食酸代尔夫特菌和钩虫贪铜菌证明了来自环己烷过程的非挥发性残留物废物流的有效分解代谢(Ramsay等,Applied and Environmental Microbiology,1986,52(1):152-156)。

在一些实施方案中,宿主微生物可以是原核生物。例如,原核生物可以是来自以下的细菌:埃希氏菌属如大肠杆菌;梭菌属如杨氏梭菌、自产乙醇梭菌或者克鲁佛梭菌;棒状杆菌属如谷氨酸棒状杆菌;贪铜菌属如钩虫贪铜菌或者耐金属贪铜菌;假单胞菌属如荧光假单胞菌、恶臭假单胞菌或者食油假单胞菌;代尔夫特菌属如食酸代尔夫特菌;芽孢杆菌属如枯草芽胞杆菌;乳杆菌属如德氏乳杆菌;或者乳球菌属如乳酸乳球菌。此类原核生物也可以是构建能够生成一种或多种C6结构单元的本文中描述的重组宿主细胞的基因来源。

在一些实施方案中,宿主微生物可以是真核生物。例如,真核生物可以是丝状真菌,例如来自曲霉属如黑曲霉的。或者,真核生物可以是酵母,例如来自酵母属如酿酒酵母;来自毕赤氏酵属如巴斯德毕赤酵母;来自耶罗维亚酵母属如解脂耶罗维亚酵母;来自伊萨酵母属如东方伊萨酵母;来自德巴利酵母属如汉逊德巴利酵母;来自Arxula属如Arxula adenoinivorans;或者来自克鲁维酵母菌属如乳酸克鲁维酵母菌。此类真核生物也可以是构建能够生成一种或多种C6结构单元的本文中描述的重组宿主细胞的基因来源。

代谢工程

本申请提供方法,其涉及少于对上述所有途径描述的所有的步骤。此类方法可以涉及例如此类步骤中的一,二,三,四,五,六,七,八,九,十,十一,十二或者更多个。在此类方法包括少于所有步骤的情况下,第一个,并且在一些实施方案中唯一的,步骤可为所列步骤中的任何步骤。

此外,本文中描述的重组宿主可以包括上述酶中的任何组合,使得所述步骤中的一个或者多个,例如此类步骤中的一,二,三,四,五,六,七,八,九,十或者更多个可以在重组宿主内实施。本申请提供了所列出的任何属和种的宿主细胞,并且经遗传工程化以表达一种或多种(例如,二,三,四,五,六,七,八,九,10,11,12或更多种)本文所述的任何酶的重组形式。因此,例如,宿主细胞可以含有编码酶的外源核酸,所述酶催化本文所述的任何途径的一个或多个步骤。

另外,本申请认识到,在酶已经被描述为接受CoA活化的底物的情况下,存在与[acp]结合底物相关的类似酶活性,其不一定为相同的酶种类。

此外,本文件认识到,在酶已经被描述为接受底物的(R)-对映异构体的情况下,存在与底物的(S)-对映异构体相关的类似酶活性,其不一定为相同的酶种类。

本申请还认识到,在已经显示酶接受特定辅因子如NADPH或者共底物如乙酰基-CoA的情况下,许多酶在催化特定酶活性中在接受大量不同辅因子或者共底物方面是泛宿主性的(promiscuous)。此外,本申请认识到,在酶对例如特定辅助因子如NADH具有高特异性的情况下,对辅助因子NADPH具有高特异性的具有相似或者相同活性的酶可为不同的酶种类。

在一些实施方案中,本文所述的途径中的酶是经由非直接的酶工程或者合理的酶设计方法的结果,目的在于改善活性、改善特异性、降低反馈抑制、降低阻抑(repression)、改善酶溶解度、改变立体特异性,或者改变辅助因子特异性。

在一些实施方案中,可以将本文概述的途径中的酶经由附加型或者染色体整合方法基因给予(即,通过在宿主生物体中具有多个拷贝的基因来过表达)至所得的遗传修饰的生物体中。

在一些实施方案中,使用基因组级别(genome-scale)系统生物学技术如通量平衡分析来设计用于将碳流量引导至C6结构单元的基因组级别的弱化或者敲除策略。

弱化策略包括但不限于使用转座子,同源重组(双交叉方法),诱变,酶抑制剂和RNAi干扰。

在一些实施方案中,使用通量组(fluxomic)、代谢物组(metabolomic)和转录物组(transcriptomal)数据来告知或者支持基因组级别的系统生物学技术,由此在将碳流量导向C6结构单元中设计基因组级别的弱化或者敲除策略中。

在一些实施方案中,通过在选择性环境中连续培养,改善了宿主微生物对高浓度C6结构单元的耐受性。

在一些实施方案中,宿主微生物的生物化学网络被弱化或增强以(1)保证乙酰-CoA和丙二酰-CoA的细胞内可用度,(2)创造NADPH不平衡,其仅可以通过C6结构单元的形成来平衡,(3)阻止通向和包括一种或多种C6结构单元的中心代谢物或中心前体的降解,和/或(4)保证从细胞的高效流出。

在一些要求乙酰-CoA的细胞内可用度用于C6结构单元的合成的实施方案中,可以弱化产生乙酸的内源性磷酸转乙酰酶,例如pta(Shen等,Appl.Environ.Microbiol.,2011,77(9):2905–2915)。

在一些要求乙酰-CoA的细胞内可用度用于C6结构单元的合成的实施方案中,可以弱化乙酸合成途径中编码乙酸激酶的内源性基因,例如ack。

在一些要求乙酰-CoA和NADH的细胞内可用度用于C6结构单元的合成的实施方案中,可以弱化编码催化丙酮酸降解为乳酸的酶的内源性基因,例如由ldhA编码的乳酸脱氢酶(Shen等,Appl.Environ.Microbiol.,2011,77(9),2905-2915)。

在一些要求乙酰-CoA的细胞内可用度用于C6结构单元的合成的实施方案中,可以弱化编码催化磷酸烯醇丙酮酸降解为琥珀酸的酶的内源基因,例如frdBC(见Shen等,2011,见上文)。

在一些要求乙酰-CoA的细胞内可用度用于C6结构单元的合成的实施方案中,可以弱化编码催化乙酰-CoA降解为乙醇的酶的内源性基因,例如由adhE编码的醇脱氢酶(Shen等,2011,见上文)。

在一些要求乙酰-CoA的细胞内可用度用于C6结构单元的合成的实施方案中,可以在微生物中过表达重组乙酰-CoA合成酶,如acs的基因产物(Satoh等,J.Bioscience and Bioengineering,2003,95(4):335–341)。

在一些实施方案中,通过弱化内源性葡萄糖-6-磷酸异构酶(EC 5.3.1.9),可以将碳通量导入戊糖磷酸循环中。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达编码吡啶核苷酸转氢酶的基因例如UdhA(Brigham等,Advanced Biofuels and Bioproducts,2012,Chapter 39,1065-1090)。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达重组甘油醛-3-磷酸-脱氢酶基因,例如GapN(Brigham等,2012,见上文)。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达重组苹果酸酶基因,如maeA或maeB(Brigham等,2012,见上文)。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达重组葡萄糖-6-磷酸脱氢酶基因,例如zwf(Lim等,Journal of Bioscience and Bioengineering,2002,93(6),543-549)。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达重组果糖1,6-二磷酸酶基因,例如fbp(Becker et al.,Journal of Biotechnology,2007,132,99-109)。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以弱化编码磷酸丙糖异构酶(EC 5.3.1.1)的内源基因。

在一些实施方案中,在C6结构单元合成中途径需要过量的NADPH辅因子的情况下,可以在宿主生物体中过表达重组葡萄糖脱氢酶,如gdh的基因产物(Satoh等,2003,见上文)。

在一些实施方案中,弱化编码促进NADPH转化为NADH的酶的内源基因,如可以归类于EC 1.4.1.2(NADH特异性)和EC 1.4.1.4(NADPH特异性)下的谷氨酸脱氢酶的相互转化产生的NADH生成循环;或转氢酶。

在一些实施方案中,可以弱化编码使用NADH和NADPH两者作为辅因子的谷氨酸脱氢酶(EC 1.4.1.3)的内源基因。

在一些实施方案中,膜结合的烷烃1-单加氧酶通过将P450锚定到内质网的N末端区域的截短而增溶(Scheller等,J.Biol.Chem.,1994,269(17),12779-12783)。

在一些使用天然积累聚羟基链烷酸酯的宿主的实施方案中,可以在宿主菌株中弱化编码聚合物合酶的内源基因。

在使用天然积累脂质体的宿主的一些实施方案中,可以在宿主菌株中弱化编码合酶的相关基因。

在一些实施方案中,弱化降解导致并包括C6结构单元的中心代谢物和中心前体的β-氧化酶。

在一些实施方案中,弱化编码通过CoA酯化活化C6结构单元的酶的内源基因,如CoA连接酶。

在一些实施方案中,通过遗传工程化改造对细胞膜的结构修饰或者提高C6结构单元的任何关联转运蛋白活性增强或放大C6结构单元穿过细胞膜到胞外介质的流出。

六亚甲基二胺的流出可以通过过表达广泛底物范围多药物转运体来提高或放大,如来自枯草芽孢杆菌的Blt(Woolridge等,1997,J.Biol.Chem.,272(14):8864–8866);来自大肠杆菌的AcrB和AcrD(Elkins&Nikaido,2002,J.Bacteriol.,184(23),6490–6499)或来自金黄色葡萄球菌的NorA(Ng等,1994,Antimicrob Agents Chemother,38(6),1345–1355)或来自枯草芽孢杆菌的Bmr(Neyfakh,1992,Antimicrob Agents Chemother,36(2),484–485)。

6-氨基己酸和六亚甲基二胺的流出可以通过过表达溶质转运体来提高或放大,如来自于谷氨酸棒状杆菌的lysE转运体(Bellmann等,2001,Microbiology,147,1765–1774)。

己二酸的流出可以通过过表达二羧酸转运体来提高或放大,如来自于谷氨酸棒状杆菌的SucE转运体(Huhn等,Appl.Microbiol.&Biotech.,89(2),327–335)。

使用重组宿主生产C6结构单元

通常,可以通过提供宿主微生物并且用含有如上文描述的合适碳源的培养基培养提供的微生物生成一种或多种C6结构单元。一般地,培养基和/或培养条件可以使得微生物生长至足够的密度,并且有效生成C6结构单元。对于大规模生产工艺,可以使用任何方法,诸如那些在别处描述的(Manual of Industrial Microbiology and Biotechnology,2nd Edition,Editors:A.L.Demain and J.E.Davies,ASM Press;and Principles of Fermentation Technology,P.F.Stanbury and A.Whitaker,Pergamon)。简言之,用特定的微生物接种含有合适培养基的大罐(例如,100加仑,200加仑,500加仑,或更大的罐)。在接种后,温育微生物以容许生成生物量。一旦达到期望的生物量,可以将含有微生物的培养液转移到第二个罐。此第二个罐可以是任何大小。例如,第二个罐可以比/与第一个罐大、小或相同大小。通常,第二个罐大于第一个,从而可以对来自第一个罐的培养液添加额外的培养基。另外,此第二个罐内的培养基可以与第一个罐中使用的培养基相同或不同。

一旦转移,可以温育微生物以容许生成C6结构单元。一旦生成,可以使用任何方法来分离C6结构单元。例如,可以经由吸附方法从发酵液选择性回收C6结构单元。在己二酸和6-氨基己酸的情况中,所得的洗脱液可以经由蒸发进一步浓缩,经由蒸发和/或冷却结晶来结晶,并且经由离心回收晶体。在六亚甲基二胺和1,6-己二醇的情况中,可以采用蒸馏来实现期望的产物纯度。

本发明在以下实施例中进一步描述,所述实施例不限制权利要求书中描述的本发明范围。

实施例

实施例1

在形成6-羟基己酸中使用己酸作为底物的CYP153单加氧酶的酶活性

将编码HIS标签的核苷酸序列添加到单胞菌属物种JS666,分支杆菌属物种HXN-1500和南非分支杆菌基因,其分别编码(1)单加氧酶(SEQ ID NO:16-18),(2)相关的铁氧还原蛋白还原酶配偶体(SEQ ID NO:19-20)和物种的铁氧还原蛋白(SEQ ID NO:21-22)。对于南非分枝杆菌单加氧酶,使用分支杆菌属物种HXN-1500氧化还原酶和铁氧还原蛋白配偶体。将编码蛋白配偶体的三种经修饰的核酸序列克隆到pgBlue表达载体中,在杂交体pTac启动子下。将每种表达载体转化到BL21[DE3]大肠杆菌宿主中。将每种所得重组大肠杆菌菌株在含有50mL LB培养基和抗生素选择压力的500mL摇瓶培养物中在37℃下培养。使用1mM IPTG在28℃下诱导每种培养物24小时。

通过离心收集来自每个诱导的摇瓶培养物的团粒。将每个团粒重悬浮,并使用Y-perTM溶液(ThermoScientific,Rockford,IL)在室温下通透细胞20分钟。将经通透的细胞在Y-perTM溶液中保持在0℃。

在由最终浓度为25mM磷酸钾缓冲液(pH=7.8),1.7mM MgSO4,,2.5mM NADPH和30mM己酸盐组成的缓冲液中进行酶活性测定。通过将悬浮在Y-perTM溶液中的固定质量的湿细胞重量的通透细胞加入到含有庚酸盐的测定缓冲液中起始每个酶活性测定反应,然后在加热块振荡器中在28℃下以1400rpm振荡温育24小时。通过LC-MS定量7-羟基庚酸的形成。

如针对空载体对照所确认的,SEQ ID NO 16-18的单加氧酶基因产物连同还原酶和铁氧还原蛋白配偶体,接受己酸作为底物(见图20)并合成6-羟基己酸作为反应产物。

实施例2

使用己二酸半醛作为底物并且形成6-氨基己酸的ω-转氨酶的酶活性

将编码His标签的核苷酸序列添加至分别编码SEQ ID NO:8、9、10、11和13的ω-转氨酶的来自紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、和河流弧菌的基因(见图12),使得可以产生N-末端有HIS标签的ω-转氨酶。将每种所得的经修饰基因克隆到pET21a表达载体中在T7启动子的控制下,并且将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。将所得重组大肠杆菌菌株在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在37℃下培养,以230rpm振荡。使用1mM IPTG于16℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒粒并经由超声处理裂解。经由离心分开细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。

在缓冲液中实施逆向(即6-氨基己酸至己二酸半醛)的酶活性测定法,所述缓冲液由终浓度为50mM HEPES缓冲液(pH=7.5)、10mM 6-氨基己酸、10mM丙酮酸和100μM吡哆(pyridoxyl)5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有6-氨基己酸的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育24小时。经由RP-HPLC量化从丙酮酸形成L-丙氨酸。

每种没有6-氨基己酸的仅酶对照表明丙酮酸至L-丙氨酸的低基线转化。参见图14。如相对于空载体对照所确认的,SEQ ID NO 8、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的基因产物接受6-氨基己酸作为底物。见图15。

对SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的转氨酶确认正向(即己二酸半醛至6-氨基己酸)的酶反应。在缓冲液中实施酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM己二酸半醛、10mM L-丙氨酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有己二酸半醛的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化丙酮酸的形成。

如相对于空载体对照所确认的,SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的转氨酶接受己二酸半醛作为底物。参 见图16。确认了ω-转氨酶活性的可逆性,证明了SEQ ID NO 8、SEQ ID NO 9、SEQ ID NO 10、SEQ ID NO 11和SEQ ID NO 13的ω-转氨酶接受己二酸半醛作为底物,并且合成6-氨基己酸作为反应产物。

实施例3

羧酸还原酶使用己二酸作为底物并形成己二酸半醛的酶活性

将编码HIS标签的核苷酸序列添加至分别编码SEQ ID NO:5和7的羧酸还原酶的来自Segniliparus rugosus和Segniliparus rotundus的基因(参见图21),使得可以生成N-末端有HIS标签的羧酸还原酶。将每种经修饰的基因与编码有HIS标签的来自枯草芽孢杆菌的磷酸泛酰巯基乙胺基转移酶的sfp基因一起克隆入pET Duet表达载体中,两者都在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主,并且于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养所得的重组大肠杆菌菌株。使用自诱导培养基于37℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒和经由超声处理裂解,并经由离心分离细胞碎片与上清液。使用Ni-亲和层析从上清液中纯化羧酸还原酶和磷酸泛酰巯基乙胺基转移酶,以10倍稀释入50mM HEPES缓冲液(pH=7.5)中,并经由超滤浓缩。

在缓冲液中一式三份实施酶活性测定法(即从己二酸至己二酸半醛),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM己二酸、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶基因产物或空载体对照至含有己二酸的测定缓冲液起始每个酶活性测定反应,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有己二酸的仅酶对照表明NADPH的低基线消耗。见图9。

如相对于空载体对照所确认的,SEQ ID NO 5和SEQ ID NO 7的基因产物,由sfp的基因产物增强,接受己二酸作为底物(参见图10),并且合成己二酸半醛。

实施例4

羧酸还原酶使用6-羟基己酸作为底物并形成6-羟基己醛的酶活性

将编码His标签的核苷酸序列添加至分别编码SEQ ID NO:3-7的羧酸还原酶的来自海分枝杆菌、耻垢分枝杆菌、耻垢分枝杆菌、Segniliparus rugosus、马赛分枝杆菌和Segniliparus rotundus的基因(见图21),使得可以生成N-末端有HIS标签的羧酸还原酶。将每种经修饰的基因与编码有His标签的来自枯草芽孢杆菌的磷酸泛酰巯基乙胺基转移酶的sfp基因一起克隆入pET Duet表达载体中,两者都在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养所得的每种重组大肠杆菌菌株。使用自诱导培养基于37℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液。使用Ni-亲和层析从上清液中纯化羧酸还原酶和磷酸泛酰巯基乙胺基转移酶,以10倍稀释入50mM HEPES缓冲液(pH=7.5)中,并经由超滤浓缩。

在缓冲液中一式三份实施酶活性测定法(即从6-羟基己酸至6-羟基己醛),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM 6-羟基己醛、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有6-羟基己酸的测定缓冲液启动每个酶活性测定反应,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有6-羟基己酸的仅酶对照表明NADPH的低基线消耗。参见图9。

如相对于空载体对照确认的,SEQ ID NO 3-7的基因产物,由sfp的基因产物增强,接受6-羟基己酸作为底物(参见图11),并合成6-羟基己醛。

实施例5

ω-转氨酶对于6-氨基己醇,形成6-氧代己醇的酶活性

将编码N-末端His标签的核苷酸序列添加至分别编码SEQ ID NO:8-13的ω-转氨酶的来自紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、大肠杆菌和河流弧菌基因(参见图21),使得可以产生N-末端有HIS标签的ω-转氨酶。将经修饰基因克隆至pET21a表达载体中,在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养每种所得的重组大肠杆菌菌株。使用1mM IPTG于16℃诱导每种培养物过夜。

经由离心收获来自每种经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。

在缓冲液中实施逆向(即6-氨基己醇至6-氧代己醇)的酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM 6-氨基己醇、10 mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有6-氨基己醇的测定缓冲液启动每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化L-丙氨酸形成。

每个没有6-氨基己醇的仅酶对照具有丙酮酸至L-丙氨酸的低基线转化。参见图14。

如相对于空载体对照所确认的,SEQ ID NO 8-13的基因产物接受6-氨基己醇作为底物,并合成6-氧代己醇作为反应产物。鉴于ω-转氨酶活性的可逆性(参见实施例2),可以推断SEQ ID 8-13的基因产物接受6-氨基己醇作为底物,并形成6-氧代己醇。

实施例6

ω-转氨酶使用六亚甲基二胺作为底物并形成6-氨基己醛的酶活性

将编码N-末端His标签的核苷酸序列添加至分别编码SEQ ID NO:8-13的ω-转氨酶的紫色色杆菌、铜绿假单胞菌、丁香假单胞菌、球形红杆菌、大肠杆菌、和河流弧菌基因(参见图21),使得可以产生N-末端有HIS标签的ω-转氨酶。将经修饰的基因克隆至pET21a表达载体中,在T7启动子下。将每种表达载体转化入BL21[DE3]大肠杆菌宿主中。于37℃在含有50mL LB培养基和抗生素选择压力的250mL摇瓶培养物中在以230rpm振荡的情况中培养每种所得的重组大肠杆菌菌株。使用1mM IPTG于16℃诱导每种培养物过夜。

经由离心收获来自每个经诱导的摇瓶培养物的团粒。重悬每个团粒,并经由超声处理裂解。经由离心分离细胞碎片与上清液,并且立即在酶活性测定法中使用无细胞提取物。

在缓冲液中实施逆向(即六亚甲基二胺至6-氨基己醛)的酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM六亚甲基二胺、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶基因产物或空载体对照的无细胞提取物到含有六亚甲基二胺的测定缓冲液起始每个酶活性测定反应,并在以250rpm振荡的情况下于25℃温育4小时。经由RP-HPLC量化L-丙氨酸的形成。

每个没有六亚甲基二胺的仅酶对照具有丙酮酸至L-丙氨酸的低基线转化。参见图14。

如相对于空载体对照所确认的,SEQ ID NO 8-13的基因产物接受六亚甲基二胺作为底物(参见图17),并合成6-氨基己醛作为反应产物。鉴于ω-转氨酶活性的可逆性(参见实施例2),可以推断SEQ ID 8–13的基因产物接受6-氨基己醛作为底物,并形成六亚甲基二胺。

实施例7

羧酸还原酶对于N6-乙酰-6-氨基己酸,形成N6-乙酰-6-氨基己醛的酶活性

一式三份在缓冲液中测定用于将N6-乙酰-6-氨基己酸转化成N6-乙酰-6-氨基己醛的N末端有His标签的SEQ ID NO:5-7的羧酸还原酶的活性(参见实施例4,和图21),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM N6-乙酰-6-氨基己酸、10mM MgCl2、1mM ATP、和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有N6-乙酰-6-氨基己酸的测定缓冲液起始测定,然后于室温温育20分钟。通过于340nm的吸光度监测NADPH的消耗。每种没有N6-乙酰-6-氨基己酸的仅酶对照表明NADPH的低基线消耗。参见图9。

如相对于空载体对照所确认的,SEQ ID NO 5-7的基因产物,由sfp的基因产物增强,接受N6-乙酰-6-氨基己酸作为底物(参见图12),并合成N6-乙酰-6-氨基己醛。

实施例8

ω-转氨酶使用N6-乙酰-1,6-二氨基己烷并形成N6-乙酰-6-氨基己醛的酶活性

在缓冲液中测定用于将N6-乙酰-1,6-二氨基己烷转化成N6-乙酰-6-氨基己醛的N末端有His标签的SEQ ID NO:8-13的ω-转氨酶的活性(参见实施例6,及图21),所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、10mM N6-乙酰-1,6-二氨基己烷、10mM丙酮酸和100μM吡哆5’磷酸盐组成。通过添加ω-转氨酶或空载体对照的无细胞提取物至含有N6-乙酰-1,6-二氨基己烷的测定缓冲液起始每个酶活性测定反应,然后在250rpm振荡的情况下于25℃温育4h。经由RP-HPLC量化L-丙氨酸的形成。

每个没有N6-乙酰-1,6-二氨基己烷的仅酶对照表明丙酮酸至L-丙氨酸的低基线转化。参见图14。

如相对于空载体对照所确认的,SEQ ID NO:8–13的基因产物接受N6-乙酰-1,6-二氨基己烷作为底物(参见图18),并合成N6-乙酰-6-氨基己醛作为反应产物。

鉴于ω-转氨酶活性的可逆性(参见实施例2),SEQ ID NO:8-13的基因产物接受N6-乙酰-6-氨基己醛作为底物,形成N6-乙酰-1,6-二氨基己烷。

实施例9:羧酸还原酶使用己二酸半醛作为底物并形成己二醛的酶活性

使用己二酸半醛作为底物测定N-末端有His标签的SEQ ID NO 7的羧酸还原酶(参见实施例4和图21)。一式三份在缓冲液中实施酶活性测定法,所述缓冲液由终浓度50mM HEPES缓冲液(pH=7.5)、2mM己二酸半醛、10mM MgCl2、1mM ATP和1mM NADPH组成。通过添加纯化的羧酸还原酶和磷酸泛酰巯基乙胺基转移酶或空载体对照至含有己二酸半醛的测定缓冲液起始测定,然后于室温温育20分钟。通过340nm的吸光度监测NADPH的消耗。每种没有己二酸半醛的仅酶对照表明NADPH的低基线消耗。参见图9。

如相对于空载体对照所确认的,SEQ ID NO 7的基因产物,由sfp的基因产物增强,接受己二酸半醛作为底物(参见图13),并合成己二醛。

其它实施例

应当理解,虽然已经结合其详细描述描述了本发明,但是前面的描述旨在说明而不是限制由所附权利要求的范围限定的本发明的范围。其他方面,优点和修改在所附权利要求的范围内。

序列表

<110> 英威达技术有限责任公司.

<120> 通过氧化切割从长链脂肪酸生产6-碳化学物的方法

<130> 35643-0030WO1

<150> US 61/992,794

<151> 2014-05-13

<160> 23

<170> FastSEQ for Windows Version 4.0

<210> 1

<211> 246

<212> PRT

<213> 短乳杆菌

<400> 1

Met Ala Ala Asn Glu Phe Ser Glu Thr His Arg Val Val Tyr Tyr Glu

1 5 10 15

Ala Asp Asp Thr Gly Gln Leu Thr Leu Ala Met Leu Ile Asn Leu Phe

20 25 30

Val Leu Val Ser Glu Asp Gln Asn Asp Ala Leu Gly Leu Ser Thr Ala

35 40 45

Phe Val Gln Ser His Gly Val Gly Trp Val Val Thr Gln Tyr His Leu

50 55 60

His Ile Asp Glu Leu Pro Arg Thr Gly Ala Gln Val Thr Ile Lys Thr

65 70 75 80

Arg Ala Thr Ala Tyr Asn Arg Tyr Phe Ala Tyr Arg Glu Tyr Trp Leu

85 90 95

Leu Asp Asp Ala Gly Gln Val Leu Ala Tyr Gly Glu Gly Ile Trp Val

100 105 110

Thr Met Ser Tyr Ala Thr Arg Lys Ile Thr Thr Ile Pro Ala Glu Val

115 120 125

Met Ala Pro Tyr His Ser Glu Glu Gln Thr Arg Leu Pro Arg Leu Pro

130 135 140

Arg Pro Asp His Phe Asp Glu Ala Val Asn Gln Thr Leu Lys Pro Tyr

145 150 155 160

Thr Val Arg Tyr Phe Asp Ile Asp Gly Asn Gly His Val Asn Asn Ala

165 170 175

His Tyr Phe Asp Trp Met Leu Asp Val Leu Pro Ala Thr Phe Leu Arg

180 185 190

Ala His His Pro Thr Asp Val Lys Ile Arg Phe Glu Asn Glu Val Gln

195 200 205

Tyr Gly His Gln Val Thr Ser Glu Leu Ser Gln Ala Ala Ala Leu Thr

210 215 220

Thr Gln His Met Ile Lys Val Gly Asp Leu Thr Ala Val Lys Ala Thr

225 230 235 240

Ile Gln Trp Asp Asn Arg

245

<210> 2

<211> 261

<212> PRT

<213> 植物乳杆菌

<400> 2

Met Ala Thr Leu Gly Ala Asn Ala Ser Leu Tyr Ser Glu Gln His Arg

1 5 10 15

Ile Thr Tyr Tyr Glu Cys Asp Arg Thr Gly Arg Ala Thr Leu Thr Thr

20 25 30

Leu Ile Asp Ile Ala Val Leu Ala Ser Glu Asp Gln Ser Asp Ala Leu

35 40 45

Gly Leu Thr Thr Glu Met Val Gln Ser His Gly Val Gly Trp Val Val

50 55 60

Thr Gln Tyr Ala Ile Asp Ile Thr Arg Met Pro Arg Gln Asp Glu Val

65 70 75 80

Val Thr Ile Ala Val Arg Gly Ser Ala Tyr Asn Pro Tyr Phe Ala Tyr

85 90 95

Arg Glu Phe Trp Ile Arg Asp Ala Asp Gly Gln Gln Leu Ala Tyr Ile

100 105 110

Thr Ser Ile Trp Val Met Met Ser Gln Thr Thr Arg Arg Ile Val Lys

115 120 125

Ile Leu Pro Glu Leu Val Ala Pro Tyr Gln Ser Glu Val Val Lys Arg

130 135 140

Ile Pro Arg Leu Pro Arg Pro Ile Ser Phe Glu Ala Thr Asp Thr Thr

145 150 155 160

Ile Thr Lys Pro Tyr His Val Arg Phe Phe Asp Ile Asp Pro Asn Arg

165 170 175

His Val Asn Asn Ala His Tyr Phe Asp Trp Leu Val Asp Thr Leu Pro

180 185 190

Ala Thr Phe Leu Leu Gln His Asp Leu Val His Val Asp Val Arg Tyr

195 200 205

Glu Asn Glu Val Lys Tyr Gly Gln Thr Val Thr Ala His Ala Asn Ile

210 215 220

Leu Pro Ser Glu Val Ala Asp Gln Val Thr Thr Ser His Leu Ile Glu

225 230 235 240

Val Asp Asp Glu Lys Cys Cys Glu Val Thr Ile Gln Trp Arg Thr Leu

245 250 255

Pro Glu Pro Ile Gln

260

<210> 3

<211> 1174

<212> PRT

<213> 海鱼分枝杆菌

<400> 3

Met Ser Pro Ile Thr Arg Glu Glu Arg Leu Glu Arg Arg Ile Gln Asp

1 5 10 15

Leu Tyr Ala Asn Asp Pro Gln Phe Ala Ala Ala Lys Pro Ala Thr Ala

20 25 30

Ile Thr Ala Ala Ile Glu Arg Pro Gly Leu Pro Leu Pro Gln Ile Ile

35 40 45

Glu Thr Val Met Thr Gly Tyr Ala Asp Arg Pro Ala Leu Ala Gln Arg

50 55 60

Ser Val Glu Phe Val Thr Asp Ala Gly Thr Gly His Thr Thr Leu Arg

65 70 75 80

Leu Leu Pro His Phe Glu Thr Ile Ser Tyr Gly Glu Leu Trp Asp Arg

85 90 95

Ile Ser Ala Leu Ala Asp Val Leu Ser Thr Glu Gln Thr Val Lys Pro

100 105 110

Gly Asp Arg Val Cys Leu Leu Gly Phe Asn Ser Val Asp Tyr Ala Thr

115 120 125

Ile Asp Met Thr Leu Ala Arg Leu Gly Ala Val Ala Val Pro Leu Gln

130 135 140

Thr Ser Ala Ala Ile Thr Gln Leu Gln Pro Ile Val Ala Glu Thr Gln

145 150 155 160

Pro Thr Met Ile Ala Ala Ser Val Asp Ala Leu Ala Asp Ala Thr Glu

165 170 175

Leu Ala Leu Ser Gly Gln Thr Ala Thr Arg Val Leu Val Phe Asp His

180 185 190

His Arg Gln Val Asp Ala His Arg Ala Ala Val Glu Ser Ala Arg Glu

195 200 205

Arg Leu Ala Gly Ser Ala Val Val Glu Thr Leu Ala Glu Ala Ile Ala

210 215 220

Arg Gly Asp Val Pro Arg Gly Ala Ser Ala Gly Ser Ala Pro Gly Thr

225 230 235 240

Asp Val Ser Asp Asp Ser Leu Ala Leu Leu Ile Tyr Thr Ser Gly Ser

245 250 255

Thr Gly Ala Pro Lys Gly Ala Met Tyr Pro Arg Arg Asn Val Ala Thr

260 265 270

Phe Trp Arg Lys Arg Thr Trp Phe Glu Gly Gly Tyr Glu Pro Ser Ile

275 280 285

Thr Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gln Ile Leu

290 295 300

Tyr Gly Thr Leu Cys Asn Gly Gly Thr Ala Tyr Phe Val Ala Lys Ser

305 310 315 320

Asp Leu Ser Thr Leu Phe Glu Asp Leu Ala Leu Val Arg Pro Thr Glu

325 330 335

Leu Thr Phe Val Pro Arg Val Trp Asp Met Val Phe Asp Glu Phe Gln

340 345 350

Ser Glu Val Asp Arg Arg Leu Val Asp Gly Ala Asp Arg Val Ala Leu

355 360 365

Glu Ala Gln Val Lys Ala Glu Ile Arg Asn Asp Val Leu Gly Gly Arg

370 375 380

Tyr Thr Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Asp Glu Met Lys

385 390 395 400

Ala Trp Val Glu Glu Leu Leu Asp Met His Leu Val Glu Gly Tyr Gly

405 410 415

Ser Thr Glu Ala Gly Met Ile Leu Ile Asp Gly Ala Ile Arg Arg Pro

420 425 430

Ala Val Leu Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe

435 440 445

Leu Thr Asp Arg Pro His Pro Arg Gly Glu Leu Leu Val Lys Thr Asp

450 455 460

Ser Leu Phe Pro Gly Tyr Tyr Gln Arg Ala Glu Val Thr Ala Asp Val

465 470 475 480

Phe Asp Ala Asp Gly Phe Tyr Arg Thr Gly Asp Ile Met Ala Glu Val

485 490 495

Gly Pro Glu Gln Phe Val Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys

500 505 510

Leu Ser Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe

515 520 525

Gly Asp Ser Pro Leu Val Arg Gln Ile Tyr Ile Tyr Gly Asn Ser Ala

530 535 540

Arg Ala Tyr Leu Leu Ala Val Ile Val Pro Thr Gln Glu Ala Leu Asp

545 550 555 560

Ala Val Pro Val Glu Glu Leu Lys Ala Arg Leu Gly Asp Ser Leu Gln

565 570 575

Glu Val Ala Lys Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp

580 585 590

Phe Ile Ile Glu Thr Thr Pro Trp Thr Leu Glu Asn Gly Leu Leu Thr

595 600 605

Gly Ile Arg Lys Leu Ala Arg Pro Gln Leu Lys Lys His Tyr Gly Glu

610 615 620

Leu Leu Glu Gln Ile Tyr Thr Asp Leu Ala His Gly Gln Ala Asp Glu

625 630 635 640

Leu Arg Ser Leu Arg Gln Ser Gly Ala Asp Ala Pro Val Leu Val Thr

645 650 655

Val Cys Arg Ala Ala Ala Ala Leu Leu Gly Gly Ser Ala Ser Asp Val

660 665 670

Gln Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala

675 680 685

Leu Ser Phe Thr Asn Leu Leu His Glu Ile Phe Asp Ile Glu Val Pro

690 695 700

Val Gly Val Ile Val Ser Pro Ala Asn Asp Leu Gln Ala Leu Ala Asp

705 710 715 720

Tyr Val Glu Ala Ala Arg Lys Pro Gly Ser Ser Arg Pro Thr Phe Ala

725 730 735

Ser Val His Gly Ala Ser Asn Gly Gln Val Thr Glu Val His Ala Gly

740 745 750

Asp Leu Ser Leu Asp Lys Phe Ile Asp Ala Ala Thr Leu Ala Glu Ala

755 760 765

Pro Arg Leu Pro Ala Ala Asn Thr Gln Val Arg Thr Val Leu Leu Thr

770 775 780

Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu

785 790 795 800

Arg Met Asp Leu Val Asp Gly Lys Leu Ile Cys Leu Val Arg Ala Lys

805 810 815

Ser Asp Thr Glu Ala Arg Ala Arg Leu Asp Lys Thr Phe Asp Ser Gly

820 825 830

Asp Pro Glu Leu Leu Ala His Tyr Arg Ala Leu Ala Gly Asp His Leu

835 840 845

Glu Val Leu Ala Gly Asp Lys Gly Glu Ala Asp Leu Gly Leu Asp Arg

850 855 860

Gln Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Leu Ile Val Asp Pro

865 870 875 880

Ala Ala Leu Val Asn His Val Leu Pro Tyr Ser Gln Leu Phe Gly Pro

885 890 895

Asn Ala Leu Gly Thr Ala Glu Leu Leu Arg Leu Ala Leu Thr Ser Lys

900 905 910

Ile Lys Pro Tyr Ser Tyr Thr Ser Thr Ile Gly Val Ala Asp Gln Ile

915 920 925

Pro Pro Ser Ala Phe Thr Glu Asp Ala Asp Ile Arg Val Ile Ser Ala

930 935 940

Thr Arg Ala Val Asp Asp Ser Tyr Ala Asn Gly Tyr Ser Asn Ser Lys

945 950 955 960

Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys Gly Leu

965 970 975

Pro Val Ala Val Phe Arg Cys Asp Met Ile Leu Ala Asp Thr Thr Trp

980 985 990

Ala Gly Gln Leu Asn Val Pro Asp Met Phe Thr Arg Met Ile Leu Ser

995 1000 1005

Leu Ala Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Glu Leu Ala Ala

1010 1015 1020

Asp Gly Ala Arg Gln Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe

1025 1030 1035 1040

Ile Ala Glu Ala Ile Ser Thr Leu Gly Ala Gln Ser Gln Asp Gly Phe

1045 1050 1055

His Thr Tyr His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp

1060 1065 1070

Glu Phe Val Asp Trp Leu Asn Glu Ser Gly Cys Pro Ile Gln Arg Ile

1075 1080 1085

Ala Asp Tyr Gly Asp Trp Leu Gln Arg Phe Glu Thr Ala Leu Arg Ala

1090 1095 1100

Leu Pro Asp Arg Gln Arg His Ser Ser Leu Leu Pro Leu Leu His Asn

1105 1110 1115 1120

Tyr Arg Gln Pro Glu Arg Pro Val Arg Gly Ser Ile Ala Pro Thr Asp

1125 1130 1135

Arg Phe Arg Ala Ala Val Gln Glu Ala Lys Ile Gly Pro Asp Lys Asp

1140 1145 1150

Ile Pro His Val Gly Ala Pro Ile Ile Val Lys Tyr Val Ser Asp Leu

1155 1160 1165

Arg Leu Leu Gly Leu Leu

1170

<210> 4

<211> 1173

<212> PRT

<213> 耻垢分枝杆菌

<400> 4

Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala

1 5 10 15

Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr

20 25 30

Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala

35 40 45

Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe

50 55 60

Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu

65 70 75 80

Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe

85 90 95

Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala

100 105 110

Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala

115 120 125

Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu

130 135 140

Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala

145 150 155 160

Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile

165 170 175

Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg

180 185 190

Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu

195 200 205

Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala

210 215 220

Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly

225 230 235 240

Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg

245 250 255

Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly

260 265 270

Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe

275 280 285

Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu

290 295 300

Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly

305 310 315 320

Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu

325 330 335

Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val

340 345 350

Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val

355 360 365

Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu

370 375 380

Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser

385 390 395 400

Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu

405 410 415

Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val

420 425 430

Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu

435 440 445

Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro

450 455 460

Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr

465 470 475 480

Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr

485 490 495

His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr

500 505 510

Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val

515 520 525

Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg

530 535 540

Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val

545 550 555 560

Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu

565 570 575

Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu

580 585 590

Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro

595 600 605

Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg

610 615 620

Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala

625 630 635 640

Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala

645 650 655

Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr

660 665 670

Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp

675 680 685

Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser

690 695 700

Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala

705 710 715 720

Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala

725 730 735

Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr

740 745 750

Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu

755 760 765

Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg

770 775 780

Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr

785 790 795 800

Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr

805 810 815

Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln

820 825 830

Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala

835 840 845

Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu

850 855 860

Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu

865 870 875 880

Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln

885 890 895

Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala

900 905 910

Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val

915 920 925

Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val

930 935 940

Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn

945 950 955 960

Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys

965 970 975

Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro

980 985 990

Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu

995 1000 1005

Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile Gly

1010 1015 1020

Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val Asp Phe

1025 1030 1035 1040

Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg Glu Gly Tyr

1045 1050 1055

Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly Ile Ser Leu Asp

1060 1065 1070

Val Phe Val Asp Trp Leu Ile Arg Ala Gly His Pro Ile Asp Arg Val

1075 1080 1085

Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe Glu Thr Ala Leu Thr Ala

1090 1095 1100

Leu Pro Glu Lys Arg Arg Ala Gln Thr Val Leu Pro Leu Leu His Ala

1105 1110 1115 1120

Phe Arg Ala Pro Gln Ala Pro Leu Arg Gly Ala Pro Glu Pro Thr Glu

1125 1130 1135

Val Phe His Ala Ala Val Arg Thr Ala Lys Val Gly Pro Gly Asp Ile

1140 1145 1150

Pro His Leu Asp Glu Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg

1155 1160 1165

Glu Phe Gly Leu Ile

1170

<210> 5

<211> 1148

<212> PRT

<213> Segniliparus rugosus

<400> 5

Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly

1 5 10 15

Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro

20 25 30

Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr

35 40 45

Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His

50 55 60

Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala

65 70 75 80

Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro

85 90 95

Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala

100 105 110

Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln

115 120 125

Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu

130 135 140

Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala

145 150 155 160

Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu

165 170 175

Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala

180 185 190

Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val

195 200 205

Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu

210 215 220

Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu

225 230 235 240

Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser

245 250 255

Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly

260 265 270

Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly

275 280 285

Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe

290 295 300

Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala

305 310 315 320

Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe

325 330 335

Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val

340 345 350

Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser

355 360 365

Pro Glu Met Arg Ala Phe Met Glu Glu Val Leu Gly Phe Pro Leu Leu

370 375 380

Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile

385 390 395 400

Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu

405 410 415

Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys

420 425 430

Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile

435 440 445

Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val

450 455 460

Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys

465 470 475 480

Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu

485 490 495

Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr

500 505 510

Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala

515 520 525

Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala

530 535 540

Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu

545 550 555 560

Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn

565 570 575

Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala

580 585 590

Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly

595 600 605

Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Gly Ala Gly Gln Arg Pro

610 615 620

Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu

625 630 635 640

Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp

645 650 655

Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu

660 665 670

Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala

675 680 685

Gly Ile Ala Lys His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro

690 695 700

Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser

705 710 715 720

Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala

725 730 735

Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly

740 745 750

Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg

755 760 765

Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg

770 775 780

Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly

785 790 795 800

Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg

805 810 815

Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp

820 825 830

Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His

835 840 845

Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly

850 855 860

Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala

865 870 875 880

Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly

885 890 895

Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val

900 905 910

Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser

915 920 925

Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly

930 935 940

Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg

945 950 955 960

Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu

965 970 975

Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly

980 985 990

Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp

995 1000 1005

Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp Phe

1010 1015 1020

Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro His His

1025 1030 1035 1040

Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile Glu Ala Gly

1045 1050 1055

His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp Phe Ala Arg Phe

1060 1065 1070

Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln Arg Gln His Ser Leu

1075 1080 1085

Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro His Pro Pro Val Asp Gly

1090 1095 1100

Ser Val Tyr Pro Thr Gly Lys Phe Gln Gly Ala Val Lys Ala Ala Gln

1105 1110 1115 1120

Val Gly Ser Asp His Asp Val Pro His Leu Gly Lys Ala Leu Ile Val

1125 1130 1135

Lys Tyr Ala Asp Asp Leu Lys Ala Leu Gly Leu Leu

1140 1145

<210> 6

<211> 1185

<212> PRT

<213> Mycobacterium massiliense

<400> 6

Met Thr Asn Glu Thr Asn Pro Gln Gln Glu Gln Leu Ser Arg Arg Ile

1 5 10 15

Glu Ser Leu Arg Glu Ser Asp Pro Gln Phe Arg Ala Ala Gln Pro Asp

20 25 30

Pro Ala Val Ala Glu Gln Val Leu Arg Pro Gly Leu His Leu Ser Glu

35 40 45

Ala Ile Ala Ala Leu Met Thr Gly Tyr Ala Glu Arg Pro Ala Leu Gly

50 55 60

Glu Arg Ala Arg Glu Leu Val Ile Asp Gln Asp Gly Arg Thr Thr Leu

65 70 75 80

Arg Leu Leu Pro Arg Phe Asp Thr Thr Thr Tyr Gly Glu Leu Trp Ser

85 90 95

Arg Thr Thr Ser Val Ala Ala Ala Trp His His Asp Ala Thr His Pro

100 105 110

Val Lys Ala Gly Asp Leu Val Ala Thr Leu Gly Phe Thr Ser Ile Asp

115 120 125

Tyr Thr Val Leu Asp Leu Ala Ile Met Ile Leu Gly Gly Val Ala Val

130 135 140

Pro Leu Gln Thr Ser Ala Pro Ala Ser Gln Trp Thr Thr Ile Leu Ala

145 150 155 160

Glu Ala Glu Pro Asn Thr Leu Ala Val Ser Ile Glu Leu Ile Gly Ala

165 170 175

Ala Met Glu Ser Val Arg Ala Thr Pro Ser Ile Lys Gln Val Val Val

180 185 190

Phe Asp Tyr Thr Pro Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala

195 200 205

Ala Ser Thr Gln Leu Ala Gly Thr Gly Ile Ala Leu Glu Thr Leu Asp

210 215 220

Ala Val Ile Ala Arg Gly Ala Ala Leu Pro Ala Ala Pro Leu Tyr Ala

225 230 235 240

Pro Ser Ala Gly Asp Asp Pro Leu Ala Leu Leu Ile Tyr Thr Ser Gly

245 250 255

Ser Thr Gly Ala Pro Lys Gly Ala Met His Ser Glu Asn Ile Val Arg

260 265 270

Arg Trp Trp Ile Arg Glu Asp Val Met Ala Gly Thr Glu Asn Leu Pro

275 280 285

Met Ile Gly Leu Asn Phe Met Pro Met Ser His Ile Met Gly Arg Gly

290 295 300

Thr Leu Thr Ser Thr Leu Ser Thr Gly Gly Thr Gly Tyr Phe Ala Ala

305 310 315 320

Ser Ser Asp Met Ser Thr Leu Phe Glu Asp Met Glu Leu Ile Arg Pro

325 330 335

Thr Ala Leu Ala Leu Val Pro Arg Val Cys Asp Met Val Phe Gln Arg

340 345 350

Phe Gln Thr Glu Val Asp Arg Arg Leu Ala Ser Gly Asp Thr Ala Ser

355 360 365

Ala Glu Ala Val Ala Ala Glu Val Lys Ala Asp Ile Arg Asp Asn Leu

370 375 380

Phe Gly Gly Arg Val Ser Ala Val Met Val Gly Ser Ala Pro Leu Ser

385 390 395 400

Glu Glu Leu Gly Glu Phe Ile Glu Ser Cys Phe Glu Leu Asn Leu Thr

405 410 415

Asp Gly Tyr Gly Ser Thr Glu Ala Gly Met Val Phe Arg Asp Gly Ile

420 425 430

Val Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu

435 440 445

Leu Gly Tyr Phe Ser Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu

450 455 460

Leu Lys Thr Asp Gly Met Phe Leu Gly Tyr Tyr Lys Arg Pro Glu Val

465 470 475 480

Thr Ala Ser Val Phe Asp Ala Asp Gly Phe Tyr Met Thr Gly Asp Ile

485 490 495

Val Ala Glu Leu Ala His Asp Asn Ile Glu Ile Ile Asp Arg Arg Asn

500 505 510

Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Thr Leu

515 520 525

Glu Ala Glu Tyr Ala Asn Ser Pro Val Val His Gln Ile Tyr Val Tyr

530 535 540

Gly Ser Ser Glu Arg Ser Tyr Leu Leu Ala Val Val Val Pro Thr Pro

545 550 555 560

Glu Ala Val Ala Ala Ala Lys Gly Asp Ala Ala Ala Leu Lys Thr Thr

565 570 575

Ile Ala Asp Ser Leu Gln Asp Ile Ala Lys Glu Ile Gln Leu Gln Ser

580 585 590

Tyr Glu Val Pro Arg Asp Phe Ile Ile Glu Pro Gln Pro Phe Thr Gln

595 600 605

Gly Asn Gly Leu Leu Thr Gly Ile Ala Lys Leu Ala Arg Pro Asn Leu

610 615 620

Lys Ala His Tyr Gly Pro Arg Leu Glu Gln Met Tyr Ala Glu Ile Ala

625 630 635 640

Glu Gln Gln Ala Ala Glu Leu Arg Ala Leu His Gly Val Asp Pro Asp

645 650 655

Lys Pro Ala Leu Glu Thr Val Leu Lys Ala Ala Gln Ala Leu Leu Gly

660 665 670

Val Ser Ser Ala Glu Leu Ala Ala Asp Ala His Phe Thr Asp Leu Gly

675 680 685

Gly Asp Ser Leu Ser Ala Leu Ser Phe Ser Asp Leu Leu Arg Asp Ile

690 695 700

Phe Ala Val Glu Val Pro Val Gly Val Ile Val Ser Ala Ala Asn Asp

705 710 715 720

Leu Gly Gly Val Ala Lys Phe Val Asp Glu Gln Arg His Ser Gly Gly

725 730 735

Thr Arg Pro Thr Ala Glu Thr Val His Gly Ala Gly His Thr Glu Ile

740 745 750

Arg Ala Ala Asp Leu Thr Leu Asp Lys Phe Ile Asp Glu Ala Thr Leu

755 760 765

His Ala Ala Pro Ser Leu Pro Lys Ala Ala Gly Ile Pro His Thr Val

770 775 780

Leu Leu Thr Gly Ser Asn Gly Tyr Leu Gly His Tyr Leu Ala Leu Glu

785 790 795 800

Trp Leu Glu Arg Leu Asp Lys Thr Asp Gly Lys Leu Ile Val Ile Val

805 810 815

Arg Gly Lys Asn Ala Glu Ala Ala Tyr Gly Arg Leu Glu Glu Ala Phe

820 825 830

Asp Thr Gly Asp Thr Glu Leu Leu Ala His Phe Arg Ser Leu Ala Asp

835 840 845

Lys His Leu Glu Val Leu Ala Gly Asp Ile Gly Asp Pro Asn Leu Gly

850 855 860

Leu Asp Ala Asp Thr Trp Gln Arg Leu Ala Asp Thr Val Asp Val Ile

865 870 875 880

Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Asn Gln Leu

885 890 895

Phe Gly Pro Asn Val Val Gly Thr Ala Glu Ile Ile Lys Leu Ala Ile

900 905 910

Thr Thr Lys Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala

915 920 925

Ala Tyr Val Asp Pro Thr Thr Phe Asp Glu Glu Ser Asp Ile Arg Leu

930 935 940

Ile Ser Ala Val Arg Pro Ile Asp Asp Gly Tyr Ala Asn Gly Tyr Gly

945 950 955 960

Asn Ala Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu

965 970 975

Cys Gly Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His

980 985 990

Ser Arg Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu

995 1000 1005

Ile Leu Ser Leu Ile Ala Thr Gly Ile Ala Pro Gly Ser Phe Tyr Gln

1010 1015 1020

Ala Gln Thr Thr Gly Glu Arg Pro Leu Ala His Tyr Asp Gly Leu Pro

1025 1030 1035 1040

Gly Asp Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Thr Gln Val Pro

1045 1050 1055

Glu Gly Ser Glu Gly Phe Val Thr Tyr Asp Cys Val Asn Pro His Ala

1060 1065 1070

Asp Gly Ile Ser Leu Asp Asn Phe Val Asp Trp Leu Ile Glu Ala Gly

1075 1080 1085

Tyr Pro Ile Ala Arg Ile Asp Asn Tyr Thr Glu Trp Phe Thr Arg Phe

1090 1095 1100

Asp Thr Ala Ile Arg Gly Leu Ser Glu Lys Gln Lys Gln His Ser Leu

1105 1110 1115 1120

Leu Pro Leu Leu His Ala Phe Glu Gln Pro Ser Ala Ala Glu Asn His

1125 1130 1135

Gly Val Val Pro Ala Lys Arg Phe Gln His Ala Val Gln Ala Ala Gly

1140 1145 1150

Ile Gly Pro Val Gly Gln Asp Gly Thr Thr Asp Ile Pro His Leu Ser

1155 1160 1165

Arg Arg Leu Ile Val Lys Tyr Ala Lys Asp Leu Glu Gln Leu Gly Leu

1170 1175 1180

Leu

1185

<210> 7

<211> 1186

<212> PRT

<213> Segniliparus rotundus

<400> 7

Met Thr Gln Ser His Thr Gln Gly Pro Gln Ala Ser Ala Ala His Ser

1 5 10 15

Arg Leu Ala Arg Arg Ala Ala Glu Leu Leu Ala Thr Asp Pro Gln Ala

20 25 30

Ala Ala Thr Leu Pro Asp Pro Glu Val Val Arg Gln Ala Thr Arg Pro

35 40 45

Gly Leu Arg Leu Ala Glu Arg Val Asp Ala Ile Leu Ser Gly Tyr Ala

50 55 60

Asp Arg Pro Ala Leu Gly Gln Arg Ser Phe Gln Thr Val Lys Asp Pro

65 70 75 80

Ile Thr Gly Arg Ser Ser Val Glu Leu Leu Pro Thr Phe Asp Thr Ile

85 90 95

Thr Tyr Arg Glu Leu Arg Glu Arg Ala Thr Ala Ile Ala Ser Asp Leu

100 105 110

Ala His His Pro Gln Ala Pro Ala Lys Pro Gly Asp Phe Leu Ala Ser

115 120 125

Ile Gly Phe Ile Ser Val Asp Tyr Val Ala Ile Asp Ile Ala Gly Val

130 135 140

Phe Ala Gly Leu Thr Ala Val Pro Leu Gln Thr Gly Ala Thr Leu Ala

145 150 155 160

Thr Leu Thr Ala Ile Thr Ala Glu Thr Ala Pro Thr Leu Phe Ala Ala

165 170 175

Ser Ile Glu His Leu Pro Thr Ala Val Asp Ala Val Leu Ala Thr Pro

180 185 190

Ser Val Arg Arg Leu Leu Val Phe Asp Tyr Arg Ala Gly Ser Asp Glu

195 200 205

Asp Arg Glu Ala Val Glu Ala Ala Lys Arg Lys Ile Ala Asp Ala Gly

210 215 220

Ser Ser Val Leu Val Asp Val Leu Asp Glu Val Ile Ala Arg Gly Lys

225 230 235 240

Ser Ala Pro Lys Ala Pro Leu Pro Pro Ala Thr Asp Ala Gly Asp Asp

245 250 255

Ser Leu Ser Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys

260 265 270

Gly Ala Met Tyr Pro Glu Arg Asn Val Ala His Phe Trp Gly Gly Val

275 280 285

Trp Ala Ala Ala Phe Asp Glu Asp Ala Ala Pro Pro Val Pro Ala Ile

290 295 300

Asn Ile Thr Phe Leu Pro Leu Ser His Val Ala Ser Arg Leu Ser Leu

305 310 315 320

Met Pro Thr Leu Ala Arg Gly Gly Leu Met His Phe Val Ala Lys Ser

325 330 335

Asp Leu Ser Thr Leu Phe Glu Asp Leu Lys Leu Ala Arg Pro Thr Asn

340 345 350

Leu Phe Leu Val Pro Arg Val Val Glu Met Leu Tyr Gln His Tyr Gln

355 360 365

Ser Glu Leu Asp Arg Arg Gly Val Gln Asp Gly Thr Arg Glu Ala Glu

370 375 380

Ala Val Lys Asp Asp Leu Arg Thr Gly Leu Leu Gly Gly Arg Ile Leu

385 390 395 400

Thr Ala Gly Phe Gly Ser Ala Pro Leu Ser Ala Glu Leu Ala Gly Phe

405 410 415

Ile Glu Ser Leu Leu Gln Ile His Leu Val Asp Gly Tyr Gly Ser Thr

420 425 430

Glu Ala Gly Pro Val Trp Arg Asp Gly Tyr Leu Val Lys Pro Pro Val

435 440 445

Thr Asp Tyr Lys Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr

450 455 460

Asp Ser Pro His Pro Arg Gly Glu Leu Ala Ile Lys Thr Gln Thr Ile

465 470 475 480

Leu Pro Gly Tyr Tyr Lys Arg Pro Glu Thr Thr Ala Glu Val Phe Asp

485 490 495

Glu Asp Gly Phe Tyr Leu Thr Gly Asp Val Val Ala Gln Ile Gly Pro

500 505 510

Glu Gln Phe Ala Tyr Val Asp Arg Arg Lys Asn Val Leu Lys Leu Ser

515 520 525

Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Ala Tyr Ser Ser

530 535 540

Ser Pro Leu Val Arg Gln Leu Phe Val Tyr Gly Ser Ser Glu Arg Ser

545 550 555 560

Tyr Leu Leu Ala Val Ile Val Pro Thr Pro Asp Ala Leu Lys Lys Phe

565 570 575

Gly Val Gly Glu Ala Ala Lys Ala Ala Leu Gly Glu Ser Leu Gln Lys

580 585 590

Ile Ala Arg Asp Glu Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp Phe

595 600 605

Ile Ile Glu Thr Asp Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Asp

610 615 620

Ala Arg Lys Ser Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg

625 630 635 640

Leu Glu Ala Met Tyr Lys Glu Leu Ala Asp Gly Gln Ala Asn Glu Leu

645 650 655

Arg Asp Ile Arg Arg Gly Val Gln Gln Arg Pro Thr Leu Glu Thr Val

660 665 670

Arg Arg Ala Ala Ala Ala Met Leu Gly Ala Ser Ala Ala Glu Ile Lys

675 680 685

Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu

690 695 700

Thr Phe Ser Asn Phe Leu His Asp Leu Phe Glu Val Asp Val Pro Val

705 710 715 720

Gly Val Ile Val Ser Ala Ala Asn Thr Leu Gly Ser Val Ala Glu His

725 730 735

Ile Asp Ala Gln Leu Ala Gly Gly Arg Ala Arg Pro Thr Phe Ala Thr

740 745 750

Val His Gly Lys Gly Ser Thr Thr Ile Lys Ala Ser Asp Leu Thr Leu

755 760 765

Asp Lys Phe Ile Asp Glu Gln Thr Leu Glu Ala Ala Lys His Leu Pro

770 775 780

Lys Pro Ala Asp Pro Pro Arg Thr Val Leu Leu Thr Gly Ala Asn Gly

785 790 795 800

Trp Leu Gly Arg Phe Leu Ala Leu Glu Trp Leu Glu Arg Leu Ala Pro

805 810 815

Ala Gly Gly Lys Leu Ile Thr Ile Val Arg Gly Lys Asp Ala Ala Gln

820 825 830

Ala Lys Ala Arg Leu Asp Ala Ala Tyr Glu Ser Gly Asp Pro Lys Leu

835 840 845

Ala Gly His Tyr Gln Asp Leu Ala Ala Thr Thr Leu Glu Val Leu Ala

850 855 860

Gly Asp Phe Ser Glu Pro Arg Leu Gly Leu Asp Glu Ala Thr Trp Asn

865 870 875 880

Arg Leu Ala Asp Glu Val Asp Phe Ile Ser His Pro Gly Ala Leu Val

885 890 895

Asn His Val Leu Pro Tyr Asn Gln Leu Phe Gly Pro Asn Val Ala Gly

900 905 910

Val Ala Glu Ile Ile Lys Leu Ala Ile Thr Thr Arg Ile Lys Pro Val

915 920 925

Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly Val Glu Pro Ser Ala

930 935 940

Leu Asp Glu Asp Gly Asp Ile Arg Thr Val Ser Ala Glu Arg Ser Val

945 950 955 960

Asp Glu Gly Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Gly Gly Glu

965 970 975

Val Leu Leu Arg Glu Ala His Asp Arg Thr Gly Leu Pro Val Arg Val

980 985 990

Phe Arg Ser Asp Met Ile Leu Ala His Gln Lys Tyr Thr Gly Gln Val

995 1000 1005

Asn Ala Thr Asp Gln Phe Thr Arg Leu Val Gln Ser Leu Leu Ala Thr

1010 1015 1020

Gly Leu Ala Pro Lys Ser Phe Tyr Glu Leu Asp Ala Gln Gly Asn Arg

1025 1030 1035 1040

Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp Phe Thr Ala Glu Ser

1045 1050 1055

Ile Thr Thr Leu Gly Gly Asp Gly Leu Glu Gly Tyr Arg Ser Tyr Asn

1060 1065 1070

Val Phe Asn Pro His Arg Asp Gly Val Gly Leu Asp Glu Phe Val Asp

1075 1080 1085

Trp Leu Ile Glu Ala Gly His Pro Ile Thr Arg Ile Asp Asp Tyr Asp

1090 1095 1100

Gln Trp Leu Ser Arg Phe Glu Thr Ser Leu Arg Gly Leu Pro Glu Ser

1105 1110 1115 1120

Lys Arg Gln Ala Ser Val Leu Pro Leu Leu His Ala Phe Ala Arg Pro

1125 1130 1135

Gly Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Thr Val Phe Arg Thr

1140 1145 1150

Asp Val Gln Lys Ala Lys Ile Gly Ala Glu His Asp Ile Pro His Leu

1155 1160 1165

Gly Lys Ala Leu Val Leu Lys Tyr Ala Asp Asp Ile Lys Gln Leu Gly

1170 1175 1180

Leu Leu

1185

<210> 8

<211> 459

<212> PRT

<213> 紫色色杆菌

<400> 8

Met Gln Lys Gln Arg Thr Thr Ser Gln Trp Arg Glu Leu Asp Ala Ala

1 5 10 15

His His Leu His Pro Phe Thr Asp Thr Ala Ser Leu Asn Gln Ala Gly

20 25 30

Ala Arg Val Met Thr Arg Gly Glu Gly Val Tyr Leu Trp Asp Ser Glu

35 40 45

Gly Asn Lys Ile Ile Asp Gly Met Ala Gly Leu Trp Cys Val Asn Val

50 55 60

Gly Tyr Gly Arg Lys Asp Phe Ala Glu Ala Ala Arg Arg Gln Met Glu

65 70 75 80

Glu Leu Pro Phe Tyr Asn Thr Phe Phe Lys Thr Thr His Pro Ala Val

85 90 95

Val Glu Leu Ser Ser Leu Leu Ala Glu Val Thr Pro Ala Gly Phe Asp

100 105 110

Arg Val Phe Tyr Thr Asn Ser Gly Ser Glu Ser Val Asp Thr Met Ile

115 120 125

Arg Met Val Arg Arg Tyr Trp Asp Val Gln Gly Lys Pro Glu Lys Lys

130 135 140

Thr Leu Ile Gly Arg Trp Asn Gly Tyr His Gly Ser Thr Ile Gly Gly

145 150 155 160

Ala Ser Leu Gly Gly Met Lys Tyr Met His Glu Gln Gly Asp Leu Pro

165 170 175

Ile Pro Gly Met Ala His Ile Glu Gln Pro Trp Trp Tyr Lys His Gly

180 185 190

Lys Asp Met Thr Pro Asp Glu Phe Gly Val Val Ala Ala Arg Trp Leu

195 200 205

Glu Glu Lys Ile Leu Glu Ile Gly Ala Asp Lys Val Ala Ala Phe Val

210 215 220

Gly Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Ala Thr

225 230 235 240

Tyr Trp Pro Glu Ile Glu Arg Ile Cys Arg Lys Tyr Asp Val Leu Leu

245 250 255

Val Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Glu Trp Phe

260 265 270

Gly His Gln His Phe Gly Phe Gln Pro Asp Leu Phe Thr Ala Ala Lys

275 280 285

Gly Leu Ser Ser Gly Tyr Leu Pro Ile Gly Ala Val Phe Val Gly Lys

290 295 300

Arg Val Ala Glu Gly Leu Ile Ala Gly Gly Asp Phe Asn His Gly Phe

305 310 315 320

Thr Tyr Ser Gly His Pro Val Cys Ala Ala Val Ala His Ala Asn Val

325 330 335

Ala Ala Leu Arg Asp Glu Gly Ile Val Gln Arg Val Lys Asp Asp Ile

340 345 350

Gly Pro Tyr Met Gln Lys Arg Trp Arg Glu Thr Phe Ser Arg Phe Glu

355 360 365

His Val Asp Asp Val Arg Gly Val Gly Met Val Gln Ala Phe Thr Leu

370 375 380

Val Lys Asn Lys Ala Lys Arg Glu Leu Phe Pro Asp Phe Gly Glu Ile

385 390 395 400

Gly Thr Leu Cys Arg Asp Ile Phe Phe Arg Asn Asn Leu Ile Met Arg

405 410 415

Ala Cys Gly Asp His Ile Val Ser Ala Pro Pro Leu Val Met Thr Arg

420 425 430

Ala Glu Val Asp Glu Met Leu Ala Val Ala Glu Arg Cys Leu Glu Glu

435 440 445

Phe Glu Gln Thr Leu Lys Ala Arg Gly Leu Ala

450 455

<210> 9

<211> 468

<212> PRT

<213> 铜绿假单胞菌

<400> 9

Met Asn Ala Arg Leu His Ala Thr Ser Pro Leu Gly Asp Ala Asp Leu

1 5 10 15

Val Arg Ala Asp Gln Ala His Tyr Met His Gly Tyr His Val Phe Asp

20 25 30

Asp His Arg Val Asn Gly Ser Leu Asn Ile Ala Ala Gly Asp Gly Ala

35 40 45

Tyr Ile Tyr Asp Thr Ala Gly Asn Arg Tyr Leu Asp Ala Val Gly Gly

50 55 60

Met Trp Cys Thr Asn Ile Gly Leu Gly Arg Glu Glu Met Ala Arg Thr

65 70 75 80

Val Ala Glu Gln Thr Arg Leu Leu Ala Tyr Ser Asn Pro Phe Cys Asp

85 90 95

Met Ala Asn Pro Arg Ala Ile Glu Leu Cys Arg Lys Leu Ala Glu Leu

100 105 110

Ala Pro Gly Asp Leu Asp His Val Phe Leu Thr Thr Gly Gly Ser Thr

115 120 125

Ala Val Asp Thr Ala Ile Arg Leu Met His Tyr Tyr Gln Asn Cys Arg

130 135 140

Gly Lys Arg Ala Lys Lys His Val Ile Thr Arg Ile Asn Ala Tyr His

145 150 155 160

Gly Ser Thr Phe Leu Gly Met Ser Leu Gly Gly Lys Ser Ala Asp Arg

165 170 175

Pro Ala Glu Phe Asp Phe Leu Asp Glu Arg Ile His His Leu Ala Cys

180 185 190

Pro Tyr Tyr Tyr Arg Ala Pro Glu Gly Leu Gly Glu Ala Glu Phe Leu

195 200 205

Asp Gly Leu Val Asp Glu Phe Glu Arg Lys Ile Leu Glu Leu Gly Ala

210 215 220

Asp Arg Val Gly Ala Phe Ile Ser Glu Pro Val Phe Gly Ser Gly Gly

225 230 235 240

Val Ile Val Pro Pro Ala Gly Tyr His Arg Arg Met Trp Glu Leu Cys

245 250 255

Gln Arg Tyr Asp Val Leu Tyr Ile Ser Asp Glu Val Val Thr Ser Phe

260 265 270

Gly Arg Leu Gly His Phe Phe Ala Ser Gln Ala Val Phe Gly Val Gln

275 280 285

Pro Asp Ile Ile Leu Thr Ala Lys Gly Leu Thr Ser Gly Tyr Gln Pro

290 295 300

Leu Gly Ala Cys Ile Phe Ser Arg Arg Ile Trp Glu Val Ile Ala Glu

305 310 315 320

Pro Asp Lys Gly Arg Cys Phe Ser His Gly Phe Thr Tyr Ser Gly His

325 330 335

Pro Val Ala Cys Ala Ala Ala Leu Lys Asn Ile Glu Ile Ile Glu Arg

340 345 350

Glu Gly Leu Leu Ala His Ala Asp Glu Val Gly Arg Tyr Phe Glu Glu

355 360 365

Arg Leu Gln Ser Leu Arg Asp Leu Pro Ile Val Gly Asp Val Arg Gly

370 375 380

Met Arg Phe Met Ala Cys Val Glu Phe Val Ala Asp Lys Ala Ser Lys

385 390 395 400

Ala Leu Phe Pro Glu Ser Leu Asn Ile Gly Glu Trp Val His Leu Arg

405 410 415

Ala Gln Lys Arg Gly Leu Leu Val Arg Pro Ile Val His Leu Asn Val

420 425 430

Met Ser Pro Pro Leu Ile Leu Thr Arg Glu Gln Val Asp Thr Val Val

435 440 445

Arg Val Leu Arg Glu Ser Ile Glu Glu Thr Val Glu Asp Leu Val Arg

450 455 460

Ala Gly His Arg

465

<210> 10

<211> 454

<212> PRT

<213> 丁香假单胞菌

<400> 10

Met Ser Ala Asn Asn Pro Gln Thr Leu Glu Trp Gln Ala Leu Ser Ser

1 5 10 15

Glu His His Leu Ala Pro Phe Ser Asp Tyr Lys Gln Leu Lys Glu Lys

20 25 30

Gly Pro Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Leu Trp Asp Ser

35 40 45

Glu Gly Asn Lys Ile Leu Asp Gly Met Ser Gly Leu Trp Cys Val Ala

50 55 60

Ile Gly Tyr Gly Arg Glu Glu Leu Ala Asp Ala Ala Ser Lys Gln Met

65 70 75 80

Arg Glu Leu Pro Tyr Tyr Asn Leu Phe Phe Gln Thr Ala His Pro Pro

85 90 95

Val Leu Glu Leu Ala Lys Ala Ile Ser Asp Ile Ala Pro Glu Gly Met

100 105 110

Asn His Val Phe Phe Thr Gly Ser Gly Ser Glu Gly Asn Asp Thr Met

115 120 125

Leu Arg Met Val Arg His Tyr Trp Ala Leu Lys Gly Gln Pro Asn Lys

130 135 140

Lys Thr Ile Ile Ser Arg Val Asn Gly Tyr His Gly Ser Thr Val Ala

145 150 155 160

Gly Ala Ser Leu Gly Gly Met Thr Tyr Met His Glu Gln Gly Asp Leu

165 170 175

Pro Ile Pro Gly Val Val His Ile Pro Gln Pro Tyr Trp Phe Gly Glu

180 185 190

Gly Gly Asp Met Thr Pro Asp Glu Phe Gly Ile Trp Ala Ala Glu Gln

195 200 205

Leu Glu Lys Lys Ile Leu Glu Leu Gly Val Glu Asn Val Gly Ala Phe

210 215 220

Ile Ala Glu Pro Ile Gln Gly Ala Gly Gly Val Ile Val Pro Pro Asp

225 230 235 240

Ser Tyr Trp Pro Lys Ile Lys Glu Ile Leu Ser Arg Tyr Asp Ile Leu

245 250 255

Phe Ala Ala Asp Glu Val Ile Cys Gly Phe Gly Arg Thr Ser Glu Trp

260 265 270

Phe Gly Ser Asp Phe Tyr Gly Leu Arg Pro Asp Met Met Thr Ile Ala

275 280 285

Lys Gly Leu Thr Ser Gly Tyr Val Pro Met Gly Gly Leu Ile Val Arg

290 295 300

Asp Glu Ile Val Ala Val Leu Asn Glu Gly Gly Asp Phe Asn His Gly

305 310 315 320

Phe Thr Tyr Ser Gly His Pro Val Ala Ala Ala Val Ala Leu Glu Asn

325 330 335

Ile Arg Ile Leu Arg Glu Glu Lys Ile Val Glu Arg Val Arg Ser Glu

340 345 350

Thr Ala Pro Tyr Leu Gln Lys Arg Leu Arg Glu Leu Ser Asp His Pro

355 360 365

Leu Val Gly Glu Val Arg Gly Val Gly Leu Leu Gly Ala Ile Glu Leu

370 375 380

Val Lys Asp Lys Thr Thr Arg Glu Arg Tyr Thr Asp Lys Gly Ala Gly

385 390 395 400

Met Ile Cys Arg Thr Phe Cys Phe Asp Asn Gly Leu Ile Met Arg Ala

405 410 415

Val Gly Asp Thr Met Ile Ile Ala Pro Pro Leu Val Ile Ser Phe Ala

420 425 430

Gln Ile Asp Glu Leu Val Glu Lys Ala Arg Thr Cys Leu Asp Leu Thr

435 440 445

Leu Ala Val Leu Gln Gly

450

<210> 11

<211> 467

<212> PRT

<213> 球形红细菌

<400> 11

Met Thr Arg Asn Asp Ala Thr Asn Ala Ala Gly Ala Val Gly Ala Ala

1 5 10 15

Met Arg Asp His Ile Leu Leu Pro Ala Gln Glu Met Ala Lys Leu Gly

20 25 30

Lys Ser Ala Gln Pro Val Leu Thr His Ala Glu Gly Ile Tyr Val His

35 40 45

Thr Glu Asp Gly Arg Arg Leu Ile Asp Gly Pro Ala Gly Met Trp Cys

50 55 60

Ala Gln Val Gly Tyr Gly Arg Arg Glu Ile Val Asp Ala Met Ala His

65 70 75 80

Gln Ala Met Val Leu Pro Tyr Ala Ser Pro Trp Tyr Met Ala Thr Ser

85 90 95

Pro Ala Ala Arg Leu Ala Glu Lys Ile Ala Thr Leu Thr Pro Gly Asp

100 105 110

Leu Asn Arg Ile Phe Phe Thr Thr Gly Gly Ser Thr Ala Val Asp Ser

115 120 125

Ala Leu Arg Phe Ser Glu Phe Tyr Asn Asn Val Leu Gly Arg Pro Gln

130 135 140

Lys Lys Arg Ile Ile Val Arg Tyr Asp Gly Tyr His Gly Ser Thr Ala

145 150 155 160

Leu Thr Ala Ala Cys Thr Gly Arg Thr Gly Asn Trp Pro Asn Phe Asp

165 170 175

Ile Ala Gln Asp Arg Ile Ser Phe Leu Ser Ser Pro Asn Pro Arg His

180 185 190

Ala Gly Asn Arg Ser Gln Glu Ala Phe Leu Asp Asp Leu Val Gln Glu

195 200 205

Phe Glu Asp Arg Ile Glu Ser Leu Gly Pro Asp Thr Ile Ala Ala Phe

210 215 220

Leu Ala Glu Pro Ile Leu Ala Ser Gly Gly Val Ile Ile Pro Pro Ala

225 230 235 240

Gly Tyr His Ala Arg Phe Lys Ala Ile Cys Glu Lys His Asp Ile Leu

245 250 255

Tyr Ile Ser Asp Glu Val Val Thr Gly Phe Gly Arg Cys Gly Glu Trp

260 265 270

Phe Ala Ser Glu Lys Val Phe Gly Val Val Pro Asp Ile Ile Thr Phe

275 280 285

Ala Lys Gly Val Thr Ser Gly Tyr Val Pro Leu Gly Gly Leu Ala Ile

290 295 300

Ser Glu Ala Val Leu Ala Arg Ile Ser Gly Glu Asn Ala Lys Gly Ser

305 310 315 320

Trp Phe Thr Asn Gly Tyr Thr Tyr Ser Asn Gln Pro Val Ala Cys Ala

325 330 335

Ala Ala Leu Ala Asn Ile Glu Leu Met Glu Arg Glu Gly Ile Val Asp

340 345 350

Gln Ala Arg Glu Met Ala Asp Tyr Phe Ala Ala Ala Leu Ala Ser Leu

355 360 365

Arg Asp Leu Pro Gly Val Ala Glu Thr Arg Ser Val Gly Leu Val Gly

370 375 380

Cys Val Gln Cys Leu Leu Asp Pro Thr Arg Ala Asp Gly Thr Ala Glu

385 390 395 400

Asp Lys Ala Phe Thr Leu Lys Ile Asp Glu Arg Cys Phe Glu Leu Gly

405 410 415

Leu Ile Val Arg Pro Leu Gly Asp Leu Cys Val Ile Ser Pro Pro Leu

420 425 430

Ile Ile Ser Arg Ala Gln Ile Asp Glu Met Val Ala Ile Met Arg Gln

435 440 445

Ala Ile Thr Glu Val Ser Ala Ala His Gly Leu Thr Ala Lys Glu Pro

450 455 460

Ala Ala Val

465

<210> 12

<211> 459

<212> PRT

<213> 大肠杆菌

<400> 12

Met Asn Arg Leu Pro Ser Ser Ala Ser Ala Leu Ala Cys Ser Ala His

1 5 10 15

Ala Leu Asn Leu Ile Glu Lys Arg Thr Leu Asp His Glu Glu Met Lys

20 25 30

Ala Leu Asn Arg Glu Val Ile Glu Tyr Phe Lys Glu His Val Asn Pro

35 40 45

Gly Phe Leu Glu Tyr Arg Lys Ser Val Thr Ala Gly Gly Asp Tyr Gly

50 55 60

Ala Val Glu Trp Gln Ala Gly Ser Leu Asn Thr Leu Val Asp Thr Gln

65 70 75 80

Gly Gln Glu Phe Ile Asp Cys Leu Gly Gly Phe Gly Ile Phe Asn Val

85 90 95

Gly His Arg Asn Pro Val Val Val Ser Ala Val Gln Asn Gln Leu Ala

100 105 110

Lys Gln Pro Leu His Ser Gln Glu Leu Leu Asp Pro Leu Arg Ala Met

115 120 125

Leu Ala Lys Thr Leu Ala Ala Leu Thr Pro Gly Lys Leu Lys Tyr Ser

130 135 140

Phe Phe Cys Asn Ser Gly Thr Glu Ser Val Glu Ala Ala Leu Lys Leu

145 150 155 160

Ala Lys Ala Tyr Gln Ser Pro Arg Gly Lys Phe Thr Phe Ile Ala Thr

165 170 175

Ser Gly Ala Phe His Gly Lys Ser Leu Gly Ala Leu Ser Ala Thr Ala

180 185 190

Lys Ser Thr Phe Arg Lys Pro Phe Met Pro Leu Leu Pro Gly Phe Arg

195 200 205

His Val Pro Phe Gly Asn Ile Glu Ala Met Arg Thr Ala Leu Asn Glu

210 215 220

Cys Lys Lys Thr Gly Asp Asp Val Ala Ala Val Ile Leu Glu Pro Ile

225 230 235 240

Gln Gly Glu Gly Gly Val Ile Leu Pro Pro Pro Gly Tyr Leu Thr Ala

245 250 255

Val Arg Lys Leu Cys Asp Glu Phe Gly Ala Leu Met Ile Leu Asp Glu

260 265 270

Val Gln Thr Gly Met Gly Arg Thr Gly Lys Met Phe Ala Cys Glu His

275 280 285

Glu Asn Val Gln Pro Asp Ile Leu Cys Leu Ala Lys Ala Leu Gly Gly

290 295 300

Gly Val Met Pro Ile Gly Ala Thr Ile Ala Thr Glu Glu Val Phe Ser

305 310 315 320

Val Leu Phe Asp Asn Pro Phe Leu His Thr Thr Thr Phe Gly Gly Asn

325 330 335

Pro Leu Ala Cys Ala Ala Ala Leu Ala Thr Ile Asn Val Leu Leu Glu

340 345 350

Gln Asn Leu Pro Ala Gln Ala Glu Gln Lys Gly Asp Met Leu Leu Asp

355 360 365

Gly Phe Arg Gln Leu Ala Arg Glu Tyr Pro Asp Leu Val Gln Glu Ala

370 375 380

Arg Gly Lys Gly Met Leu Met Ala Ile Glu Phe Val Asp Asn Glu Ile

385 390 395 400

Gly Tyr Asn Phe Ala Ser Glu Met Phe Arg Gln Arg Val Leu Val Ala

405 410 415

Gly Thr Leu Asn Asn Ala Lys Thr Ile Arg Ile Glu Pro Pro Leu Thr

420 425 430

Leu Thr Ile Glu Gln Cys Glu Leu Val Ile Lys Ala Ala Arg Lys Ala

435 440 445

Leu Ala Ala Met Arg Val Ser Val Glu Glu Ala

450 455

<210> 13

<211> 453

<212> PRT

<213> 河流孤菌

<400> 13

Met Asn Lys Pro Gln Ser Trp Glu Ala Arg Ala Glu Thr Tyr Ser Leu

1 5 10 15

Tyr Gly Phe Thr Asp Met Pro Ser Leu His Gln Arg Gly Thr Val Val

20 25 30

Val Thr His Gly Glu Gly Pro Tyr Ile Val Asp Val Asn Gly Arg Arg

35 40 45

Tyr Leu Asp Ala Asn Ser Gly Leu Trp Asn Met Val Ala Gly Phe Asp

50 55 60

His Lys Gly Leu Ile Asp Ala Ala Lys Ala Gln Tyr Glu Arg Phe Pro

65 70 75 80

Gly Tyr His Ala Phe Phe Gly Arg Met Ser Asp Gln Thr Val Met Leu

85 90 95

Ser Glu Lys Leu Val Glu Val Ser Pro Phe Asp Ser Gly Arg Val Phe

100 105 110

Tyr Thr Asn Ser Gly Ser Glu Ala Asn Asp Thr Met Val Lys Met Leu

115 120 125

Trp Phe Leu His Ala Ala Glu Gly Lys Pro Gln Lys Arg Lys Ile Leu

130 135 140

Thr Arg Trp Asn Ala Tyr His Gly Val Thr Ala Val Ser Ala Ser Met

145 150 155 160

Thr Gly Lys Pro Tyr Asn Ser Val Phe Gly Leu Pro Leu Pro Gly Phe

165 170 175

Val His Leu Thr Cys Pro His Tyr Trp Arg Tyr Gly Glu Glu Gly Glu

180 185 190

Thr Glu Glu Gln Phe Val Ala Arg Leu Ala Arg Glu Leu Glu Glu Thr

195 200 205

Ile Gln Arg Glu Gly Ala Asp Thr Ile Ala Gly Phe Phe Ala Glu Pro

210 215 220

Val Met Gly Ala Gly Gly Val Ile Pro Pro Ala Lys Gly Tyr Phe Gln

225 230 235 240

Ala Ile Leu Pro Ile Leu Arg Lys Tyr Asp Ile Pro Val Ile Ser Asp

245 250 255

Glu Val Ile Cys Gly Phe Gly Arg Thr Gly Asn Thr Trp Gly Cys Val

260 265 270

Thr Tyr Asp Phe Thr Pro Asp Ala Ile Ile Ser Ser Lys Asn Leu Thr

275 280 285

Ala Gly Phe Phe Pro Met Gly Ala Val Ile Leu Gly Pro Glu Leu Ser

290 295 300

Lys Arg Leu Glu Thr Ala Ile Glu Ala Ile Glu Glu Phe Pro His Gly

305 310 315 320

Phe Thr Ala Ser Gly His Pro Val Gly Cys Ala Ile Ala Leu Lys Ala

325 330 335

Ile Asp Val Val Met Asn Glu Gly Leu Ala Glu Asn Val Arg Arg Leu

340 345 350

Ala Pro Arg Phe Glu Glu Arg Leu Lys His Ile Ala Glu Arg Pro Asn

355 360 365

Ile Gly Glu Tyr Arg Gly Ile Gly Phe Met Trp Ala Leu Glu Ala Val

370 375 380

Lys Asp Lys Ala Ser Lys Thr Pro Phe Asp Gly Asn Leu Ser Val Ser

385 390 395 400

Glu Arg Ile Ala Asn Thr Cys Thr Asp Leu Gly Leu Ile Cys Arg Pro

405 410 415

Leu Gly Gln Ser Val Val Leu Cys Pro Pro Phe Ile Leu Thr Glu Ala

420 425 430

Gln Met Asp Glu Met Phe Asp Lys Leu Glu Lys Ala Leu Asp Lys Val

435 440 445

Phe Ala Glu Val Ala

450

<210> 14

<211> 224

<212> PRT

<213> 枯草芽孢杆菌

<400> 14

Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu

1 5 10 15

Asn Glu Arg Phe Met Ser Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys

20 25 30

Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp

35 40 45

Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser

50 55 60

Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp

65 70 75 80

Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile

85 90 95

Cys Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys

100 105 110

Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr

115 120 125

Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr

130 135 140

His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly

145 150 155 160

Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly

165 170 175

Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys

180 185 190

Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His

195 200 205

Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu

210 215 220

<210> 15

<211> 222

<212> PRT

<213> 诺卡氏菌属sp. NRRL 5646

<400> 15

Met Ile Glu Thr Ile Leu Pro Ala Gly Val Glu Ser Ala Glu Leu Leu

1 5 10 15

Glu Tyr Pro Glu Asp Leu Lys Ala His Pro Ala Glu Glu His Leu Ile

20 25 30

Ala Lys Ser Val Glu Lys Arg Arg Arg Asp Phe Ile Gly Ala Arg His

35 40 45

Cys Ala Arg Leu Ala Leu Ala Glu Leu Gly Glu Pro Pro Val Ala Ile

50 55 60

Gly Lys Gly Glu Arg Gly Ala Pro Ile Trp Pro Arg Gly Val Val Gly

65 70 75 80

Ser Leu Thr His Cys Asp Gly Tyr Arg Ala Ala Ala Val Ala His Lys

85 90 95

Met Arg Phe Arg Ser Ile Gly Ile Asp Ala Glu Pro His Ala Thr Leu

100 105 110

Pro Glu Gly Val Leu Asp Ser Val Ser Leu Pro Pro Glu Arg Glu Trp

115 120 125

Leu Lys Thr Thr Asp Ser Ala Leu His Leu Asp Arg Leu Leu Phe Cys

130 135 140

Ala Lys Glu Ala Thr Tyr Lys Ala Trp Trp Pro Leu Thr Ala Arg Trp

145 150 155 160

Leu Gly Phe Glu Glu Ala His Ile Thr Phe Glu Ile Glu Asp Gly Ser

165 170 175

Ala Asp Ser Gly Asn Gly Thr Phe His Ser Glu Leu Leu Val Pro Gly

180 185 190

Gln Thr Asn Asp Gly Gly Thr Pro Leu Leu Ser Phe Asp Gly Arg Trp

195 200 205

Leu Ile Ala Asp Gly Phe Ile Leu Thr Ala Ile Ala Tyr Ala

210 215 220

<210> 16

<211> 418

<212> PRT

<213> 单胞菌属sp. JS666

<400> 16

Met Ser Glu Ala Ile Val Val Asn Asn Gln Asn Asp Gln Ser Arg Ala

1 5 10 15

Tyr Ala Ile Pro Leu Glu Asp Ile Asp Val Ser Asn Pro Glu Leu Phe

20 25 30

Arg Asp Asn Thr Met Trp Gly Tyr Phe Glu Arg Leu Arg Arg Glu Asp

35 40 45

Pro Val His Tyr Cys Lys Asp Ser Leu Phe Gly Pro Tyr Trp Ser Val

50 55 60

Thr Lys Phe Lys Asp Ile Met Gln Val Glu Thr His Pro Glu Ile Phe

65 70 75 80

Ser Ser Glu Gly Asn Ile Thr Ile Met Glu Ser Asn Ala Ala Val Thr

85 90 95

Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg

100 105 110

Met Ala Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Lys Leu Glu

115 120 125

Gly Leu Ile Arg Glu Arg Thr Gly Arg Ala Leu Asp Gly Leu Pro Ile

130 135 140

Asn Glu Thr Phe Asp Trp Val Lys Leu Val Ser Ile Asn Leu Thr Thr

145 150 155 160

Gln Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Glu Asp Arg Ala Lys

165 170 175

Leu Thr Arg Trp Ser Asp Val Ala Thr Ala Leu Val Gly Thr Gly Ile

180 185 190

Ile Asp Ser Glu Glu Gln Arg Met Glu Glu Leu Lys Gly Cys Val Gln

195 200 205

Tyr Met Thr Arg Leu Trp Asn Glu Arg Val Asn Val Pro Pro Gly Asn

210 215 220

Asp Leu Ile Ser Met Met Ala His Thr Glu Ser Met Arg Asn Met Thr

225 230 235 240

Pro Glu Glu Phe Leu Gly Asn Leu Ile Leu Leu Ile Val Gly Gly Asn

245 250 255

Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu Asn Glu

260 265 270

Asn Pro Asp Glu Tyr Arg Lys Leu Cys Ala Asn Pro Ala Leu Ile Ala

275 280 285

Ser Met Val Pro Glu Ile Val Arg Trp Gln Thr Pro Leu Ala His Met

290 295 300

Arg Arg Thr Ala Leu Gln Asp Thr Glu Leu Gly Gly Lys Ser Ile Arg

305 310 315 320

Lys Gly Asp Lys Val Ile Met Trp Tyr Val Ser Gly Asn Arg Asp Pro

325 330 335

Glu Ala Ile Glu Asn Pro Asp Ala Phe Ile Ile Asp Arg Ala Lys Pro

340 345 350

Arg His His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val Gly Asn

355 360 365

Arg Leu Ala Glu Leu Gln Leu Arg Ile Val Trp Glu Glu Leu Leu Lys

370 375 380

Arg Trp Pro Asn Pro Gly Gln Ile Glu Val Val Gly Ala Pro Glu Arg

385 390 395 400

Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val Arg Ile

405 410 415

Asn Ala

<210> 17

<211> 420

<212> PRT

<213> 分枝杆菌属sp. HXN-1500

<400> 17

Met Thr Glu Met Thr Val Ala Ala Ser Asp Ala Thr Asn Ala Ala Tyr

1 5 10 15

Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg

20 25 30

Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro

35 40 45

Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr

50 55 60

Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser

65 70 75 80

Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala

85 90 95

Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val

100 105 110

Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr

115 120 125

Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu

130 135 140

Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Glu Leu

145 150 155 160

Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg

165 170 175

Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly

180 185 190

Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys

195 200 205

Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro

210 215 220

Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His

225 230 235 240

Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly

245 250 255

Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu

260 265 270

Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu

275 280 285

Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser

290 295 300

His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His

305 310 315 320

Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg

325 330 335

Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala

340 345 350

Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val

355 360 365

Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile

370 375 380

Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro

385 390 395 400

Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val

405 410 415

Arg Ile Asn Ala

420

<210> 18

<211> 420

<212> PRT

<213> 结核分枝杆菌

<400> 18

Met Thr Glu Met Thr Val Ala Ala Asn Asp Ala Thr Asn Ala Ala Tyr

1 5 10 15

Gly Met Ala Leu Glu Asp Ile Asp Val Ser Asn Pro Val Leu Phe Arg

20 25 30

Asp Asn Thr Trp His Pro Tyr Phe Lys Arg Leu Arg Glu Glu Asp Pro

35 40 45

Val His Tyr Cys Lys Ser Ser Met Phe Gly Pro Tyr Trp Ser Val Thr

50 55 60

Lys Tyr Arg Asp Ile Met Ala Val Glu Thr Asn Pro Lys Val Phe Ser

65 70 75 80

Ser Glu Ala Lys Ser Gly Gly Ile Thr Ile Met Asp Asp Asn Ala Ala

85 90 95

Ala Ser Leu Pro Met Phe Ile Ala Met Asp Pro Pro Lys His Asp Val

100 105 110

Gln Arg Lys Thr Val Ser Pro Ile Val Ala Pro Glu Asn Leu Ala Thr

115 120 125

Met Glu Ser Val Ile Arg Gln Arg Thr Ala Asp Leu Leu Asp Gly Leu

130 135 140

Pro Ile Asn Glu Glu Phe Asp Trp Val His Arg Val Ser Ile Asp Leu

145 150 155 160

Thr Thr Lys Met Leu Ala Thr Leu Phe Asp Phe Pro Trp Asp Asp Arg

165 170 175

Ala Lys Leu Thr Arg Trp Ser Asp Val Thr Thr Ala Leu Pro Gly Gly

180 185 190

Gly Ile Ile Asp Ser Glu Glu Gln Arg Met Ala Glu Leu Met Glu Cys

195 200 205

Ala Thr Tyr Phe Thr Glu Leu Trp Asn Gln Arg Val Asn Ala Glu Pro

210 215 220

Lys Asn Asp Leu Ile Ser Met Met Ala His Ser Glu Ser Thr Arg His

225 230 235 240

Met Ala Pro Glu Glu Tyr Leu Gly Asn Ile Val Leu Leu Ile Val Gly

245 250 255

Gly Asn Asp Thr Thr Arg Asn Ser Met Thr Gly Gly Val Leu Ala Leu

260 265 270

Asn Glu Phe Pro Asp Glu Tyr Arg Lys Leu Ser Ala Asn Pro Ala Leu

275 280 285

Ile Ser Ser Met Val Ser Glu Ile Ile Arg Trp Gln Thr Pro Leu Ser

290 295 300

His Met Arg Arg Thr Ala Leu Glu Asp Ile Glu Phe Gly Gly Lys His

305 310 315 320

Ile Arg Gln Gly Asp Lys Val Val Met Trp Tyr Val Ser Gly Asn Arg

325 330 335

Asp Pro Glu Ala Ile Asp Asn Pro Asp Thr Phe Ile Ile Asp Arg Ala

340 345 350

Lys Pro Arg Gln His Leu Ser Phe Gly Phe Gly Ile His Arg Cys Val

355 360 365

Gly Asn Arg Leu Ala Glu Leu Gln Leu Asn Ile Leu Trp Glu Glu Ile

370 375 380

Leu Lys Arg Trp Pro Asp Pro Leu Gln Ile Gln Val Leu Gln Glu Pro

385 390 395 400

Thr Arg Val Leu Ser Pro Phe Val Lys Gly Tyr Glu Ser Leu Pro Val

405 410 415

Arg Ile Asn Ala

420

<210> 19

<211> 405

<212> PRT

<213> 单胞菌属sp. JS666

<400> 19

Met Ser Glu Thr Val Ile Ile Ala Gly Ala Gly Gln Ala Ala Gly Gln

1 5 10 15

Ala Val Ala Ser Leu Arg Gln Glu Gly Phe Asp Gly Arg Ile Val Leu

20 25 30

Val Gly Ala Glu Pro Val Leu Pro Tyr Gln Arg Pro Pro Leu Ser Lys

35 40 45

Ala Phe Leu Ala Gly Thr Leu Pro Leu Glu Arg Leu Phe Leu Lys Pro

50 55 60

Pro Ala Phe Tyr Glu Gln Ala Arg Val Asp Thr Leu Leu Gly Val Ala

65 70 75 80

Val Thr Glu Leu Asp Ala Ala Arg Arg Gln Val Arg Leu Asp Asp Gly

85 90 95

Arg Glu Leu Ala Phe Asp His Leu Leu Leu Ala Thr Gly Gly Arg Ala

100 105 110

Arg Arg Leu Asp Cys Pro Gly Ala Asp His Pro Arg Leu His Tyr Leu

115 120 125

Arg Thr Val Ala Asp Val Asp Gly Ile Arg Ala Ala Leu Arg Pro Gly

130 135 140

Ala Arg Leu Val Leu Ile Gly Gly Gly Tyr Val Gly Leu Glu Ile Ala

145 150 155 160

Ala Val Ala Ala Lys Leu Gly Leu Ala Val Thr Val Leu Glu Ala Ala

165 170 175

Pro Thr Val Leu Ala Arg Val Thr Cys Pro Ala Val Ala Arg Phe Phe

180 185 190

Glu Ser Val His Arg Gln Ala Gly Val Thr Ile Arg Cys Ala Thr Thr

195 200 205

Val Ser Gly Ile Glu Gly Asp Ala Ser Leu Ala Arg Val Val Thr Gly

210 215 220

Asp Gly Glu Arg Ile Asp Ala Asp Leu Val Ile Ala Gly Ile Gly Leu

225 230 235 240

Leu Pro Asn Val Glu Leu Ala Gln Ala Ala Gly Leu Val Cys Asp Asn

245 250 255

Gly Ile Val Val Asp Glu Glu Cys Arg Thr Ser Val Pro Gly Ile Phe

260 265 270

Ala Ala Gly Asp Cys Thr Gln His Pro Asn Ala Ile Tyr Asp Ser Arg

275 280 285

Leu Arg Leu Glu Ser Val His Asn Ala Ile Glu Gln Gly Lys Thr Ala

290 295 300

Ala Ala Ala Met Cys Gly Lys Ala Arg Pro Tyr Arg Gln Val Pro Trp

305 310 315 320

Phe Trp Ser Asp Gln Tyr Asp Leu Lys Leu Gln Thr Ala Gly Leu Asn

325 330 335

Arg Gly Tyr Asp Gln Val Val Met Arg Gly Ser Thr Asp Asn Arg Ser

340 345 350

Phe Ala Ala Phe Tyr Leu Arg Asp Gly Arg Leu Leu Ala Val Asp Ala

355 360 365

Val Asn Arg Pro Val Glu Phe Met Val Ala Lys Ala Leu Ile Ala Asn

370 375 380

Arg Thr Val Ile Ala Pro Glu Arg Leu Ala Asp Glu Arg Ile Ala Ala

385 390 395 400

Lys Asp Leu Ala Gly

405

<210> 20

<211> 424

<212> PRT

<213> 分枝杆菌属sp. HXN-1500

<400> 20

Met Ile His Thr Gly Val Thr Glu Ala Val Val Val Val Gly Ala Gly

1 5 10 15

Gln Ala Gly Ala Gln Thr Val Thr Ser Leu Arg Gln Arg Gly Phe Glu

20 25 30

Gly Gln Ile Thr Leu Leu Gly Asp Glu Pro Ala Leu Pro Tyr Gln Arg

35 40 45

Pro Pro Leu Ser Lys Ala Phe Leu Ala Gly Thr Leu Pro Leu Asp Arg

50 55 60

Leu Tyr Leu Arg Pro Ala Ala Phe Tyr Gln Gln Ala His Val Asp Val

65 70 75 80

Met Val Asp Thr Gly Val Ser Glu Leu Asp Thr Glu Asn Arg Arg Ile

85 90 95

Arg Leu Thr Asp Gly Arg Ala Ile Ser Phe Asp His Leu Val Leu Ala

100 105 110

Thr Gly Gly Arg Pro Arg Pro Leu Ala Cys Pro Gly Ala Asp His Pro

115 120 125

Arg Val His Tyr Leu Arg Thr Val Thr Asp Val Asp Arg Ile Arg Ser

130 135 140

Gln Phe His Pro Gly Thr Arg Leu Val Leu Val Gly Gly Gly Tyr Ile

145 150 155 160

Gly Leu Glu Ile Ala Ala Val Ala Ala Glu Leu Gly Leu Thr Val Thr

165 170 175

Val Leu Glu Ala Gln Thr Thr Val Leu Ala Arg Val Thr Cys Pro Thr

180 185 190

Val Ala Arg Phe Phe Glu His Thr His Arg Arg Ala Gly Val Thr Ile

195 200 205

Arg Cys Ala Thr Thr Val Thr Arg Ile His Asp Ser Ser Ser Thr Ala

210 215 220

Arg Ile Glu Leu Asp Ser Gly Glu Tyr Ile Asp Ala Asp Leu Val Ile

225 230 235 240

Val Gly Ile Gly Leu Leu Pro Asn Val Asp Leu Ala Ser Ala Ala Gly

245 250 255

Leu Thr Cys Glu Ser Gly Ile Val Val Asp Ser Arg Cys Gln Thr Ser

260 265 270

Ala Pro Gly Ile Tyr Ala Ala Gly Asp Cys Thr Gln Tyr Pro Ser Pro

275 280 285

Ile Tyr Gly Arg Pro Leu His Leu Glu Ser Val His Asn Ala Ile Glu

290 295 300

Gln Ala Lys Thr Ala Ala Ala Ala Ile Leu Gly Arg Asp Glu Pro Phe

305 310 315 320

Arg Gln Val Pro Trp Phe Trp Ser Asp Gln Tyr Asn Ile Lys Leu Gln

325 330 335

Thr Ala Gly Val Asn Glu Gly Tyr Asp Asp Val Ile Ile Arg Gly Asp

340 345 350

Pro Ala Ser Ala Ser Phe Ala Ala Phe Tyr Leu Arg Ala Gly Lys Leu

355 360 365

Leu Ala Val Asp Ala Ile Asn Arg Pro Arg Glu Phe Met Ala Ser Lys

370 375 380

Thr Leu Ile Ala Glu Arg Ala Glu Val Asp Pro Thr Gln Leu Ala Asp

385 390 395 400

Glu Ser Leu Pro Pro Thr Ala Leu Ala Ala Ala Val Asn Gly Pro Thr

405 410 415

Arg Ala Thr Ser Pro Thr Ser Leu

420

<210> 21

<211> 106

<212> PRT

<213> 单胞菌属sp. JS666

<400> 21

Met Thr Lys Val Thr Phe Ile Glu His Asn Gly Thr Val Arg Asn Val

1 5 10 15

Asp Val Asp Asp Gly Leu Ser Val Met Glu Ala Ala Val Asn Asn Leu

20 25 30

Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Ala Cys Ala Cys Ala Thr

35 40 45

Cys His Val His Ile Asp Ala Ala Trp Leu Asp Lys Leu Pro Pro Met

50 55 60

Glu Ala Met Glu Lys Ser Met Leu Glu Phe Ala Glu Gly Arg Asn Glu

65 70 75 80

Ser Ser Arg Leu Gly Cys Gln Ile Lys Leu Ser Pro Ala Leu Asp Gly

85 90 95

Ile Val Val Arg Thr Pro Leu Gly Gln His

100 105

<210> 22

<211> 106

<212> PRT

<213> 分枝杆菌属sp. HXN-1500

<400> 22

Met Pro Lys Ile Thr Tyr Ile Asp Tyr Thr Gly Thr Ser Arg Cys Val

1 5 10 15

Asp Ala Glu Asn Gly Met Ser Leu Met Glu Ile Ala Ile Asn Asn Asn

20 25 30

Val Pro Gly Ile Asp Gly Asp Cys Gly Gly Glu Cys Ala Cys Ala Thr

35 40 45

Cys His Val His Val Asp Ala Asp Trp Leu Asp Lys Leu Pro Pro Ser

50 55 60

Ser Asp Gln Glu Val Ser Met Leu Glu Phe Cys Asp Gly Val Asp His

65 70 75 80

Thr Ser Arg Leu Gly Cys Gln Ile Lys Ile Cys Pro Thr Leu Asp Gly

85 90 95

Ile Val Val Arg Thr Pro Ala Ala Gln His

100 105

<210> 23

<211> 395

<212> PRT

<213> 枯草芽孢杆菌

<400> 23

Met Thr Ile Ala Ser Ser Thr Ala Ser Ser Glu Phe Leu Lys Asn Pro

1 5 10 15

Tyr Ser Phe Tyr Asp Thr Leu Arg Ala Val His Pro Ile Tyr Lys Gly

20 25 30

Ser Phe Leu Lys Tyr Pro Gly Trp Tyr Val Thr Gly Tyr Glu Glu Thr

35 40 45

Ala Ala Ile Leu Lys Asp Ala Arg Phe Lys Val Arg Thr Pro Leu Pro

50 55 60

Glu Ser Ser Thr Lys Tyr Gln Asp Leu Ser His Val Gln Asn Gln Met

65 70 75 80

Met Leu Phe Gln Asn Gln Pro Asp His Arg Arg Leu Arg Thr Leu Ala

85 90 95

Ser Gly Ala Phe Thr Pro Arg Thr Thr Glu Ser Tyr Gln Pro Tyr Ile

100 105 110

Ile Glu Thr Val His His Leu Leu Asp Gln Val Gln Gly Lys Lys Lys

115 120 125

Met Glu Val Ile Ser Asp Phe Ala Phe Pro Leu Ala Ser Phe Val Ile

130 135 140

Ala Asn Ile Ile Gly Val Pro Glu Glu Asp Arg Glu Gln Leu Lys Glu

145 150 155 160

Trp Ala Ala Ser Leu Ile Gln Thr Ile Asp Phe Thr Arg Ser Arg Lys

165 170 175

Ala Leu Thr Glu Gly Asn Ile Met Ala Val Gln Ala Met Ala Tyr Phe

180 185 190

Lys Glu Leu Ile Gln Lys Arg Lys Arg His Pro Gln Gln Asp Met Ile

195 200 205

Ser Met Leu Leu Lys Gly Arg Glu Lys Asp Lys Leu Thr Glu Glu Glu

210 215 220

Ala Ala Ser Thr Cys Ile Leu Leu Ala Ile Ala Gly His Glu Thr Thr

225 230 235 240

Val Asn Leu Ile Ser Asn Ser Val Leu Cys Leu Leu Gln His Pro Glu

245 250 255

Gln Leu Leu Lys Leu Arg Glu Asn Pro Asp Leu Ile Gly Thr Ala Val

260 265 270

Glu Glu Cys Leu Arg Tyr Glu Ser Pro Thr Gln Met Thr Ala Arg Val

275 280 285

Ala Ser Glu Asp Ile Asp Ile Cys Gly Val Thr Ile Arg Gln Gly Glu

290 295 300

Gln Val Tyr Leu Leu Leu Gly Ala Ala Asn Arg Asp Pro Ser Ile Phe

305 310 315 320

Thr Asn Pro Asp Val Phe Asp Ile Thr Arg Ser Pro Asn Pro His Leu

325 330 335

Ser Phe Gly His Gly His His Val Cys Leu Gly Ser Ser Leu Ala Arg

340 345 350

Leu Glu Ala Gln Ile Ala Ile Asn Thr Leu Leu Gln Arg Met Pro Ser

355 360 365

Leu Asn Leu Ala Asp Phe Glu Trp Arg Tyr Arg Pro Leu Phe Gly Phe

370 375 380

Arg Ala Leu Glu Glu Leu Pro Val Thr Phe Glu

385 390 395

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1