具有内切葡聚糖酶活性的多肽的制作方法

文档序号:11141461阅读:1341来源:国知局
具有内切葡聚糖酶活性的多肽的制造方法与工艺

本申请包括计算机可读形式的序列表,将其通过引用结合在此。

发明背景

发明领域

本发明涉及具有内切葡聚糖酶活性的多肽,特别涉及具有内切葡聚糖酶活性并对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,和编码这些多肽的多核苷酸。本发明还涉及包括这些多核苷酸的核酸构建体、载体、和宿主细胞连同产生和使用这些多肽的方法。本发明进一步涉及包括用于洗涤剂和用于钻井和石油工业的多肽和任选的黄原胶裂解酶的组合物。

相关技术说明

黄原胶是一种来源于野油菜黄单胞菌的细菌包被的多糖。黄原胶通过由野油菜黄单胞菌细菌发酵葡萄糖、蔗糖或乳糖而产生。在发酵周期后,用异丙醇将该多糖从生长培养基中沉淀,干燥,并磨成细粉。稍后,将该粉末添加至液体介质中,以形成胶质。

黄原胶由五糖亚基组成,形成纤维素主链,其三糖侧链由通过α1,3键附接到主链中的交替葡萄糖残基的甘露糖(β1,4)葡萄糖醛酸(β1,2)甘露糖组成。该生物聚合物由于其优异的假塑性,触变性和粘度而具有巨大的商业意义。目前,其广泛用作食品和非食品工业中的增稠剂或增粘剂,并且用作多种多样的悬浮液,乳液和泡沫的稳定剂。

近年来,黄原胶已经被用作许多消费品中的成分,包括食品(例如在沙拉酱(salat dressing)和乳制品中作为增稠剂)和化妆品(例如在牙膏和化妆品中作为稳定剂和增稠剂,以阻止成分分离)和化妆品(例如防晒霜)。另外的黄原胶已经在石油工业中发现用途,其中黄原胶被大量使用以增稠钻井泥浆。这些流体用于将由钻头切割的固体携带回表面。当循环停止时,固体仍保持悬浮在钻井流体中。水平钻井的广泛使用和对钻井固体的良好控制的需求已经导致其扩大使用。它还被添加到自固化混凝土中,包括倒在水下的混凝土,以增加其粘度。

黄原胶的广泛使用已导致希望降解和/或改性黄原胶的溶液或凝胶。黄原胶的完全酶降解需要若干酶活性,包括黄原胶裂解酶活性和内切-β-1,4-葡聚糖酶活性。

黄原胶裂解酶是切割黄原胶的β-D-甘露糖基-β-D-1,4-葡萄糖醛酸基键,由此去除末端丙酮酸甘露糖的酶。两种分离自溶藻弧菌类芽孢杆菌XL-1的黄原胶裂解酶(例如,Ruijssenaars(鲁基森纳斯)等人.(1999)‘A pyruvated mannose-specific xanthan lyase involved in xanthan degradation by Paenibacillus alginolyticus XL-1(在由溶藻弧菌类芽孢杆菌XL-1降解黄原胶中涉及的一种丙酮酸甘露糖特异性黄原胶裂解酶)’,Appl.Environ.Microbiol.(应用与环境微生物)65(6):2446-2452,和Ruijssenaars(鲁基森纳斯)等人.(2000),‘A novel gene encoding xanthan lyase of Paenibacillus alginolyticus strain XL-1(一种编码溶藻弧菌类芽孢杆菌菌株XL-1的黄原胶降解酶的新颖基因)’,Appl.Environ.Microbiol.(应用与环境微生物)66(9):3945-3950)。

具有内切-β-1,4-葡聚糖酶活性的酶在去除末端丙酮酸甘露糖后必须能够切割黄原胶的高度取代的主链。已知这类酶来自糖基水解酶家族GH9(WO 2013/167581)。

发明概述

诸位发明人已经惊奇地发现了一个新组的酶,该新组的酶具有内切-β-1,4-葡聚糖酶活性并且能够切割黄原胶的高度取代的骨架–并且其不属于已知包括这种酶活性的糖基水解酶家族。这些酶与具有黄原酸降解活性的任何已知的酶没有显着的序列相似性,并且不能分配至已知的糖基水解酶家族。新组的内切葡聚糖酶通过与专利申请号EP14170186.2的SEQ ID NO 2中披露的和本文SEQ ID NO 42中显示的多肽的氨基酸序列比对来鉴定。

本发明提供了用于降解黄原胶的新的且改进的酶以及此类酶用于清洁目的(例如去除黄原胶污物)以及在钻探和石油工业中的用途。由于酶对纤维素也具有显着的活性,所以酶也可以用于降解纤维素材料的过程中,例如,在纤维素生物质的降解中用于生产,例如,可发酵糖。

因此,本发明涉及具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,这些多肽选自下组,该组由以下各项组成:

(a)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;

(b)由多核苷酸编码的多肽,该多核苷酸在中严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列,(ii)(i)的全长补体杂交;

(c)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;

(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个位置包括取代、缺失、和/或插入;和

(e)(a)、(b)、(c)、或(d)的多肽的片段,该片段具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性。

本发明还涉及编码本发明的多肽的多核苷酸;核酸构建体;重组表达载体;包括这些多核苷酸的重组宿主细胞;以及产生这些多肽的方法。

本发明还涉及包括这些多肽的组合物,以及包括这些多肽的全发酵液配制品或细胞培养组合物。

本发明还涉及多肽和组合物用于降解黄原胶的用途,例如用于洗涤或清洁纺织品和/或硬表面如餐具洗涤。

本发明还涉及多肽和组合物用于降解纤维素材料的用途。

附图简要说明

图1示出氨基酸序列SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40的多重比对。还包括与专利申请号EP14170186.2的SEQ ID NO:2具有一致性的SEQ ID NO:42。

序列简要说明

SEQ ID 来源于

SEQ ID NO 01/02 分解雨林土壤宏基因组B

SEQ ID NO 03/04 生物反应器富集废水宏基因组

SEQ ID NO 05/06 Lewinella cohaerens

SEQ ID NO 07/08 Chthoniobacter flavus

SEQ ID NO 09/10 嗜常温稻草/堆肥富集宏基因组

SEQ ID NO 11/12 人类粪便微生物组

SEQ ID NO 13/14 闪烁杆菌属细菌

SEQ ID NO 15/16 丰佑菌科细菌

SEQ ID NO 17/18 丰佑菌科细菌

SEQ ID NO 19/20 Paludibacterium yongneupense

SEQ ID NO 21/22 迪克亚杆菌属物种

SEQ ID NO 23/24 闪烁杆菌属细菌

SEQ ID NO 25/26 Teredinibacter turnerae

SEQ ID NO 27/28 Teredinibacter turnerae

SEQ ID NO 29/30 Diplosphaera colitermitum

SEQ ID NO 31/32 Teredinibacter turnerae

SEQ ID NO 33/34 Teredinibacter turnerae

SEQ ID NO 35/36 Teredinibacter turnerae

SEQ ID NO 37/38 Teredinibacter turnerae

SEQ ID NO 39/40 牛瘤胃微生物群落

SEQ ID NO 41/42 浮霉状菌属(专利申请号EP14170186.2的SEQ ID NO:2)

定义

等位基因变体:术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

纤维素结合结构域:术语“纤维素结合结构域”是指介导酶结合至纤维素底物的非晶区域的酶的区域。

催化结构域:术语“催化结构域”意思指酶的包含该酶的催化机器的区域。

cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。

清洁或洗涤剂应用:术语“清洁或洗涤剂应用”意指将本发明的多肽施用于在任何组合物中,用于手动、机械或自动化清洁或洗涤硬表面或纺织品的目的。

清洁或洗涤剂组合物:术语“清洁或洗涤剂组合物”是指用于从有待清洁的物品(例如纺织品、餐具和硬表面)去除不希望的化合物的组合物。这些术语涵盖选择用于希望的具体类型的清洁组合物和产品的形式(例如、液体、凝胶、粉末、颗粒、糊状、或喷雾组合物)的任何材料/化合物,并且包括但不限于洗涤剂组合物(例如,液体和/或固体衣物洗涤剂和精细织物洗涤剂;硬表面清洁配制品,如用于玻璃、木材、陶瓷和金属台面以及窗户;地毯清洁剂;炉灶清洁剂;织物清新剂;织物柔软剂;和纺织品和衣物预洗涤剂,连同餐具洗涤剂)。除了本发明的多肽之外,该洗涤剂配制品还可以包含一种或多种另外的酶(例如蛋白酶、淀粉酶、脂肪酶、角质酶、纤维素酶、内切葡聚糖酶、木葡聚糖酶、果胶酶、果胶裂解酶、黄原胶酶、黄原胶裂解酶、过氧化物酶、卤代过氧合酶、过氧化氢酶以及甘露聚糖酶,或其任何混合物),和/或组分,例如表面活性剂、助洗剂、螯合剂(chelator)或螯合试剂(chelating agent)、漂白系统或漂白组分、聚合物、织物调理剂、增泡剂、抑泡剂、染料、香料、晦暗抑制剂、光学增亮剂、杀细菌剂、杀真菌剂、污垢悬浮剂、防蚀剂、酶抑制剂或稳定剂、酶激活剂、一种或多种转移酶、水解酶、氧化还原酶、上蓝剂和荧光染料、抗氧化剂以及增溶剂。

编码序列:术语“编码序列”意指直接指定一个多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。

控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。

降解黄原胶:在此将术语“降解黄原胶”或“黄原胶降解活性”定义为将黄原胶解聚、降解或分解为更小的组分。黄原胶的降解可以是去除一个或多个侧链糖,将黄原胶的骨架切成更小的组分,或去除一个或多个侧链糖并且将黄原胶的骨架切成更小的组分。黄原胶的降解优选地可以使用如描述于实例5中的粘度降低方法来测量。可替代地,黄原胶的降解可以使用如实例6中所描述的还原末端方法来测量。

洗涤剂组合物:术语“洗涤剂组合物”是指用于从有待清洁的物品(例如纺织品、餐具和硬表面)去除不希望的化合物的组合物。该洗涤剂组合物可以用于例如清洁纺织品、餐具以及硬表面,用于家用清洁剂和工业清洁二者。这些术语涵盖选择用于希望的具体类型的清洁组合物和产品的形式(例如、液体、凝胶、粉末、颗粒、糊状、或喷雾组合物)的任何材料/化合物,并且包括但不限于洗涤剂组合物(例如,液体和/或固体衣物洗涤剂和精细织物洗涤剂;硬表面清洁配制品,如用于玻璃、木材、陶瓷和金属台面以及窗户;地毯清洁剂;炉灶清洁剂;织物清新剂;织物柔软剂;和纺织品和衣物预洗涤剂,连同餐具洗涤剂)。除了包含本发明的多肽之外,该洗涤剂配制品还可以包含一种或多种另外的酶(例如,黄原胶裂解酶、蛋白酶、淀粉酶、脂肪酶、角质酶、纤维素酶、内切葡聚糖酶、木葡聚糖酶、果胶酶、果胶裂解酶、黄原胶酶、过氧化物酶、卤代过氧合酶、过氧化氢酶以及甘露聚糖酶,或其任何混合物),和/或组分,例如表面活性剂、助洗剂、螯合剂(chelator)或螯合试剂(chelating agent)、漂白系统或漂白组分、聚合物、织物调理剂、增泡剂、抑泡剂、染料、香料、晦暗抑制剂、光学增亮剂、杀细菌剂、杀真菌剂、污垢悬浮剂、防蚀剂、酶抑制剂或稳定剂、酶激活剂、一种或多种转移酶、水解酶、氧化还原酶、上蓝剂和荧光染料、抗氧化剂以及增溶剂。

餐具洗涤:术语“餐具洗涤”是指所有形式的洗涤餐具,例如手动或自动餐具洗涤。洗涤餐具包括但不限于,清洁所有形式的陶器,例如盘子、杯子、玻璃杯、碗,所有形式的用餐工具,例如匙、刀、叉,以及上菜用具连同陶瓷,塑料,金属,瓷器,玻璃及丙烯酸酯。

餐具洗涤组合物:术语“餐具洗涤组合物”是指用于清洁硬表面的所有形式的组合物。本发明不局限于任何具体类型的餐具洗涤组合物或任何具体洗涤剂。

内切葡聚糖酶:术语“内切葡聚糖酶”意指一种内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3葡聚糖如谷类β-D-葡聚糖、木葡聚糖、黄原胶以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)。

对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶:术语“对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶”或“具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽”定义为对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶。本发明的内切葡聚糖酶对用黄原胶裂解酶预处理的黄原胶具有活性。在本发明的一个方面中,对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶是具有以下项中任一项中所示序列的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。可以如实例6中所披露地确定对用黄原胶裂解酶预处理的黄原胶的活性。

酶洗涤益处:在此将术语“酶洗涤益处”定义为将一种酶添加至洗涤剂中与不具有该酶的同一洗涤剂相比的有利效果。可以由酶提供的重要的洗涤益处是在洗涤和或清洁之后没有或有非常少的可见污垢的污物去除,预防或减少在洗涤过程中释放的污垢的再沉积(一种也被称作抗再沉积的效果),完全或部分恢复纺织品的白度(一种也被称作增白的效果),这些纺织品初始是白色的但是在重复使用和洗涤后获得浅灰色或浅黄色的外观。不直接与污垢的催化去污或其再沉积的预防相关的纺织品护理益处对于酶洗涤益处而言也是重要的。此类纺织品护理益处的实例是预防或减少染料从一织物转移至另一织物或同一织物的另一部分(一种也被称作染料转移抑制或抗返染的效果),从织物表面去除突出或断裂的纤维以减少起球倾向或去除已经存在的绒球或绒毛(一种也被称作抗起球的效果),改进织物柔软性,织物的颜色澄清以及去除陷在织物或服装的纤维中的微粒状污垢。酶漂白是一种另外的酶洗涤益处,其中通常将催化活性用于催化漂白组分(例如过氧化氢或其他过氧化物)的形成。

表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰以及分泌。

表达载体:术语“表达载体”意指线性或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。

片段:术语“片段”意指在成熟多肽的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有内切葡聚糖酶活性和/或对用黄原胶预处理的黄原胶具有活性。

糖苷水解酶家族:糖苷水解酶是催化糖基键水解以释放更小的糖的酶。存在超过100类的糖苷水解酶,这些糖苷水解酶已被分类为糖基水解酶(GH)家族,参见汉丽塞塔(Henrissat)等人(1991)‘基于氨基酸序列相似性的糖基水解酶分类(A classification of glycosyl hydrolases based on amino-acid sequence similarities)’,生物化学杂志(J.Biochem.)280:309-316和Uniprot网站,www.cazy.org

硬表面清洁:在此将术语“硬表面清洁”定义为清洁硬表面,其中硬表面可以包括地板、桌子、墙壁、屋顶等,连同硬物体的表面,例如汽车(汽车洗涤)和餐具(餐具洗涤)。餐具洗涤包括但不限于,清洁盘子、杯子、玻璃杯、碗、及刀具(例如匙、刀、叉)、上菜用具、陶瓷、塑料、金属、瓷器、玻璃及丙烯酸酯。

宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。

改进的洗涤性能:在此将术语“改进的洗涤性能”定义为一种(变体)酶(还有酶的共混物,不只是变体还有骨架,以及与某种清洁组合物组合,等)相对于亲本蛋白酶变体的洗涤性能展示出一种蛋白质变体的洗涤性能的改变,例如增加的去污。术语“洗涤性能”包括在衣物洗涤并且例如在餐具洗涤中的洗涤性能。

分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然发生的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中,例如,可以将宿主细胞进行遗传修饰来表达本发明的多肽。来自宿主细胞的发酵液将包括分离的多肽。

洗衣:术语“洗衣”涉及家用洗衣和工业洗衣两者并且意指用包含本发明的清洁或洗涤剂组合物的溶液处理纺织品的过程。洗衣过程可以例如使用例如家用或工业洗衣机进行或可以手动进行。

成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N末端加工、C末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。内切葡聚糖酶的成熟肽是:SEQ ID NO:2中的位置1至813,SEQ ID NO:4中的位置1至836,SEQ ID NO:6中的位置1至949,SEQ ID NO:8中的位置1至830,SEQ ID NO:10中的位置1至866,SEQ ID NO:12中的位置1至827,SEQ ID NO:14中的位置1至903,SEQ ID NO:16中的位置1至932,SEQ ID NO:18中的位置1至920,SEQ ID NO:20中的位置1至844,SEQ ID NO:22中的位置1至849,SEQ ID NO:24中的位置1至903,SEQ ID NO:26中的位置1至894,SEQ ID NO:28中的位置1至894,SEQ ID NO:30中的位置1至955,SEQ ID NO:32中的位置1至894,SEQ ID NO:34中的位置1至893,SEQ ID NO:36中的位置1至894,SEQ ID NO:38中的位置1至894,和SEQ ID NO:40中的位置1至867。

本领域中已知的是,一个宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C末端和/或N末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。

成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的成熟多肽的多核苷酸。内切葡聚糖酶基因的成熟肽编码部分是:SEQ ID NO:1中的位置67至2508,SEQ ID NO:3中的位置76至2583,SEQ ID NO:5中的位置67至2913,SEQ ID NO:7中的位置73至2562,SEQ ID NO:9中的位置115至2712,SEQ ID NO:11中的位置103至2565,SEQ ID NO:13中的位置1至2712,SEQ ID NO:15中的位置1至2799,SEQ ID NO:17中的位置1至2763,SEQ ID NO:19中的位置1至2535,SEQ ID NO:21中的位置1至2550,SEQ ID NO:23中的位置1至2712,SEQ ID NO:25中的位置1至2685,SEQ ID NO:27中的位置1至2685,SEQ ID NO:29中的位置1至2868,SEQ ID NO:31中的位置1至2685,SEQ ID NO:33中的位置1至2682,SEQ ID NO:35中的位置1至2685,SEQ ID NO:37中的位置1至2685,和SEQ ID NO:39中的位置1至2604。

核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。

可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。

序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:

(一致的残基X 100)/(比对长度-比对中的空位总数)

出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位拓展罚分0.5,和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:

(一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)

严格条件:术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在45℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。

术语“低严格条件”意指对于至少100个核苷酸长度的探针,按照标准DNA印迹程序在42℃于5X SSPE、0.3%SDS、200微克/ml剪切和变性的鲑精DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在50℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。

术语“中严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在55℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。

术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在60℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。

术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。

术语“非常高严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。

子序列:术语“子序列”是指具有从成熟多肽编码序列的5’和/或3’端缺失的一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的片段。

纺织品:术语“纺织品”意指包括纱线、纱线中间体、纤维、非机织物材料、天然材料、合成材料、以及任何其他纺织品材料的任何纺织品材料,这些材料制造的织物和由这些织物制成的产品(例如服装和其他物品)。该纺织品或织物可以处于针织品、机织物、牛仔布、非机织物、毡、纱线、以及毛巾布的形式。这些纺织品可以是纤维素基的,如天然纤维素,包括棉布、亚麻/亚麻布、黄麻、苎麻、剑麻或椰壳纤维或者人造纤维素(例如,来源于木浆),包括纤维胶/人造丝、苎麻、醋酸纤维素纤维(三胞)、莱赛尔纤维(lyocell)或其共混物。纺织品或织物也可以不基于纤维素,如天然聚酰胺,包括羊毛、驼毛、羊绒、马海毛、兔毛和蚕丝或合成聚合物如尼龙、芳族聚酰胺、聚酯、丙烯酸、聚丙烯和氨纶/弹性纤维(spandex/elastane)、或其共混物其以及基于纤维素和不基于纤维素的纤维的共混物。共混物的例子是棉和/或人造丝/纤维胶与一种或多种伴随材料的共混物,该伴随材料例如是羊毛、合成纤维(例如聚酰胺纤维、丙烯酸纤维、聚酯纤维、聚乙烯醇纤维、聚氯乙烯纤维、聚亚胺酯纤维、聚脲纤维、芳族聚酰胺纤维)以及含纤维素的纤维(例如人造丝/纤维胶、苎麻、亚麻/亚麻布、黄麻、醋酸纤维素纤维、莱赛尔纤维)。织物可以是常规的可洗涤衣物,例如弄脏的家居衣物。当使用术语织物或衣服时,旨在也包括广义术语纺织品。

纺织品护理益处:不直接与污垢的催化去污或其再沉积的预防相关的纺织品护理益处对于酶洗涤益处而言也是重要的。此类纺织品护理益处的实例是预防或减少染料从一纺织品转移至另一纺织品或同一纺织品的另一部分(一种也被称作染料转移抑制或抗返染的效果),从纺织品表面去除突出或断裂的纤维以减少起球倾向或去除已经存在的绒球或绒毛(一种也被称作抗起球的效果),改进纺织品柔软性,纺织品的颜色澄清以及去除陷在纺织品的纤维中的微粒状污垢。酶漂白是一种另外的酶洗涤益处,其中通常将催化活性用于催化漂白组分(例如过氧化氢或其他过氧化物或其他漂白种类)的形成。

变体:术语“变体”意指具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶活性的多肽,并且在一个或多个(例如,若干个)位置包括改变,即取代、插入和/或缺失。取代意指占据位置的氨基酸替换不同的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据位置的氨基酸之后添加氨基酸。

洗涤性能:术语“洗涤性能”被用作酶在例如洗涤或硬表面清洁过程中去除存在于有待清洁的物体上的污渍的能力。可以通过计算如‘用于衣物洗涤的自动机械应力测定(AMSA)’中的所谓的强度值(Int)或如WO2013/167581中所定义的反射值(Rem)来量化洗涤性能的改进。

白度:在此将术语“白度”定义为在不同领域并且针对不同顾客具有不同含义的广义术语。白度的损失可以例如归因于灰化、黄化、或光学增亮剂/调色剂的去除。灰化和黄化可归因于污垢再沉积、身体污垢、来自例如铁和铜离子或染料转移的着色。白度可包括来自以下列表的一个或若干个问题:着色剂或染料作用;不完全污物去除(例如身体污垢、皮脂等);再沉积(物体的灰化、黄化或其他变色)(去除的污垢与纺织品的其他部分(弄脏的或未弄脏的)再关联);在应用过程中纺织品的化学变化;以及颜色的澄清或淡色化。

黄原胶裂解酶:在此将术语“黄原胶裂解酶”定义为一种切割黄原胶中的β-D-甘露糖基-β-D-1,4-葡萄糖醛酸基键的酶(EC 4.2.2.12)。出于本发明的目的,根据实例6中所述的程序确定黄原胶裂解酶活性。

发明详述

本发明提供了对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶以及编码这些多肽的多核苷酸。内切葡聚糖酶不属于已知包括降解黄原胶的酶的GH家族。另外,黄原胶裂解酶与对用黄原胶裂解酶预处理的黄原胶具有活性的本发明的内切葡聚糖酶的组合示出超过单独使用黄原胶裂解酶或对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶的协同的改进洗涤性能。此外,酶可以对任何底物纤维素,凝胶多糖和β-葡聚糖具有活性。

对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶

在一个实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,该多肽具有对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶。在一个方面中,这些多肽与SEQ ID NO:14的成熟多肽的区别不超过50个氨基酸,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、或49个。在一个优选方面中,该多肽与以下项中任一项的成熟多肽相差高达10个氨基酸,例如1、2、3、4、5、6、7、8、9、或10个:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少70%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少75%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少80%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少85%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少90%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少95%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少100%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。

在一个实施例中,该多肽已经被分离。

本发明的多肽优选地包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的氨基酸1至846或其等位基因变体,或由其组成;或者是其具有内切葡聚糖酶活性和/或黄原胶降解活性的片段。在另一个方面中,该多肽包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽,或由其组成。

在另一个实施例中,本发明涉及具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶活性的多肽,该多肽由多核苷酸编码,该多核苷酸在高严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39的成熟多肽编码序列,或(ii)(i)的全长补体杂交(萨姆布鲁克(Sambrook)等人,1989,分子克隆实验手册(Molecular Cloning,A Laboratory Manual),第2版,冷泉港,纽约)。在一个实施例中,该多肽已经被分离。

可以根据本领域中熟知的方法,使用SEQ ID NO:1的多核苷酸或其子序列,连同SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的多肽或其片段来设计核酸探针,以鉴定并且克隆编码多肽的DNA,这些多肽具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性。具体地,可以遵循标准DNA印迹程序,使用此类探针与来自不同属或物种的菌株的感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的对应基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。

可以筛选从此类其他菌株制备的基因组DNA或cDNA文库的与上述探针杂交并且编码本发明的多肽的DNA。来自此类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳、或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项、或其子序列杂交的克隆或DNA,在DNA印迹中使用载体材料。

出于本发明的目的,杂交指示多核苷酸在非常低至非常高严格条件下与对应于以下项的标记的核酸探针杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项;(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列;(iii)其全长补体;或(iv)其子序列。在这些条件下与该核酸探针杂交的分子可以使用例如X射线薄膜或本领域中已知的任何其他检测手段进行检测。

在一个方面中,该核酸探针是核苷酸,该核苷酸是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的子序列。在另一个方面中,该核酸探针是多核苷酸,该多核苷酸编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的多肽;其成熟肽;或其片段。在另一个方面中,该核酸探针是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项。

在另一个实施例中,本发明涉及具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,该多肽由多核苷酸编码,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在另外的实施例中,该多肽已经被分离。

在另一个实施例中,本发明涉及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个(例如,若干个)位置包括取代、缺失、和/或插入。在一个实施例中,引入SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽中的氨基酸取代、缺失和/或插入的数量高达10个,例如,1、2、3、4、5、6、7、8、9、或10个。这些氨基酸变化可以具有微小性质,即,不会显著地影响蛋白的折叠和/或活性的保守氨基酸取代或插入;小缺失,典型地为1-30个氨基酸;小氨基或羧基-末端延伸,如氨基末端甲硫氨酸残基;高达20-25个残基的小连接肽;或便于通过改变净电荷或另一种功能来纯化的较小延伸,例如His-标记(聚组氨酸段)、抗原表位或结合结构域。

保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约中描述。常见的取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。

可替代地,氨基酸改变具有这样一种性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。

可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(坎宁汉(Cunningham)和威尔斯(Wells),1989,科学(Science)244:1081-1085)来鉴定多肽中的必需氨基酸。在后一技术中,在分子中的每个残基处引入单一的丙氨酸突变,并对得到的分子测试内切葡聚糖酶活性和/或黄原胶降解活性从而鉴定对分子活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见,例如德·沃斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;Wlodaver等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。还可以从与相关多肽的比对推断鉴定必需氨基酸。

可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。

可以结合诱变/改组方法与高通量自动化筛选方法来检测由宿主细胞表达的克隆的、诱变的多肽的活性(内斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。

多肽可以是杂合多肽,其中一个多肽的区域融合在另一多肽的区域的N末端或C末端。

多肽还可以是融合多肽或可切割的融合多肽,其中另一多肽融合在本发明的多肽的N-末端或C-末端。通过将编码另一多肽的多核苷酸融合到本发明的多核苷酸而产生融合多肽。用于产生融合多肽的技术在本领域是已知的,并且包括连接编码多肽的编码序列,这样使得它们在框内并且使得融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。融合多肽还可以使用内含肽技术来构建,其中融合多肽在翻译后产生(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学(Science)266:776-779)。

融合多肽可以在两种多肽之间进一步包括切割位点。在融合蛋白分泌之时,该位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在如下文献中披露的位点:马丁(Martin)等人,2003,工业微生物学生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576;Svetina等人,2000,生物技术杂志(J.Biotechnol.)76:245-251;拉斯马森-威尔逊(Rasmussen-Wilson)等人,1997,应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技术(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技术9:378-381;伊顿(Eaton)等人,1986,生物化学(Biochemistry)25:505-512;Collins-Racie等人,1995,生物技术13:982-987;卡特(Carter)等人,1989,蛋白质:结构、功能和遗传学(Proteins:Structure,Function,and Genetics)6:240-248;和史蒂文斯(Stevens),2003,世界药物发现(Drug Discovery World)4:35-48。

具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽的来源

本发明的多肽可获得自任何属的微生物。出于本发明的目的,如在此结合给定的来源使用的术语“从…中获得”应意指由多核苷酸编码的多肽是由该来源或者由其中已经插入来自该来源的多核苷酸的菌株产生的。在一个方面中,获得自给定来源的多肽被分泌到细胞外。

在一个方面中,该多肽是细菌多肽。在一个方面中,该多肽是真菌多肽。在一个方面中,该多肽是从以下项中任一项获得的多肽:赖文氏菌属(Lewinella)物种、Chthoniobacter物种、闪烁杆菌属(Fervidibacteria)物种、丰佑菌科(Opitutaceae)物种、迪克亚杆菌属(Dickeya)物种、Teredinibacter物种、和Diplosphaera物种,这些包括以下物种:Lewinella cohaerens、Chthoniobacter flavus、Teredinibacter turnerae、和Diplosphaera colitermitum。

这种以及相关物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(NRRL)。

可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得该多肽。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦用一种或多种探针检测到编码多肽的多核苷酸,就可以通过使用本领域普通技术人员已知的技术分离或克隆该多核苷酸(参见,例如,萨姆布鲁克(Sambrook)等人,1989,见上文)。

多核苷酸

本发明还涉及编码本发明的多肽的多核苷酸,如在此所述。在一个实施例中,编码本发明的多肽的多核苷酸已经被分离。

用于分离或克隆多核苷酸的技术是本领域中已知的并且包括从基因组DNA或cDNA,或其组合进行分离。来自基因组DNA的多核苷酸的克隆可以例如通过使用众所周知的聚合酶链反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,伊尼斯(Innis)等人,1990,PCR:方法和应用指南(PCR:A Guide to Methods and Application),学术出版社(Academic Press),纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自赖文氏菌属物种、Chthoniobacter物种、闪烁杆菌属物种、丰佑菌科物种、迪克亚杆菌属物种、Teredinibacter物种、和Diplosphaera物种,包括以下物种:Lewinella cohaerens、Chthoniobacter flavus、Teredinibacter turnerae、和Diplosphaera colitermitum,或者相关有机体的菌株,并且因此例如可以是多核苷酸的多肽编码区域的等位基因的或物种的变体。

修饰编码本发明的多肽的多核苷酸对于合成与所述多肽基本上类似的多肽可为必需的。术语“基本上类似”于该多肽是指该多肽的非天然存在的形式。这些多肽可能以某种工程化方式而不同于从其天然来源分离的多肽,例如在比活性、热稳定性、最适pH等方面不同的变体。这些变体可以基于以SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列,例如,其子序列形式呈现的多核苷酸,和/或通过引入不会改变该多肽的氨基酸序列,但对应于预定用于产生该酶的宿主生物体的密码子用法的核苷酸取代,或通过引入可以产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的一般描述,参见例如福德(Ford)等人,1991,蛋白质表达与纯化(Protein Expression and Purification)2:95-107。

核酸构建体

本发明还涉及核酸构建体,这些核酸构建体包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,这些控制序列指导编码序列在适合的宿主细胞中表达。

可以用许多方式操作所述多核苷酸以便于多肽的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

该控制序列可以是启动子,即,被宿主细胞识别以对编码本发明的多肽的多核苷酸进行表达的多核苷酸。该启动子包含转录控制序列,这些序列介导该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短型及杂合型启动子,并且可以由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明的核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金杆菌cryIIIA基因(阿盖塞(Agaisse)和勒尔克吕(Lereclus),1994,分子微生物学(Molecular Microbiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(埃贡(Egon)等人,1988,基因(Gene)69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-卡马洛夫(Villa-Kamaroff)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:3727-3731)以及tac启动子(德波尔(DeBoer)等人,1983,美国国家科学院院刊80:21-25)。其他启动子描述在吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94的“来自重组细菌的有用蛋白质(Useful proteins from recombinant bacteria)”;以及在萨姆布鲁克(Sambrook)等人,1989,同上。串联启动子的实例披露在WO 99/43835中。

在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下各项的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶–样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其变体、截短型及杂合型启动子。其他启动子描述于美国专利号6,011,147中。

在酵母宿主中,有用的启动子获得自以下各项的基因:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇去氢酶/甘油醛-3-磷酸去氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3-磷酸甘油酸激酶。罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488描述了酵母宿主细胞的其他有用的启动子。

控制序列还可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3'末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。

用于细菌宿主细胞的优选终止子是从克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)以及大肠杆菌核糖体RNA(rrnB)的基因获得。

用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。

用于酵母宿主细胞的优选终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得。用于酵母宿主细胞的其他有用的终止子由罗马诺斯(Romanos)等人,1992,见上文描述。

该控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加该基因的表达。

适合的mRNA稳定子区的实例是从以下获得的:苏云金杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人,1995,细菌学杂志(Journal of Bacteriology)177:3465-3471)。

该控制序列还可以是前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导子可操作地连接到编码该多肽的多核苷酸的5'末端。可以使用在宿主细胞中起作用的任何前导子。

用于丝状真菌宿主细胞的优选前导子是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

酵母宿主细胞的适合的前导子是从以下各项的基因中获得的:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇去氢酶/甘油醛-3-磷酸去氢酶(ADH2/GAP)。

控制序列还可以是一种多腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。

有用于酵母宿主细胞的多腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中描述。

控制序列还可以是编码连接至多肽的N-末端的信号肽并指导该多肽进入细胞的分泌途径的信号肽编码区域。多核苷酸的编码序列的5’端本身可包含在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,该编码序列的5’末端可以包含对于该编码序列来说是外来的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可简单地替换天然的信号肽编码序列以便增强该多肽的分泌。然而,可以使用指导所表达多肽进入宿主细胞的分泌通路的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从以下各项的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)以及枯草芽孢杆菌prsA。西蒙纳(Simonen)和帕尔瓦(Palva),1993,微生物学评论(Microbiological Reviews)57:109-137描述了另外的信号肽。

用于丝状真菌宿主细胞的有效信号肽编码序列是获得自以下各项的基因的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶以及米黑毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽获得自以下项的基因:酿酒酵母α-因子和酿酒酵母转化酶。罗马诺斯(Romanos)等人,1992,见上文,描述了其他有用的信号肽编码序列。

控制序列还可以是编码位于多肽的N-末端的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下各项的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α-因子。

当信号肽和前肽序列同时存在时,前肽序列的位置紧邻于多肽的N-末端,且信号肽序列的位置紧邻于前肽序列的N-末端。

还可能希望地是添加调节序列,这些调节序列相对于宿主细胞的生长来调节多肽的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。

表达载体

本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该多肽的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是线性的或闭合的环状质粒。

该载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可以包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入宿主细胞的基因组中的总DNA)或转座子。

该载体优选包含允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。

细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(如氨比西林、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。优选在木霉属细胞中使用的是adeA、adeB、amdS、hph以及pyrG基因。

选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一个方面中,双选择性标记是hph-tk双选择性标记系统。

载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制,该载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体可在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。

用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO00/24883中的方法完成。

可以将本发明的多核苷酸的多于一个拷贝插入宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,同上)。

宿主细胞

本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接到一个或多个控制序列的本发明的多核苷酸,这些控制序列指导本发明的多肽的产生。将包括多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。

该宿主细胞可以是有用于重组产生本发明的多肽的任何细胞,例如原核细胞或真核细胞。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。

细菌宿主细胞可以是任何芽孢杆菌细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、以及苏云金杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌以及马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌细胞,包括但不局限于不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰链丝菌、以及浅青紫链霉菌细胞。

将DNA引入芽孢杆菌属细胞中可通过以下来实现:原生质体转化(参见例如,张(Chang)和科恩(Cohen),1979,分子遗传学与基因组学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见,例如,杨格(Young)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:823-829;或杜拜努(Dubnau)以及大卫杜夫-阿贝尔森(Davidoff-Abelson),1971,分子生物学杂志(J.Mol.Biol.)56:209-221)、电穿孔(参见,例如,茂川(Shigekawa)和道尔(Dower),1988,生物技术(Biotechniques)6:742-751)、或者接合(参见,例如克勒(Koehler)和索恩(Thorne),1987,细菌学杂志169:5271-5278)。将DNA引入大肠杆菌细胞中可通过以下来实现:原生质体转化(参见例如,哈纳汗(Hanahan),1983,分子生物学杂志(J.Mol.Biol.)166:557-580)或电穿孔(参见例如,道尔(Dower)等人,1988,核酸研究(Nucleic Acids Res.)16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现:原生质体转化、电穿孔(参见例如,贡(Gong)等人,2004,叶线形微生物学(Folia Microbiol.)(Praha(布拉格))49:399-405)、接合(参见例如,马佐迪耶(Mazodier)等人,1989,细菌学杂志(J.Bacteriol.)171:3583-3585)、或转导(参见例如,伯克(Burke)等人,2001,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)98:6289-6294)。将DNA引入假单孢菌属细胞中可通过以下来实现:电穿孔(参见例如,蔡(Choi)等人,2006,微生物学方法杂志(J.Microbiol.Methods)64:391-397)或接合(参见例如,皮内多(Pinedo)和斯梅茨(Smets),2005,应用与环境微生物学(Appl.Environ.Microbiol.)71:51-57)。将DNA引入链球菌属细胞中可通过以下来实现:天然感受态(参见,例如,佩里(Perry)和藏满(Kuramitsu),1981,感染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见,例如,凯特(Catt)和乔力克(Jollick),1991,微生物学(Microbios)68:189-207)、电穿孔(参见,例如,巴克利(Buckley)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol.)65:3800-3804)、或者接合(参见,例如,克莱威尔(Clewell),1981,微生物学评论(Microbiol.Rev.)45:409-436)。然而,可以使用本领域已知的用于将DNA引入宿主细胞中的任何方法。

宿主细胞还可以是真核细胞,如哺乳动物、昆虫、植物、或真菌细胞。

宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、以及接合菌门(Zygomycota)、连同卵菌门(Oomycota)和全部有丝分裂孢子真菌(如由霍克斯沃思(Hawksworth)等人在安斯沃思和拜斯比真菌词典(Ainsworth and Bisby’s Dictionary of The Fungi),第8版,1995,国际应用生物科学中心(CAB International),大学出版社(University Press),英国剑桥(Cambridge,UK)中进行定义的)。

该真菌宿主细胞可以是酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类在将来可能有变化,出于本发明的目的,酵母应如酵母生物学和活动性(Biology and Activities of Yeast)(斯金纳(Skinner)、帕斯莫尔(Passmore)、以及达文波特(Davenport)编辑,应用细菌学学会讨论会(Soc.App.Bacteriol.Symposium)系列第9期,1980)所述地进行定义。

酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁弗酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂耶氏酵母(Yarrowia lipolytica)细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由霍克斯沃思等人,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。

丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

可以通过涉及原生质体形成、原生质体转化、以及以本身已知的方式进行细胞壁再生的过程来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法由马拉迪尔(Malardier)等人,1989,基因(Gene)78:147-156、以及WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),在阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编,酵母遗传学与分子生物学指南(Guide to Yeast Genetics and Molecular Biology),酶学方法(Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology),第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;伊藤(Ito)等人,1983,细菌学杂志(J.Bacteriol.)153:163;以及Hinnen等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:1920。

生产方法

本发明还涉及产生本发明的多肽的方法,包含(a)在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽;并且可任选地(b)回收该多肽。在一个方面中,该细胞是浮霉状菌属细胞。在另一个方面中,该细胞是来自浮霉状菌属物种R1菌株的细胞。

本发明还涉及产生本发明的多肽的方法,这些方法包括(a)在有益于产生该多肽的条件下培养本发明的重组宿主细胞;并且可任选地(b)回收该多肽。

这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如,可以通过在适合的培养基中和在允许表达和/或分离该多肽的条件下,进行摇瓶培养,或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续,分批,分批补料,或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳和氮来源及无机盐。合适的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中,那么可直接从培养基中回收多肽。如果多肽不被分泌,那么其可从细胞裂解液中进行回收。

可以使用特异性针对这些多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该多肽的活性。

可以使用本领域已知的方法来回收多肽。例如,该多肽可以通过常规程序,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从该营养培养基回收。在一个方面中,回收包括该多肽的发酵液。

可以通过本领域中已知的多种程序来纯化该多肽以获得基本上纯的多肽,这些程序包括但不限于:色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或提取(参见例如,蛋白纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编辑,VCH出版社(VCH Publishers),纽约,1989)。

在替代性方面中,没有回收该多肽,而是将表达该多肽的本发明的宿主细胞用作该多肽的来源。

植物

本发明还涉及分离的植物,例如转基因植物、植物部分或植物细胞,这些植物包括本发明的多肽,从而表达并且产生可回收的量的多肽。该多肽可以从植物或植物部分回收。可替代地,可以按原样将包含该多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性、以及流变性质,或用以破坏抗营养因子。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草甸草(蓝草,早熟禾属);饲草,如羊茅属(Festuca)、黑麦草属(Lolium);温带草,如翦股颖属(Agrostis);以及谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。

双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugar beet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(family Brassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。

植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包括这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室,如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外,任何植物细胞,无论是何种组织来源,都被认为是植物部分。同样地,植物部分,如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分,例如胚、胚乳、糊粉和种皮。

同样包括于本发明范围内的是此类植物、植物部分以及植物细胞的子代。

表达多肽的转基因植物或植物细胞可以根据本领域已知的方法构建。

本发明还涉及产生本发明的多肽的方法,这些方法包括(a)在有益于产生该多肽的条件下培养转基因植物或植物细胞,该转基因植物或植物细胞包括编码该多肽的多核苷酸;以及(b)回收该多肽。

发酵液配制品或细胞组合物

本发明还涉及包含本发明的多肽的发酵液配制品或细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分,例如像,细胞(包括含有编码本发明的多肽的基因的宿主细胞,这些宿主细胞被用于产生感兴趣的多肽)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是含有一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。

如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。例如,当微生物培养物生长至饱和,在碳限制条件下孵育以允许蛋白质合成(例如,由宿主细胞进行酶的表达)并且分泌到细胞培养基中时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。

在一个实施例中,该发酵液配制品和细胞组合物包括第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在一个具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐、或两种或更多种前述酸的混合物并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐、或两种或更多种前述酸的混合物。

在一个方面中,该组合物包含一种或多种有机酸,并且任选地进一步包含杀死的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀死的细胞和/或细胞碎片,以提供不含这些组分的组合物。

这些发酵液配制品或细胞组合物可以进一步包含一种防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。

该细胞杀灭的全培养液或组合物可以包含在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白合成之后存在的细胞碎片。在一些实施例中,细胞杀灭的全培养液或组合物含有用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中,可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。

如在此描述的全培养液或细胞组合物典型地是液体,但是可以含有不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以去除不溶性组分以提供澄清的液体组合物。

可以通过WO 90/15861或WO 2010/096673所述的方法产生本发明的全培养液配制品和细胞组合物。

洗涤剂组合物

在一个实施例中,本发明涉及包括分离的内切葡聚糖酶的洗涤剂组合物,该分离的内切葡聚糖酶对用黄原胶裂解酶预处理的黄原胶具有活性,并且与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%,例如,至少65%、至少70%、至少70%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一个实施例中,本发明针对洗涤剂组合物,该洗涤剂组合物包含结合一种或多种额外的清洁组合物组分的本发明的酶。另外的组分的选择在普通技术人员技术内并且包括常规成分,包括以下列出的示例性、非限制性组分。

对于纺织品护理,组分的选择可以包括以下考虑:有待清洁的纺织品的类型、污物的类型和/或程度、进行清洁时的温度以及洗涤剂产品的配制。尽管根据一种具体的功能性将以下提及的组分通过一般标题进行了分类,但是由于该组分可能具有熟练的业内人士将领会的一种或多种另外的功能,因此不应该将这理解为限制。

洗涤剂组合物可以适于洗涤纺织品,例如像织物、衣服或亚麻布,或用于清洁硬表面,例如像地板、桌子、或餐具洗涤。

本发明的酶-在本发明的一个实施例中,可以将本发明的多肽以对应于以下的量添加至一种洗涤剂组合物中:每升的洗涤液0.0001-200mg的酶蛋白,例如0.0005-100mg的酶蛋白,优选0.001-30mg的酶蛋白,更优选0.005-8mg的酶蛋白,甚至更优选0.01-2mg的酶蛋白。

用于在自动洗碗机(ADW)中使用的组合物例如可以包括按该组合物的重量计0.0001%-50%,例如0.001%-20%,例如0.01%-10%,例如0.05%-5%的酶蛋白。

用于在洗衣造粒(laundry granulation)中使用的组合物例如可以包含按该组合物的重量计0.0001%-50%,例如0.001%-20%,例如0.01%-10%,例如0.05%-5%的酶蛋白。

用于在洗衣液中使用的组合物例如可以包括按该组合物的重量计0.0001%-10%,例如0.001%-7%,例如0.1%-5%的酶蛋白。

可以使用常规稳定剂稳定本发明的洗涤剂组合物的一种或多种酶,这些常规稳定剂例如是多元醇,例如丙二醇或甘油、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如芳香族硼酸酯,或苯基硼酸衍生物,例如4-甲酰苯基硼酸,并且可以如在例如WO 92/19709和WO 92/19708中所述配制该组合物。

在某些市场中,不同洗涤条件并且就其本身而言,使用不同类型的洗涤剂。这披露于例如EP 1 025 240中。例如,在亚洲(日本)使用低的洗涤剂浓度体系,而美国使用中等洗涤剂浓度体系,并且欧洲使用高的洗涤剂浓度体系。

低的洗涤剂浓度体系包含以下洗涤剂,其中在洗涤水中存在少于约800ppm的洗涤剂组分。日本洗涤剂典型地被认为是低的洗涤剂浓度体系,因为它们具有存在于洗涤水中的大约667ppm的洗涤剂组分。

中等洗涤剂浓度体系包含以下洗涤剂,其中在洗涤水中存在约800ppm与约2000ppm之间的洗涤剂组分。北美洗涤剂通常被认为是中等洗涤剂浓度体系,因为它们具有存在于洗涤水中的大约975ppm的洗涤剂组分。

高的洗涤剂浓度体系包含以下洗涤剂,其中在洗涤水中存在多于约2000ppm的洗涤剂组分。欧洲洗涤剂通常被认为是高的洗涤剂浓度体系,因为在洗涤水中它们具有大约4500-5000ppm的洗涤剂组分。

拉丁美洲洗涤剂通常是高泡沫磷酸盐助洗剂洗涤剂并且在拉丁美洲使用的洗涤剂的范围可以落入中等和高的洗涤剂浓度两者中,因为在洗涤水中它们的洗涤剂组分的范围从1500ppm至6000ppm。此类洗涤剂组合物都是本发明的实施例。

本发明的多肽还可以结合到WO 97/07202中所披露的洗涤剂配制品中,通过引用将其结合在此。

表面活性剂-洗涤剂组合物可以包括一种或多种表面活性剂,它们可以是阴离子的和/或阳离子的和/或非离子的和/或半极性的和/或兼性离子的或其混合物。在一个具体实施例中,洗涤剂组合物包括一种或多种非离子型表面活性剂和一种或多种阴离子表面活性剂的混合物。这种或这些表面活性剂典型地以按重量计从约0.1%至60%的水平存在,例如约1%至约40%、或约3%至约20%、或约3%至约10%。基于所希望的清洁应用来选择这种或这些表面活性剂,并且这种或这些表面活性剂包括本领域中已知的任何一种或多种常规表面活性剂。可以利用本领域中已知的用于在洗涤剂中使用的任何表面活性剂。

当包含在其中时,所述去污剂通常将会含有按重量计约1%至约40%,例如约5%至约30%,包括约5%至约15%,或约20%至约25%的阴离子型表面活性剂。阴离子表面活性剂的非限制性实例包括硫酸盐和磺酸盐,具体地,直链烷基苯磺酸盐(LAS),LAS的异构体,支链烷基苯磺酸盐(BABS),苯基链烷磺酸盐,α-烯烃磺酸盐(AOS),烯烃磺酸盐,链烯烃磺酸盐,链烷-2,3-二基双(硫酸盐),羟基链烷磺酸盐以及二磺酸盐,烷基硫酸盐(AS)(例如十二烷基硫酸钠(SDS)),脂肪醇硫酸盐(FAS),伯醇硫酸盐(PAS),醇醚硫酸盐(AES或AEOS或FES,也被称为醇乙氧基硫酸盐或脂肪醇醚硫酸盐),仲链烷磺酸盐(SAS),石蜡烃磺酸盐(PS),酯磺酸盐,磺化的脂肪酸甘油酯,α-磺酸基脂肪酸甲酯(α-SFMe或SES)(包括甲酯磺酸盐(MES)),烷基琥珀酸或烯基琥珀酸,十二烯基/十四烯基琥珀酸(DTSA),氨基酸的脂肪酸衍生物,磺酸基琥珀酸或皂的二酯和单酯,以及它们的组合。

当被包括在其中时,洗涤剂将通常包含按重量计从约0%至约10%的阳离子表面活性剂。阳离子表面活性剂的非限制性实例包括烷基二甲基乙醇季胺(ADMEAQ)、十六烷基三甲基溴化铵(CTAB)、二甲基二硬脂酰氯化铵(DSDMAC)、以及烷基苄基二甲基铵、烷基季铵化合物、烷氧基化季铵(AQA)化合物及其组合。

当被包括在其中时,洗涤剂将通常包含按重量计从约0.2%至约40%的非离子型表面活性剂,例如从约0.5%至约30%,特别是从约1%至约20%、从约3%至约10%,例如从约3%至约5%、或从约8%至约12%。非离子型表面活性剂的非限制性实例包括醇乙氧基化物(AE或AEO)、醇丙氧基化物、丙氧基化的脂肪醇(PFA),烷氧基化的脂肪酸烷基酯(例如乙氧基化的和/或丙氧基化的脂肪酸烷基酯),烷基酚乙氧基化物(APE),壬基酚乙氧基化物(NPE),烷基多糖苷(APG),烷氧基化胺,脂肪酸单乙醇酰胺(FAM),脂肪酸二乙醇酰胺(FADA),乙氧基化的脂肪酸单乙醇酰胺(EFAM),丙氧基化的脂肪酸单乙醇酰胺(PFAM),多羟基烷基脂肪酸酰胺,或葡萄糖胺的N-酰基N-烷基衍生物(葡糖酰胺(GA),或脂肪酸葡糖酰胺(FAGA)),连同在SPAN和TWEEN商品名下可获得的产品及其组合。

当被包括在其中时,洗涤剂将通常包含按重量计从约0%至约10%的半极性表面活性剂。半极性表面活性剂的非限制性实例包括氧化胺(AO),例如烷基二甲基氧化胺、N-(椰油基烷基)-N,N-二甲基氧化胺和N-(牛油-烷基)-N,N-双(2-羟乙基)氧化胺、脂肪酸链烷醇酰胺和乙氧基化的脂肪酸链烷醇酰胺及其组合。

当被包括在其中时,洗涤剂将通常包含按重量计从约0%至约10%的兼性离子表面活性剂。兼性离子表面活性剂的非限制性实例包括甜菜碱、烷基二甲基甜菜碱、磺基甜菜碱及其组合。

助水溶剂-助水溶剂是如下化合物,该化合物在水性溶液中溶解疏水化合物(或相反地,在非极性环境中的极性物质)。一般地,助水溶物具有亲水和疏水两种特征(所谓的两亲性质,如由表面活性剂已知的);然而,助水溶剂的分子结构一般不利于自发性自聚集,参见例如通过霍奇登(Hodgdon)和卡勒(Kaler)(2007),胶体&界面科学新见(Current Opinion in Colloid&Interface Science)12:121-128的综述。助水溶剂并不显示临界浓度,高于该浓度就会发生如对表面活性剂而言所发现的自聚集以及脂质形成胶束、薄层或其他很好地定义的中间相。相反,许多助水溶物显示连续类型的聚集过程,其中聚集物的大小随着浓度增加而增长。然而,很多助水溶剂改变了包括极性和非极性特征的物质的系统(包括水、油、表面活性剂、和聚合物的混合物)的相行为、稳定性、和胶体特性。经典地从制药、个人护理、食品跨行业至技术应用使用助水溶剂。助水溶剂在洗涤剂组合物中的使用允许例如更浓的表面活性剂配制品(如在通过去除水而压缩液体洗涤剂的过程中)而不引起不希望的现象,例如相分离或高粘度。

洗涤剂可以包含按重量计0-5%,例如约0.5%至约5%、或约3%至约5%的助水溶剂。可以利用本领域中已知的用于在洗涤剂中使用的任何助水溶剂。助水溶剂的非限制性实例包括苯磺酸钠、对甲苯磺酸钠(STS)、二甲苯磺酸钠(SXS)、枯烯磺酸钠(SCS)、伞花烃磺酸钠、氧化胺、醇和聚乙二醇醚、羟基萘甲酸钠、羟基萘磺酸钠、乙基己基磺酸钠及其组合。

助洗剂或共助洗剂-该洗涤剂组合物可以包含按重量计约0-65%,例如约5%至约45%的洗涤剂助洗剂或共助洗剂、或其混合物。在洗涤餐具洗涤剂中,助洗剂的水平典型地是40%-65%,特别是50%-65%。助洗剂和/或共助洗剂可以具体是形成具有Ca和Mg的水溶性复合物的螫合剂。可以利用本领域中已知的用于在衣物洗涤剂中使用的任何助洗剂和/或共-助洗剂。助洗剂的非限制性实例包括沸石、二磷酸盐(焦磷酸盐)、三磷酸盐例如三磷酸钠(STP或STPP)、碳酸盐例如碳酸钠、可溶性硅酸盐例如硅酸钠、层状硅酸盐(例如,来自赫斯特公司(Hoechst)的SKS-6)、乙醇胺例如2-氨基乙-1-醇(MEA)、二乙醇胺(DEA,也称为亚氨基二乙醇)、三乙醇胺(TEA,也称为2,2’,2”-次氨基三乙醇)、以及羧甲基菊粉(CMI)及其组合。

洗涤剂组合物还可以包含按重量计0-20%,例如约5%至约10%的洗涤剂共助洗剂或其混合物。洗涤剂组合物可以单独地包括一种共助洗剂,或与一种助洗剂,例如沸石助洗剂组合。共助洗剂的非限制性实例包括聚丙烯酸酯的均聚物或其共聚物,例如聚(丙烯酸)(PAA)或共聚(丙烯酸/马来酸)(PAA/PMA)。另外的非限制性实例包括柠檬酸盐,螯合剂,例如氨基羧酸盐、氨基多羧酸盐和膦酸盐,以及烷基-或烯基琥珀酸。另外的具体实例包括2,2’,2”-次氨基三乙酸(NTA)、乙二胺四乙酸(EDTA)、二亚乙基三胺五乙酸(DTPA)、亚氨基二丁二酸(iminodisuccinic acid)(IDS)、乙二胺-N,N’-二丁二酸(EDDS)、甲基甘氨酸二乙酸(MGDA)、谷氨酸-N,N-二乙酸(GLDA)、1-羟基乙烷-1,1-二膦酸(HEDP)、乙二胺四-(亚甲基膦酸)(EDTMPA)、二亚乙基三胺五(亚甲基膦酸)(DTPMPA或DTMPA)、N-(2-羟乙基)亚氨基二乙酸(EDG)、天冬氨酸-N-单乙酸(ASMA)、天冬氨酸-N,N-二乙酸(ASDA)、天冬氨酸-N-单丙酸(ASMP)、亚氨基二丁二酸(iminodisuccinic acid)(IDA)、N-(2-磺甲基)-天冬氨酸(SMAS)、N-(2-磺乙基)-天冬氨酸(SEAS)、N-(2-磺甲基)-谷氨酸(SMGL)、N-(2-磺乙基)-谷氨酸(SEGL)、N-甲基亚氨基二乙酸(MIDA)、α-丙氨酸-N,N-二乙酸(α-ALDA)、丝氨酸-N,N-二乙酸(SEDA)、异丝氨酸-N,N-二乙酸(ISDA)、苯丙氨酸-N,N-二乙酸(PHDA)、邻氨基苯甲酸-N,N-二乙酸(ANDA)、磺胺酸-N,N-二乙酸(SLDA)、牛磺酸-N,N-二乙酸(TUDA)以及磺甲基-N,N-二乙酸(SMDA)、N-(2-羟乙基)-亚乙基二胺-N,N’,N’-三乙酸盐(HEDTA)、二乙醇甘氨酸(DEG)、二亚乙基三胺五(亚甲基膦酸)(DTPMP)、氨基三(亚甲基膦酸)(ATMP)及其组合和盐。其他示例性助洗剂和/或共助洗剂描述于例如WO 09/102854、US 5977053中

漂白系统-该洗涤剂可以包括按重量计0-50%,例如约0.1%至约25%的漂白系统。可以利用本领域中已知的用于在衣物洗涤剂中使用的任何漂白系统。适合的漂白系统组分包括漂白催化剂、光漂白剂、漂白活化剂、过氧化氢源如过碳酸钠和过硼酸钠、预成型过酸及其混合物。适合的预成型过酸包括,但不限于:过氧羧酸及盐,过碳酸及盐,过亚氨酸(perimidic acid)及盐,过氧单硫酸及盐(例如过硫酸氢钾(Oxone(R)),及其混合物。漂白系统的非限制性实例包括基于过氧化物的漂白系统,这些系统可以包括例如与过酸形成漂白活化剂组合的无机盐,包括碱金属盐,如过硼酸盐(通常是单水合物或四水合物)、过碳酸盐、过硫酸盐、过磷酸盐、过硅酸盐的钠盐。术语漂白活化剂在此意指一种与过氧化物漂白剂(像过氧化氢)反应以形成过酸的化合物。以此方式形成的过酸构成活化的漂白剂。有待在此使用的适合漂白活化剂包括属于酯酰胺、酰亚胺或酸酐类别的那些。适合的实例是四乙酰基乙二胺(TAED)、4-[(3,5,5-三甲基己酰)氧基]苯磺酸钠(ISONOBS)、二过氧月桂酸、4-(十二酰基氧基)苯磺酸盐(LOBS)、4-(癸酰基氧基)苯磺酸盐、4-(癸酰基氧基)苯甲酸盐(DOBS)、4-(壬酰基氧基)-苯磺酸盐(NOBS)、和/或披露于WO 98/17767中的那些。感兴趣的漂白活化剂的具体家族披露于EP 624154中并且在那个家族中特别优选的是乙酰柠檬酸三乙酯(ATC)。ATC或短链甘油三酸酯(像三醋汀)具有以下优点,它是环境友好的,因为它最终降解为柠檬酸和醇。此外,乙酰柠檬酸三乙酯和三醋汀在储存时在产品中具有良好的水解稳定性,并且它是一种有效的漂白活化剂。最后,ATC为洗衣添加剂提供一种良好的助洗能力。可替代地,漂白系统可以包括例如酰胺、酰亚胺、或砜型的过氧酸。漂白系统还可以包括过酸,例如6-(苯二甲酰亚氨基)过己酸(PAP)。漂白系统还可以包括漂白催化剂。在一些实施例中,漂白组分可以是选自下组的有机催化剂,该组由以下各项组成:具有下式的有机催化剂:

(iii)及其混合物;其中每个R1独立地是包含从9至24个碳的支链烷基基团或包含从11至24个碳的直链烷基基团,优选地,每个R1独立地是包含从9至18个碳的支链烷基基团或包含从11至18个碳的直链烷基基团,更优选地,每个R1独立地选自下组,该组由以下各项组成:2-丙基庚基、2-丁基辛基、2-戊基壬基、2-己基癸基、正-十二烷基、正-十四烷基、正-十六烷基、正-十八烷基、异-壬基、异-癸基、异-十三基和异-十五烷基。其他示例性漂白系统描述于例如WO 2007/087258、WO 2007/087244、WO 2007/087259以及WO 2007/087242中。适合的光漂白剂可以例如是磺化的酞菁锌。

聚合物-该洗涤剂可以包含按重量计0-10%,例如0.5%-5%、2%-5%、0.5%-2%或0.2%-1%的聚合物。可以利用本领域中已知的用于在洗涤剂中使用的任何聚合物。聚合物可以作为如以上提到的共助洗剂起作用,或可以提供抗再沉积、纤维保护、污垢释放、染料转移抑制、油污清洁和/或防沫特性。一些聚合物可以具有多于一种的以上提到的特性和/或多于一种的以下提到的基序(motif)。示例性聚合物包括(羧甲基)纤维素(CMC)、聚(乙烯醇)(PVA)、聚(乙烯吡咯烷酮)(PVP)、聚(乙二醇)或聚(环氧乙烷)(PEG)、乙氧基化的聚(亚乙基亚胺)、羧甲基菊粉(CMI)、和聚羧化物,例如PAA、PAA/PMA、聚-天冬氨酸、和甲基丙烯酸月桂酯/丙烯酸共聚物、疏水修饰CMC(HM-CMC)和硅酮、对苯二甲酸和低聚乙二醇的共聚物、聚(对苯二甲酸乙二酯)和聚(氧乙烯对苯二甲酸乙二酯)的共聚物(PET-POET)、PVP、聚(乙烯基咪唑)(PVI)、聚(乙烯吡啶-N-氧化物)(PVPO或PVPNO)以及聚乙烯吡咯烷酮-乙烯基咪唑(PVPVI)。另外的示例性聚合物包括磺化的聚羧酸酯、聚环氧乙烷和聚环氧丙烷(PEO-PPO)以及乙氧基硫酸二季铵盐。其他示例性聚合物披露于例如WO 2006/130575中。也考虑了以上提到的聚合物的盐。

织物调色剂-本发明的洗涤剂组合物还可以包括织物调色剂,例如当配制在洗涤剂组合物中时,可以在织物与包括所述洗涤剂组合物的洗涤液体接触时沉积在所述织物上,并且从而通过可见光吸收/反射来改变所述织物色彩的染料或色素。荧光增白剂发射至少一些可见光。相比之下,因为它们吸收至少一部分可见光光谱,所以织物调色剂改变表面的色彩。适合的织物调色剂包括染料和染料-粘土轭合物,并且还可以包括色素。适合的染料包括小分子染料和聚合物染料。适合的小分子染料包括选自下组的小分子染料,该组由落入颜色索引(Colour Index)(C.I.)分类的以下染料组成:直接蓝、直接红、直接紫、酸性蓝、酸性红、酸性紫、碱性蓝、碱性紫和碱性红、或其混合物,例如描述于WO 2005/03274、WO 2005/03275、WO 2005/03276和EP 1876226中(将其通过引用而特此结合)。洗涤剂组合物优选包括从约0.00003wt%至约0.2wt%、从约0.00008wt%至约0.05wt%、或甚至从约0.0001wt%至约0.04wt%的织物调色剂。该组合物可以包括从0.0001wt%至0.2wt%的织物调色剂,当该组合物处于单位剂量袋的形式时,这可以是特别优选的。适合的调色剂还披露于例如WO 2007/087257和WO 2007/087243中。

另外的酶-洗涤剂添加剂连同洗涤剂组合物可以包括一种或多种额外的酶,例如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶、过氧化物酶和/或黄原胶裂解酶。

一般而言,一种或多种所选酶的特性应与选定的洗涤剂相容(即,最适pH,与其他酶和非酶成分的相容性,等等),并且该一种或多种酶应以有效量存在。

纤维素酶:适合的纤维素酶包括细菌或真菌来源的那些。包括经化学修饰的或蛋白质工程改造的变体。适合的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰刀菌属、梭孢壳菌属、支顶孢属的纤维素酶,例如披露于US 4,435,307、US 5,648,263、US 5,691,178、US 5,776,757以及WO 89/09259中的由特异腐质霉、嗜热毁丝霉和尖孢镰刀菌产生的真菌纤维素酶。

尤其适合的纤维素酶是具有颜色护理益处的碱性或中性纤维素酶。此类纤维素酶的实例是描述于EP 0 495 257、EP 0 531 372、WO 96/11262、WO 96/29397、WO 98/08940中的纤维素酶。其他实例为纤维素酶变体,例如在WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307以及PCT/DK 98/00299中描述的那些。

表现出内切-β-1,4-葡聚糖酶活性的纤维素酶(EC 3.2.1.4)的实例是已经描述于WO 02/099091中的那些。

纤维素酶的其他实例包括描述于WO 96/29397中的家族45纤维素酶,并且特别是在对应于WO 02/099091的SEQ ID NO:8中的以下位置的一个或多个位置具有取代、插入和/或缺失的其变体:2、4、7、8、10、13、15、19、20、21、25、26、29、32、33、34、35、37、40、42、42a、43、44、48、53、54、55、58、59、63、64、65、66、67、70、72、76、79、80、82、84、86、88、90、91、93、95、95d、95h、95j、97、100、101、102、103、113、114、117、119、121、133、136、137、138、139、140a、141、143a、145、146、147、150e、150j、151、152、153、154、155、156、157、158、159、160c、160e、160k、161、162、164、165、168、170、171、172、173、175、176、178、181、183、184、185、186、188、191、192、195、196、200、和/或20,优选选自P19A、G20K、Q44K、N48E、Q119H或Q146R。

可商购的纤维素酶包括CelluzymeTM、和CarezymeTM(诺维信公司(Novozymes A/S))、ClazinaseTM、和Puradax HATM(杰能科国际有限公司(Genencor International Inc.))、以及KAC-500(B)TM(花王株式会社(Kao Corporation))。

蛋白酶:另外的酶可以是另一种蛋白酶或蛋白酶变体。该蛋白酶可以是动物、植物或微生物来源的,包括化学或基因修饰的变体。优选微生物来源。它可以是一种碱性蛋白酶,例如丝氨酸蛋白酶或金属蛋白酶。丝氨酸蛋白酶可以例如是S1家族(如胰蛋白酶)或S8家族(如枯草杆菌蛋白酶)。金属蛋白酶的蛋白酶可以例如是来自例如家族M4、M5、M7或M8的嗜热菌蛋白酶。

术语“枯草杆菌酶”是指根据斯艾森(Siezen)等人,蛋白质工程学(Protein Engng.)4(1991)719-737和斯艾森等人,蛋白质科学(Protein Science)6(1997)501-523的丝氨酸蛋白酶亚组。丝氨酸蛋白酶是特征为在活性位点具有与底物形成共价加合物的丝氨酸的蛋白酶的一个亚组。枯草杆菌酶可以划分为6个亚部,即,枯草杆菌蛋白酶家族、嗜热蛋白酶家族、蛋白酶K家族、羊毛硫抗生素肽酶家族、Kexin家族和Pyrolysin家族。在本发明的一个方面,该蛋白酶可以是一种类枯草杆菌蛋白酶,例如枯草杆菌蛋白酶或其变体。另外,类枯草杆菌蛋白酶(以及丝氨酸蛋白酶)的特征为除了丝氨酸以外,还具有两个活性位点氨基酸残基,即一个组氨酸和一个天冬氨酸残基。

枯草杆菌蛋白酶的实例是来源于芽孢杆菌的那些,如枯草杆菌蛋白酶lentus、芽孢杆菌lentus、枯草杆菌蛋白酶Novo、嘉士伯枯草杆菌蛋白酶(subtilisin Carlsberg)、地衣芽孢杆菌、枯草杆菌蛋白酶BPN’、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147以及枯草杆菌蛋白酶168(描述于WO 89/06279中)以及蛋白酶PD138(WO 93/18140)。另外的丝氨酸蛋白酶实例描述于WO 98/020115、WO 01/44452、WO 01/58275、WO 01/58276、WO 03/006602以及WO 04/099401中。枯草杆菌酶变体的实例可以是在以下任意位置中具有突变的那些:3、4、9、15、27、36、68、76、87、95、96、97、98、99、100、101、102、103、104、106、118、120、123、128、129、130、160、167、170、194、195、199、205、217、218、222、232、235、236、245、248、252以及274,使用BPN’编号。更优选地,这些枯草杆菌酶变体可以包含以下突变:S3T、V4I、S9R、A15T、K27R、*36D、V68A、N76D、N87S,R、*97E、A98S、S99G,D,A、S99AD、S101G,M,R S103A、V104I,Y,N、S106A、G118V,R、H120D,N、N123S、S128L、P129Q、S130A、G160D、Y167A、R170S、A194P、G195E、V199M、V205I、L217D、N218D、M222S、A232V、K235L、Q236H、Q245R、N252K、T274A(使用BPN’进行编号)。另外的优选的蛋白酶是来自迟缓芽孢杆菌DSM 5483的碱性蛋白酶(如在(例如)WO 95/23221中所述)、以及其变体(在WO 92/21760、WO 95/23221、EP 1921147以及EP 1921148中描述的)。

胰蛋白酶样蛋白酶的实例为胰蛋白酶(例如,猪或牛来源的),以及在WO 89/06270和WO 94/25583中描述的镰孢属蛋白酶。有用的蛋白酶的实例为在WO 92/19729、WO 98/20115、WO 98/20116、以及WO 98/34946中描述的变体,尤其是在一个或多个以下位置中具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235、以及274。

金属蛋白酶的实例是如描述于WO 07/044993中的中性金属蛋白酶。

优选的可商购的蛋白酶酶类包括AlcalaseTM、CoronaseTM、DuralaseTM、DurazymTM、EsperaseTM、EverlaseTM、KannaseTM、LiquanaseTM、Liquanase UltraTM、OvozymeTM、PolarzymeTM、PrimaseTM、RelaseTM、SavinaseTM和Savinase UltraTM(诺维信公司(Novozymes A/S)),AxapemTM(Gist-Brocases N.V.公司),BLAP和BLAP X(Henkel AG&Co.KGaA),ExcellaseTM、FN2TM、FN3TM、FN4TM、MaxacaTM、MaxapemTM、MaxataseTM、ProperaseTM、PurafastTM、PurafectTM、Purafect OxPTM、Purafect PrimeTM和PuramaxTM(杰能科有限公司(Genencor int.))。

脂肪酶和角质酶:适合的脂肪酶和角质酶包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程化的变体酶。实例包括来自嗜热真菌属的脂肪酶,例如如描述于EP 258068和EP 305216中的来自疏绵状嗜热丝孢菌(早先命名为疏棉状腐质霉);来自腐质霉属的角质酶,例如特异腐质霉(WO 96/13580);来自假单胞菌属的菌株的脂肪酶(这些中的一些现在改名为伯克霍尔氏菌属),例如产碱假单胞菌或类产碱假单胞菌(EP 218272)、洋葱假单胞菌(EP 331376)、假单胞菌属菌株SD705(WO 95/06720&WO 96/27002)、威斯康星假单胞菌(P.wisconsinensis)(WO 96/12012);GDSL-型链霉菌属脂肪酶(WO 10/065455);来自稻瘟病菌的角质酶(WO 10/107560);来自门多萨假单胞菌的角质酶(US 5,389,536);来自褐色嗜热裂孢菌(Thermobifida fusca)的脂肪酶(WO 11/084412);嗜热脂肪土芽孢杆菌脂肪酶(WO 11/084417);来自枯草芽孢杆菌的脂肪酶(WO 11/084599);以及来自灰色链霉菌(WO 11/150157)和始旋链霉菌(S.pristinaespiralis)的脂肪酶(WO 12/137147)。

另外的实例是有时被称为酰基转移酶或过水解酶(perhydrolase)的脂肪酶,例如与南极假丝酵母脂肪酶A具有同源性的酰基转移酶(WO 10/111143)、来自耻垢分枝杆菌的酰基转移酶(WO 05/56782)、来自CE 7家族的过水解酶(WO 09/67279)、以及耻垢分枝杆菌过水解酶的变体,特别是用于在来自亨斯迈纺织染化私人有限公司(Huntsman Textile Effects Pte Ltd)的商业化产品Gentle Power Bleach(柔和漂白剂)中使用的S54V变体(WO 10/100028)。

其他实例是脂肪酶变体,例如描述于EP 407225、WO 92/05249、WO 94/01541、WO 94/25578、WO 95/14783、WO 95/30744、WO 95/35381、WO 95/22615、WO 96/00292、WO 97/04079、WO 97/07202、WO 00/34450、WO 00/60063、WO 01/92502、WO 07/87508以及WO 09/109500中的那些。

优选的商业化脂肪酶产品包括LipolaseTM、LipexTM;LipolexTM和LipocleanTM(诺维信公司),Lumafast(来自杰能科公司(Genencor))以及Lipomax(来自吉斯特布罗卡德斯公司(Gist-Brocades))。

淀粉酶-淀粉酶可以是一种α-淀粉酶、β-淀粉酶或葡糖淀粉酶并且可以是细菌或真菌来源的。包括经化学修饰的或蛋白质工程改造的变体。淀粉酶包括例如获得自芽孢杆菌属的α-淀粉酶,例如GB 1,296,839中更详细描述的地衣芽孢杆菌具体株系的α-淀粉酶。

淀粉酶的实例是具有WO 95/10603中的SEQ ID NO:3的那些或与SEQ ID NO:3具有90%序列一致性的其变体。优选的变体描述于WO 94/02597、WO 94/18314、WO 97/43424以及WO 99/019467的SEQ ID NO:4中,例如在WO 95/10603中的SEQ ID NO:3的一个或多个以下位置具有取代的变体:15、23、105、106、124、128、133、154、156、178、179、181、188、190、197、201、202、207、208、209、211、243、264、304、305、391、408以及444。

可以使用的另外的淀粉酶是具有WO 02/010355中的SEQ ID NO:6的淀粉酶或其与SEQ ID NO:6具有90%序列一致性的变体。SEQ ID NO:6的优选变体是在位置181和182中具有缺失并且在位置193中具有取代的那些。

其他淀粉酶实例是包含示于WO 2006/066594的SEQ ID NO:6中的来源于解淀粉芽孢杆菌的α-淀粉酶的残基1-33和示于WO 2006/066594的SEQ ID NO:4中的地衣芽孢杆菌α-淀粉酶的残基36-483的杂合α-淀粉酶或具有90%序列一致性的其变体。这一杂合α-淀粉酶的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:G48、T49、G107、H156、A181、N190、M197、I201、A209以及Q264。包括示于WO 2006/066594的SEQ ID NO:6中的来源于解淀粉芽孢杆菌的α-淀粉酶的残基1-33和SEQ ID NO:4的残基36-483的杂合α-淀粉酶的最优选变体是具有以下取代的那些:

M197T;

H156Y+A181T+N190F+A209V+Q264S;或

G48+T49+G107+H156+A181+N190+I201+A209+Q264。

另外的淀粉酶实例是具有WO 99/019467中的SEQ ID NO:6的淀粉酶或其与SEQ ID NO:6具有90%序列一致性的变体。SEQ ID NO:6的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:R181、G182、H183、G184、N195、I206、E212、E216以及K269。特别优选的淀粉酶是在位置G182和H183或位置H183和G184中具有缺失的那些。

另外的淀粉酶是具有WO 96/023873的SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的那些或其与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7具有90%序列一致性的变体。SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:140、181、182、183、184、195、206、212、243、260、269、304以及476。更优选的变体是在位置182和183或位置183和184中具有缺失的那些。SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的最优选的淀粉酶变体是在位置183和184中具有缺失并且在位置140、195、206、243、260、304以及476中具有取代的那些。

可以使用的其他淀粉酶是具有WO 08/153815中的SEQ ID NO:2、WO 01/66712中的SEQ ID NO:10的淀粉酶或其与WO 08/153815的SEQ ID NO:2具有90%序列一致性或与WO 01/66712中的SEQ ID NO:10具有90%序列一致性的变体。WO 01/66712中的SEQ ID NO:10的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:176、177、178、179、190、201、207、211以及264。

可以使用的另外的淀粉酶是具有WO 09/061380的SEQ ID NO:2的淀粉酶或其与SEQ ID NO:2具有90%序列一致性的变体。SEQ ID NO:2的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:Q87、Q98、S125、N128、T131、T165、K178、R180、S181、T182、G183、M201、F202、N225、S243、N272、N282、Y305、R309、D319、Q320、Q359、K444以及G475。SEQ ID NO:2的最优选的变体是在以下位置中的一个或多个中具有取代:Q87E,R、Q98R、S125A、N128C、T131I、T165I、K178L、T182G、M201L、F202Y、N225E,R、N272E,R、S243Q,A,E,D、Y305R、R309A、Q320R、Q359E、K444E以及G475K,和/或在位置R180和/或S181具有缺失的那些。SEQ ID NO:2的最优选的淀粉酶变体是具有以下取代的那些:

N128C+K178L+T182G+Y305R+G475K;

N128C+K178L+T182G+F202Y+Y305R+D319T+G475K;

S125A+N128C+K178L+T182G+Y305R+G475K;或

S125A+N128C+T131I+T165I+K178L+T182G+Y305R+G475K,其中该变体任选地进一步在位置243处包括取代和/或在位置180和/或位置181处包括缺失。

淀粉酶的其他实例是具有WO 01/66712中的SEQ ID NO:12的α-淀粉酶或与SEQ ID NO:12具有至少90%,例如至少95%序列一致性的变体。优选的淀粉酶变体是在WO 01/66712中的SEQ ID NO:12的以下位置中的一个或多个中具有取代、缺失或插入的那些:R28,R118,N174;R181,G182,D183,G184,G186,W189,N195,M202,Y298,N299,K302,S303,N306,R310,N314;R320,H324,E345,Y396,R400,W439,R444,N445,K446,Q449,R458,N471,N484。特别优选的淀粉酶包括具有D183和G184的缺失并且具有R118K、N195F、R320K及R458K的取代的变体,以及另外在选自下组的一个或多个位置中具有取代的变体:M9、G149、G182、G186、M202、T257、Y295、N299、M323、E345以及A339,最优选的是另外在所有这些位置中具有取代的变体。

可商购的淀粉酶是DuramylTM、TermamylTM、FungamylTM、StainzymeTM、Stainzyme PlusTM、NatalaseTM和BANTM(诺维信公司),RapidaseTM和PurastarTM(来自杰能科国际有限公司)。

过氧化物酶/氧化酶:适合的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些。包括经化学修饰的或蛋白质工程改造的变体。有用的过氧化物酶的实例包括来自鬼伞属,例如来自灰盖鬼伞的过氧化物酶,及其变体,如在WO 93/24618、WO 95/10602、以及WO 98/15257中描述的那些。

可商购的过氧化物酶包括GuardzymeTM(诺维信公司)。

该一种或多种酶可以通过添加包含一种或多种酶的单独的添加剂,或通过添加包括所有这些酶的组合添加剂而被包括于洗涤剂组合物中。本发明的洗涤剂添加剂,即单独的或组合的添加剂,可以配制成例如颗粒、液体、浆液等,优选的洗涤剂添加剂剂型为颗粒,特别是无粉尘颗粒;液体,特别是稳定化液体;或者浆液。

非尘颗粒可以例如如在US 4,106,991和4,661,452中所披露而产生,并且可以任选地通过本领域已知的方法进行包衣。蜡状包衣材料的实例为具有1000至20000的平均摩尔重量的聚(环氧乙烷)产物(聚乙二醇,PEG);具有从16至50个环氧乙烷单元的乙氧化壬基苯酚;乙氧化脂肪醇,其中该醇包含从12至20个碳原子,并且其中具有15至80个环氧乙烷单元;脂肪醇;脂肪酸;以及脂肪酸的甘油单酯和甘油二酯以及甘油三酯。适用于通过流化床技术应用的成膜包衣材料的实例在GB 1483591中给出。液体酶制品可以例如通过根据已确立的方法添加多元醇(如丙二醇)、糖或糖醇、乳酸或硼酸而稳定化。受保护的酶可以根据EP 238,216中披露的方法来制备。

辅料-还可以利用本领域中已知的用于在衣物洗涤剂中使用的任何洗涤剂组分。其他任选的洗涤剂组分包括防腐剂、防缩剂、抗污垢再沉积剂、抗皱剂、杀细菌剂、粘合剂、腐蚀抑制剂、崩解剂(disintegrant)/崩解试剂(disintegration agent)、染料、酶稳定剂(包括硼酸、硼酸盐、CMC和/或多元醇如丙二醇)、织物整理剂(包括粘土)、填充剂/加工助剂、荧光增白剂/光学增亮剂、增泡剂、泡沫(泡)调节剂、香料、污垢助悬剂、软化剂、抑泡剂、晦暗抑制剂以及芯吸剂,单独抑或组合使用。可以利用本领域中已知的用于在衣物洗涤剂中使用的任何成分。此类成分的选择完全在普通技术人员的技术内。

分散剂:本发明的洗涤剂组合物还可以包含分散剂。具体地说,粉状洗涤剂可以包括分散剂。适合的水溶性有机材料包括均聚合或共聚合的酸或其盐,其中聚羧酸包括至少两个羧基,这两个羧基被不超过两个碳原子彼此分开。适合的分散剂例如描述于粉状洗涤剂,表面活性剂科学系列(Surfactant Science Series),第71卷中,马塞尔·德克尔公司(Marcel Dekker)。

染料转移抑制剂:本发明的洗涤剂组合物还可以包括一种或多种染料转移抑制剂。适合的聚合物染料转移抑制剂包括但不限于聚乙烯吡咯烷酮聚合物、多胺N-氧化物聚合物、N-乙烯吡咯烷酮与N-乙烯基咪唑的共聚物、聚乙烯噁唑烷酮以及聚乙烯咪唑或其混合物。当存在于主题组合物中时,染料转移抑制剂可以按组合物重量计的以下水平存在:从约0.0001%至约10%、从约0.01%至约5%或甚至从约0.1%至约3%。

荧光增白剂:本发明的洗涤剂组合物还将优选地包含另外的组分,这些组分可以给正清洁的物品着色,例如荧光增白剂或光学增亮剂。其中增亮剂优选以约0.01%至约0.5%的水平存在。在本发明的组合物中可以使用适合用于在衣物洗涤剂组合物中使用的任何荧光增白剂。最常用的荧光增白剂是属于以下类别的那些:二氨芪-磺酸衍生物、二芳基吡唑啉衍生物和二苯基-联苯乙烯基衍生物。荧光增白剂的二氨芪-磺酸衍生物型的实例包括以下各项的钠盐:4,4'-双-(2-二乙醇氨基-4-苯胺基-s-三嗪-6-基氨基)芪-2,2'-二磺酸盐;4,4'-双-(2,4-二苯胺基-s-三嗪-6-基氨基)芪-2.2'-二磺酸盐;4,4'-双-(2-苯胺基-4(N-甲基-N-2-羟基-乙氨基)-s-三嗪-6-基氨基)芪-2,2'-二磺酸盐,4,4'-双-(4-苯基-2,1,3-三唑-2-基)芪-2,2'-二磺酸盐;4,4'-双-(2-苯胺基-4(1-甲基-2-羟基-乙氨基)-s-三嗪-6-基氨基)芪-2,2'-二磺酸盐和2-(二苯乙烯基-4"-萘-1.,2':4,5)-1,2,3-三唑-2"-磺酸盐。优选的荧光增白剂是可从汽巴–嘉基股份有限公司(Ciba-Geigy AG)(巴塞尔,瑞士)获得的天来宝(Tinopal)DMS和天来宝CBS。天来宝DMS是4,4'-双-(2-吗啉基-4苯胺基-s-三嗪-6-基氨基)芪二磺酸盐的二钠盐。天来宝CBS是2,2'-双-(苯基-苯乙烯基)二磺酸盐的二钠盐。还优选荧光增白剂,是可商购的Parawhite KX,由派拉蒙矿物与化学(Paramount Minerals and Chemicals),孟买,印度供应。适合用于在本发明中使用的其他荧光剂包括1-3-二芳基吡唑啉和7-烷氨基香豆素。适合的荧光增亮剂水平包括从约0.01wt%、从0.05wt%、从约0.1wt%或甚至从约0.2wt%的较低水平至0.5wt%或甚至0.75wt%的较高水平。

污垢释放聚合物:本发明的洗涤剂组合物还可以包括一种或多种污垢释放聚合物,这些污垢释放聚合物帮助从织物,例如棉或聚酯基织物上去除污垢,特别是从聚酯基织物上去除疏水污垢。污物释放聚合物可以例如是非离子型或阴离子型对苯二甲酸基聚合物、聚乙烯基己内酰胺和相关共聚物、乙烯基接枝共聚物、聚酯聚酰胺,参见例如粉状洗涤剂,表面活性剂科学系列第71卷第7章,马塞尔·德克尔公司(Marcel Dekker,Inc.)。另一种类型的污物释放聚合物是包括一个芯结构和连接至该芯结构的多个烷氧基化基团的两亲性烷氧基化油污清洁聚合物。核心结构可以包括聚烷基亚胺结构或聚烷醇胺结构,如WO 2009/087523中详细描述的(将其通过引用而特此结合)。此外,任意接枝共聚物是适合的污物释放聚合物。适合的接枝共聚物更详细地描述于WO 2007/138054、WO 2006/108856以及WO 2006/113314中(将其通过引用而特此结合)。其他污垢释放聚合物是取代的多糖结构,尤其是取代的纤维素结构,例如改性纤维素衍生物,例如EP 1867808或WO 2003/040279中描述的那些(将二者都通过引用而特此结合)。适合的纤维素聚合物包括纤维素、纤维素醚、纤维素酯、纤维素酰胺及其混合物。适合的纤维素聚合物包括阴离子改性的纤维素、非离子改性的纤维素、阳离子改性的纤维素、兼性离子改性的纤维素及其混合物。适合的纤维素聚合物包括甲基纤维素、羧甲基纤维素、乙基纤维素、羟乙基纤维素、羟丙基甲基纤维素、酯羧甲基纤维素及其混合物。

抗再沉积剂:本发明的洗涤剂组合物还可以包括一种或多种抗再沉积剂,例如羧甲基纤维素(CMC)、聚乙烯醇(PVA)、聚乙烯吡咯烷酮(PVP)、聚环氧乙烷和/或聚乙二醇(PEG)、丙烯酸的均聚物、丙烯酸与马来酸的共聚物以及乙氧基化聚乙亚胺。以上在污垢释放聚合物下描述的纤维素基聚合物还可以用作抗再沉积剂。

其他适合的辅料包括但不限于防缩剂、抗皱剂、杀细菌剂、粘合剂、载体、染料、酶稳定剂、织物软化剂、填充剂、泡沫调节剂、助水溶剂、香料、色素、抑泡剂、溶剂以及用于液体洗涤剂的结构剂和/或结构弹性剂。

洗涤剂产品的配制

本发明的洗涤剂组合物可以处于任何常规形式,例如条、均匀的片剂、具有两个或更多个层的片剂、具有一个或多个室的袋、规则的或压缩的粉末、颗粒、膏、凝胶、或规则的、压缩的或浓缩的液体。存在多种洗涤剂配制品形式,例如层(相同或不同相)、袋以及用于机械给料装置的形式。

可以将小袋配置为单一隔室或多隔室。它可以具有适合保存该组合物的任何形式、形状和材料,例如在与水接触之前,不允许该组合物从袋中释放出来。袋由封装内体积的水溶性膜制成。可以将所述内体积分为袋的室。优选的膜是形成膜或片的聚合材料,优选是聚合物。优选的聚合物、共聚物或其衍生物选自聚丙烯酸酯、和水溶性丙烯酸酯共聚物、甲基纤维素、羧甲基纤维素、糊精钠、乙基纤维素、羟乙基纤维素、羟丙基甲基纤维素、麦芽糊精、聚甲基丙烯酸酯,最优选地是聚乙烯醇共聚物和羟丙基甲基纤维素(HPMC)。优选地,在膜中的聚合物(例如PVA)的水平是至少约60%。优选的平均分子量将典型地是约20,000至约150,000。膜还可以是共混物组合物,该共混物组合物包括可水解降解并且水可溶的聚合物共混物,例如聚乳酸和聚乙烯醇(已知在贸易参考M8630下,如由美国印第安纳州盖里(Gary,Ind.,US)的克里斯克拉夫特工业产品公司(Chris Craft In.Prod.)销售)加增塑剂,像甘油、乙二醇、丙二醇、山梨醇及其混合物。这些袋可以包括固体衣物清洁组合物或部分组分和/或液体清洁组合物或由水溶性膜分开的部分组分。用于液体组分的室在构成上可以与包含固体的室不同。参考文献:(US 2009/0011970A1)。

可以由水可溶的袋中或片剂的不同层中的室来将洗涤剂成分物理地彼此分开。由此可以避免组分之间的负面的存储相互作用。在洗涤溶液中,每个室的不同溶解曲线还可以引起选择的组分的延迟溶解。

非单位剂量的液体或凝胶洗涤剂可以是水性的,典型地包含按重量计至少20%并且最高达95%的水,例如高达约70%的水、高达约65%的水、高达约55%的水、高达约45%的水、高达约35%的水。包括但不限于链烷醇、胺、二醇、醚以及多元醇的其他类型的液体可以被包括在水性液体或凝胶中。含水液体或凝胶洗涤剂可以包含从0-30%的有机溶剂。液体或凝胶洗涤剂可以是非水性的。

本发明的酶可以被添加至洗衣皂条中并且用于手洗洗衣、织物和/或纺织品。术语洗衣皂条包括洗衣条、皂条、组合条(combo bar)、合成洗涤剂条以及洗涤剂条。条的类型通常区别在于它们包含的表面活性剂的类型,并且术语洗衣皂条包括包含来自脂肪酸的皂和/或合成皂的那些。洗衣皂条具有在室温下为固体而非液体、凝胶或粉末的物理形式。术语固体被定义为不随着时间显著变化的物理形式,即如果将一固体物体(例如洗衣皂条)放置于一个容器内部,该固体物体不发生改变来填充它被放置于其中的容器。条典型地是处于条形的固体但是可以处于其他固体形状,例如圆形或卵形。

洗衣皂条可以包含一种或多种另外的酶,蛋白酶抑制剂例如肽醛类(或次硫酸盐加合物或半缩醛加合物),硼酸,硼酸盐,硼砂和/或苯基硼酸衍生物例如4-甲酰苯基硼酸,一种或多种肥皂或合成表面活性剂,多元醇例如甘油,pH控制化合物例如脂肪酸、柠檬酸、乙酸和/或甲酸,和/或一价阳离子和有机阴离子的盐,其中该一价阳离子可以是例如Na+、K+或NH4+并且该有机阴离子可以是例如甲酸盐、乙酸盐、柠檬酸盐或乳酸盐,这样使得一价阳离子和有机阴离子的盐可以是例如甲酸钠。

洗衣皂条还可以包含络合剂像EDTA和HEDP,香料和/或不同类型的填充剂,表面活性剂例如阴离子型合成表面活性剂,助洗剂,聚合的污垢释放剂,洗涤剂螯合剂,稳定剂,填充剂,染料,着色剂,染料转移抑制剂,烷氧基化的聚碳酸酯,抑泡剂,结构剂,粘合剂,浸出剂,漂白活化剂,粘土去污剂,抗再沉积剂,聚合分散剂,增白剂,织物柔软剂,香料和/或本领域已知的其他化合物。

洗衣皂条可以在常规的洗衣皂条制造设备中进行加工,例如但不限制于:混合器、压条机例如双级真空压条机、挤出机、切割机、标识压模机(logo-stamper)、冷却隧道以及包装机。本发明不局限于通过任何单一方法制备洗衣皂条。可以在过程的不同阶段向肥皂中添加本发明的预混料。例如,可以制备包含肥皂、酶、任选地一种或多种另外的酶、蛋白酶抑制剂以及一价阳离子和有机阴离子的盐的预混料并且然后将该混合物压条。可以同时添加作为例如处于液态的蛋白酶抑制剂的酶以及任选的另外的酶。除了混合步骤和压条步骤以外,该工艺还可以进一步包括研磨、挤出、切割、压模、冷却和/或包装的步骤。

用于降解黄原胶的用途

已经将黄原胶用作许多消费品(包括食品和化妆品)中的成分并且已经用于石油工业中。因此,黄原胶的降解可以导致改进的清洁过程,例如更容易去除包含胶质(例如黄原胶)的污物,连同通常用于石油与钻探工业中的黄原胶的降解。因此,本发明针对本发明的内切葡聚糖酶或其组合物用于降解黄原胶的用途。本发明还针对黄原胶裂解酶或其组合物用于降解黄原胶的用途。一个实施例是本发明的内切葡聚糖酶与黄原胶裂解酶一起或其组合物用于降解黄原胶的用途。可以优选地使用如描述于实例5中的粘度减小测定(ViPr测定)或可替代地,如描述于实例6中的还原末端测定测量黄原胶的降解。

在一个实施例中,可以使用如有关黄原胶的在此描述的粘度减小测定测量黄原胶的降解。一个优选实施例是黄原胶(0.25%或0.5%)在缓冲液或水中的用途,其中在5分钟、30分钟、1小时、1.5小时、2小时、2.5小时、3小时、3.5小时或4小时后测量粘度的下降。一个更优选的实施例是黄原胶(0.25%)在水中的用途,其中在3小时后测量粘度的下降。

当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少200Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少250Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少300Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少350Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少400Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少450Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少500Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少550Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少600Pa。

可替代地,可以使用由莱韦尔(Lever)(1972),Lever(Lever)47:273-279,1972研发的比色测定,将黄原胶降解活性测量为用黄原胶裂解酶预处理的黄原胶上的还原末端。一个优选实施例是用黄原胶裂解酶预处理的0.1%黄原胶的用途。可以通过计算空白与样品之间的差异确定用黄原胶裂解酶预处理的黄原胶的降解,其中大于0.1mAU,大于0.15mAU,大于0.2mAU,大于0.25mAU,大于0.5mAU,优选大于0.6mAU,更优选大于0.7mAU或甚至更优选大于0.8mAU的差异示出用黄原胶裂解酶预处理的黄原胶的降解。

在去污剂中的用途。

本发明针对本发明的内切葡聚糖酶或其组合物在清洁过程中的用途,例如纺织品和织物的湿洗,例如家用衣物洗涤和工业衣物洗涤,以及家用和工业硬表面清洁,例如餐具洗涤。可以将本发明的内切葡聚糖酶添加至包括一种或多种洗涤剂组分的洗涤剂组合物中。

一个实施例是本发明的内切葡聚糖酶连同黄原胶裂解酶或其组合物在清洁过程中的用途,例如纺织品和织物的湿洗(例如家用衣物洗涤和工业衣物洗涤)以及家用和工业硬表面清洁,例如餐具洗涤。可以将本发明的内切葡聚糖酶连同黄原胶裂解酶添加至包括一种或多种洗涤剂组分的洗涤剂组合物中。

可以将本发明的多肽添加至洗涤剂组合物中并且因此变成洗涤剂组合物的组分。本发明的洗涤剂组合物可以配制为例如用于家用和工业衣物清洁两者的手洗或机洗衣物洗涤剂组合物,包括适用于预处理有污物的织物的洗衣添加剂组合物和漂洗添加的织物软化剂组合物,或者配制为用于一般家用或工业硬表面清洁操作的洗涤剂组合物,或者配制用于手洗或机洗(家用和工业两者)餐具洗涤操作。在一个特定的方面中,本发明提供了一种洗涤剂添加剂,该添加剂包括如在此描述的本发明的多肽。

在一个实施例中,可以如WO 2013/167581中所述,使用AMAS,对黄原胶与碳黑小块布样测量ΔInt酶值。一个优选实施例是黄原胶与碳黑(DN31、DN31C或DN31D)小块布样在20℃或40℃下的使用。一个更优选的实施例是黄原胶与碳黑(DN31C或DN31D)小块布样在40℃下的使用。一个甚至更优选的实施例是黄原胶与碳黑(DN31D)小块布样在40℃下的使用。用于对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶和用于黄原胶裂解酶的优选的酶浓度分别为0.5mg EP/L和1.0mg EP/L。

如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少3个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少3.5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少4个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少4.5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少5.5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少6个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少7个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少8个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少9个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少10个单位。

在一个实施例中,可以如WO 2013/167581中所述,使用MiniLOM测定,对黄原胶与碳黑小块布样测量ΔRem酶值。一个优选实施例是黄原胶与碳黑(DN31、DN31C或DN31D)小块布样在20℃或40℃下的使用。一个更优选的实施例是黄原胶与碳黑(DN31C或DN31D)小块布样在40℃下的使用。一个甚至更优选的实施例是黄原胶与碳黑(DN31D)小块布样在40℃下的使用。优选地在460nm测量反射值。用于对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶和用于黄原胶裂解酶的优选的酶浓度分别为0.5mg EP/L和1.0mg EP/L。

如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少1.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少1.75个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2.25个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2.75个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少3个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少3.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少4个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少4.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少5个单位。

本发明还涉及用于降解纺织品的表面或硬表面上的黄原胶的方法,这些方法包括向黄原胶施用包括一种或多种本发明的内切葡聚糖酶的组合物。本发明进一步涉及用于降解纺织品的表面或硬表面上的黄原胶的方法,这些方法包括向黄原胶施用包括一种或多种黄原胶裂解酶的组合物。一个实施例是一种用于纺织品的表面或硬表面上的降解黄原胶的方法(例如餐具洗涤),该方法包括向黄原胶施用包括一种或多种本发明的内切葡聚糖酶连同一种或多种黄原胶裂解酶的组合物。一个实施例是包括如在此描述的一种或多种洗涤剂组分的组合物。

在地下地层的压裂(石油和/或天然气钻探)中的用途

使用水力压裂来创造自钻孔延伸至岩层的地下压裂,以便增加通过地层可以产生的流体的流速。通常,将高粘度压裂液以足够压裂地下地层的压力泵入井中。为了维持向地层的增加的暴露,将固体支撑剂添加至压裂液中,通过施加至流体的高压将其带进压裂处。一旦高粘度压裂液将该支撑剂带进地层中,破碎物用于减少流体的粘度,这允许该支撑剂停留在压裂处中并且由此增加地层向井的暴露。破碎物通过减少聚合物的分子量而工作,以此方式‘破碎’或降解聚合物。压裂处然后变为一种高渗透性管道,用于有待产生的流体和空气回至井中。此类过程进一步披露于美国专利号7,360,593、5,806,597、5,562,160、5,201,370以及5,067,566中。

因此,本发明涉及本发明的内切葡聚糖酶作为酶破碎物的用途。本发明的一个实施例是本发明的内切葡聚糖酶连同黄原胶裂解酶作为酶破碎物的用途。

因此,本发明提供了一种用于破碎钻井孔中的黄原胶的方法,该方法包括:(i)将包括水性流体的可胶凝压裂液、一种或多种能水合的聚合物、用于交联能水合的聚合物以形成一种聚合物凝胶的适合的交联剂,以及一种或多种本发明的酶(即,酶破碎物)共混在一起;(ii)将交联聚合物凝胶在足够压裂周围地层的压力下泵入钻井孔中;并且(iii)允许酶破碎物降解交联聚合物,以减少流体的粘度,这样使得可以将流体从地层泵回至井表面。因此,本发明的内切葡聚糖酶可以用于控制压裂液的粘度。此外,一种或多种本发明的内切葡聚糖酶连同一种或多种黄原胶裂解酶可以用于控制压裂液的粘度。

本发明的酶破碎物可以是压裂液或破碎物-交联剂-聚合物复合物的一种成分,该压裂液或复合物进一步包括一种能水合的聚合物和一种交联剂。压裂液或复合物可以是一种凝胶或可以是可胶凝化的。该复合物在以下方法中是有用的,该方法用于在一种压裂液中使用该复合物以将钻井孔周围的地下地层压裂,这是通过在足够将周围的地下地层压裂的压力下将该流体泵至钻井孔中的所希望的位置。该复合物可以通过维持特定条件的pH和温度来维持基本上非反应的状态,直到该流体被放置在钻井孔中的时刻并且完成所希望的压裂。一旦压力完成,该复合物维持无活性的特定条件便不再维持。当这些条件显著变化时,该复合物变得有活性并且破碎物开始催化聚合物降解,从而导致压裂液变得足够流动,以从地下地层泵至井表面。

降解黄原胶的方法,其中黄原胶用于压裂由钻井孔形成的地下地层

当钻井时,储层钻井液(RDF)在钻探设备内循环以冷却并清洁钻头,去除钻井孔外的钻屑,减少钻柱与钻孔的侧边之间的摩擦力,并且形成滤饼以便阻止流体渗漏进入地层中。用于形成滤饼的驱动力是应用以维持钻孔稳定性的较高的钻井孔压力。这一滤饼限制储层流体在钻探以及完井设备的放置过程中流入钻井孔。如果在井竣工之前或过程中未去除在钻探过程中造成的滤饼损伤,则当该井投入生产时可以出现一系列问题,即完井设备失败和受损的储层生产力。

钻井液(泥浆)(也称为储层钻井液(RDF))可以是合成/油基的或水基的。为了使钻井液对地层的侵入最小化,油基和水基泥浆滤饼两者都典型地包含一种桥接剂或增重剂,通常是碳酸钙颗粒、重晶石或两者的混合物,其桥接在地层的孔喉处并且由此形成相对低渗透性滤饼。油基和水基泥浆滤饼两者还都包含在钻探过程中带出的称作钻屑的固体,与添加在钻井液的配制品中的桥接/增重剂截然相反。这些固体可以是石英(砂)、粉砂和/或页岩,取决于储层地层以及由钻探路径至储层穿过的地层。另外,油基钻井泥浆包含陷于滤饼的孔域中的水滴,而水基泥浆滤饼包含聚合物,例如淀粉和黄原胶,以及其他无机盐。

形成泥浆滤饼对于钻探而言通常是必须的,特别是在具有钻井孔稳定性问题并且典型地具有高渗透性的疏松地层中。然后将滤饼用不同化学品处理,例如螯合剂或酸,以溶解方解石组分;和/或酶或氧化剂,以降解聚合物组分,从而恢复渗透性。

在一个方面中,本发明提供了一种用于降解黄原胶的方法,其中黄原胶用于压裂由钻井孔造成的地下地层,该方法是通过应用包括一种或多种本发明的酶的组合物。该方法可以包括以下步骤:(i)将包括一种或多种本发明的酶的处理流体泵入与有待去除的滤饼接触的钻孔中,以在该处理流体与邻接该滤饼的地层之间建立不同的压力并且(ii)在不同的压力周期过程中均匀地传播滤饼的处理,以通过该处理流体延迟突破。

在一个实施例中,该方法包括在地层与钻孔之间通过处理的滤饼建立渗透性。在另一个实施例中,该滤饼可以包括钻井固体和黏土,并且可以形成自水性钻井液。如果希望的话,用于处理水性钻井液滤饼的处理流体还可以包括一种氧化剂和/或螯合剂,或它可以是基本上不含螯合剂和氧化剂添加剂的。在另一个实例中,该滤饼可以形成自油或反相乳化钻井液。如果希望的话,用于处理油或反相乳化钻井液滤饼的处理流体还可以包括互溶剂、水润湿剂或其组合,从而将疏水性组分分散在滤饼中。

在一个实施例中,该处理流体包括一种或多种本发明的内切葡聚糖酶。在另一个实施例中,该处理流体包括一种或多种黄原胶裂解酶。在一个优选实施例中,该处理流体包括一种或多种内切葡聚糖酶以及一种或多种黄原胶裂解酶。

降解黄原胶的方法,其中黄原胶是钻孔滤饼中的一种组分

在一个方面中,本发明提供了一种一旦钻孔滤饼被泵至表面,用于清洁该滤饼的方法,该滤饼包括聚合物,例如黄原胶和钻井液固体。钻井泥浆从泥浆池泵至钻头然后再泵出至表面,在该过程中带出除其他东西之外的破碎的或切碎的岩石(钻屑)。将钻屑滤出并且将泥浆返回至泥浆池,在泥浆池中细粒可以沉淀和/或可以将添加化学品或酶(破碎物)进行添加。

用于降解黄原胶的方法(其中黄原胶是钻孔滤饼中的一种组分)可以包括以下步骤:(i)用一种处理流体处理该钻孔滤饼,该处理流体包括一种或多种本发明的酶并且(ii)将固体与流体分离。在一个实施例中,该处理流体包括一种或多种本发明的内切葡聚糖酶。在另一个实施例中,该处理流体包括一种或多种黄原胶裂解酶。在一个优选实施例中,该处理流体包括一种或多种本发明的内切葡聚糖酶以及一种或多种黄原胶裂解酶。

可以将钻孔滤饼在泥浆池中用一种或多种本发明的酶处理并且可以再循环钻井液。可替代地,一旦滤饼已经被一种或多种本发明的酶处理,使用固液分离方法(例如离心)将固体与流体分离。

在加工纤维素材料中的用途

本发明的多肽的内切葡聚糖酶活性也可用于降解或转化纤维素材料,包括:用包括本发明的多肽的酶组合物处理纤维素材料。在一个优选方面,该方法进一步包括对降解的或转化的纤维素材料进行回收。

本发明还涉及产生一种发酵产物的方法,这些方法包括:(a)在本发明的多肽的存在下,用一种酶组合物使纤维素材料糖化;(b)用一种或多种(若干种)发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从该发酵中回收该发酵产物。

本发明还涉及发酵纤维素材料的方法,这些方法包括:用一种或多种(若干种)发酵微生物发酵该纤维素材料,其中在本发明的多肽的存在下,用一种酶组合物糖化该纤维素材料。在一个优选方面,发酵该纤维素材料产生一种发酵产物。在另一个优选方面,该方法进一步包括从发酵中回收发酵产物。

本发明的方法可被用于将一种纤维素材料糖化成可发酵糖,并且将这些可发酵糖转化成许多有用的物质,例如燃料、饮用乙醇、和/或发酵产物(例如酸类、醇类、酮类、气体等)。由该纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。

根据本发明,可以使用本领域常规的过程来完成纤维素材料的加工。此外,可以使用被配置为根据本发明进行操作的常规生物质加工装置来实施本发明的方法。

分开或同时的水解(糖化)和发酵包括但不限于:分开水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、杂合的水解和发酵(HHF)、分开水解和共发酵(SHCF)、杂合的水解和共发酵(HHCF),以及直接微生物转化(DMC)。

常规装置可以包括补料分批搅拌反应器、分批搅拌反应器、具有超过滤的连续流搅拌反应器、和/或连续活塞流动柱反应器(柯瑞芝(Corazza)等人,2003,用于纤维二糖水解的补料分批反应器中的最佳控制(Optimal control in fed-batch reactor for the cellobiose hydrolysis),技术学报(Acta Scientiarum.Technology)25:33-38;古萨科夫(Gusakov)和辛涅特西(Sinitsyn),1985,纤维素酶水解动力学:1.用于分批反应器过程的数学模型(Kinetics of the enzymatic hydrolysis of cellulose:1.Amathematicalmodel for a batch reactor process),酶与微生物技术(Enz.Microb.Technol.)7:346-352),研磨反应器(隆(Ryu)和李(Lee),1983,通过使用研磨生物反应器,生物转化废物纤维素(Bioconversion of waste cellulose by using an attrition bioreactor),生物技术和生物工程(Biotechnol.Bioeng)25:53-65),或具有电场诱导的有力搅拌的反应器(古萨科夫(Gusakov)等人,1996,使用具有电场诱导的有力搅拌的新颖类型的生物反应器的纤维素酶水解的增强(Enhancement of enzymatic cellulose hydrolysis using anovel type of bioreactor with intensive stirring induced by electromagnetic field),应用生物化学与生物技术(Appl.Biochem.Biotechnol.)56:141-153)。另外的反应器类型包括:流化床,升流包覆层(blanket),固定化、以及用于水解和/或发酵的挤出机类型的反应器。

预处理。在实践本发明的方法中,可以使用本领域已知的任何预处理过程来破坏纤维素材料的细胞壁组分(钱德拉(Chandra)等人,2007,底物预处理:木质纤维素的有效酶水解的关键?(The key to effective enzymatic hydrolysis of lignocellulosics?)《生物化学工程/生物技术进展》(Adv.Biochem.Engin./Biotechnol.)108:67-93;加尔布(Galbe)和朱奇(Zacchi),2007,用于生物乙醇有效生产的不是纤维素材料的预处理(Pretreatment of lignocellulosic materials for efficient bioethanol production),《生物化学工程/生物技术进展》(Adv.Biochem.Engin./Biotechnol.)108:41-65;亨德里克斯(Hendriks)和塞曼(Zeeman),2009,预处理以增强木质纤维素生物质的可消化性(Pretreatments to enhance the digestibility of lignocellulosic biomass),《生物资源技术》(Bioresource Technol.)100:10-18;莫热(Mosier)等人,2005,用于预处理木质纤维素生物质前景技术的特征(Features of promising technologies for pretreatment of lignocellulosic biomass),《生物资源技术》(Bioresource Technol.)96:673-686;塔赫扎德(Taherzadeh)和卡里米(Karimi),2008,预处理木质纤维素废物来改进乙醇和生物气生产:综述(Pretreatment of lignocellulosic wastes to improve ethanol and biogas production:A review)《分子科学国际期刊》(Int.J.of Mol.Sci.)9:1621-1651;杨(Yang)和怀曼(Wyman),2008,预处理:用来解锁低成本纤维素乙醇的关键(Pretreatment:the key to unlocking low-cost cellulosic ethanol),《生物燃料、生物产品与生物精炼》(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。

纤维素材料也可以在预处理之前使用本领域中已知的方法进行颗粒尺寸减缩、预浸泡、润湿、洗涤、或调理。

常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、以及γ辐射预处理。

可以在水解和/或发酵前预处理纤维素材料。优选在水解前进行预处理。可替代地,预处理可以与酶水解同时进行,以释放可发酵的糖,例如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(即使在没有酶的情况下)。

蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁组分,包括木质素、半纤维素、以及纤维素,以使酶可接触纤维素和其他级分,例如,半纤维素。使纤维素材料经过或通过反应容器,其中注入蒸汽以将温度增加至所需的温度和压力,并且在其中保持所希望的反应时间。蒸汽预处理优选在140℃-230℃,更优选160℃-200℃,并且最优选170℃-190℃下进行,其中最优的温度范围取决于任何化学催化剂的添加。蒸汽预处理的停留时间优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最优的停留时间依赖于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆发放料(explosive discharge)合并,这被称为蒸汽爆炸,即,快速急骤蒸发至大气压和材料的湍流,以通过破碎增加可接触的表面积(Duff(迪福)和Murray(默里),1996,生物资源技术855:1-33;盖尔贝和赛琪,2002,Appl.Microbiol.Biotechnol.(应用微生物学与生物技术)59:618-628;美国专利申请号20020164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。

经常在蒸汽预处理之前添加催化剂(例如H2SO4或SO2)(典型地是0.3%至3%w/w),该催化剂减少时间并降低温度、增加回收率、并改进酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术129-132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;塞斯尼尔(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。

化学预处理:术语“化学处理”是指促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适合的化学预处理方法的实例包括(例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)、以及有机溶剂预处理。

在稀酸预处理中,纤维素材料与稀酸(典型地是H2SO4)和水混合,以形成浆液,由蒸汽加热至希望的温度,并且在停留时间后急骤蒸发至大气压。可以用多种反应器设计进行稀酸预处理,例如塞流反应器、逆流反应器、或连续逆流收缩床反应器(达夫(Duff)和默里(Murray),1996,见上文;谢尔(Schell)等人,2004,生物资源技术(BioresourceTechnol.)91:179-188;李(Lee)等人,1999,生物化学工程与生物技术进展(Adv.Biochem.Eng.Biotechnol.)65:93-115)。

还可以使用在碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:石灰预处理、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻爆炸(AFEX)。

用碳酸钙、氢氧化钠、或氨,在85℃-150℃的低温下进行石灰预处理,并且停留时间为从1小时到几天(怀曼(Wyman)等人,2005,生物资源技术(Bioresource Technol.)96:1959-1966;莫热(Mosier)等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900以及WO 2006/110901披露了使用氨的预处理方法。

湿氧化是典型地在加入如过氧化氢等氧化剂或过压的氧气、在180℃-200℃下进行5-15分钟的热预处理(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术(Bioresource Technol.)64:139-151;帕隆恩(Palonen)等人,2004,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)117:1-17;瓦尔加(Varga)等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。预处理优选以1%至40%干物质,更优选2%至30%干物质,并且最优选5%至20%干物质进行,并且经常通过添加碱如碳酸钠来增加初始pH。

被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在某一停留时间后,在预处理过程中引入氧化剂。然后通过急骤蒸发至大气压结束预处理(WO 2006/032282)。

氨纤维爆炸(AFEX)涉及用液态或气态氨在中等温度(例如90℃-100℃)和高压(例如17-20巴)下处理纤维素材料,持续5-10分钟,其中干物质含量可以高达60%(戈拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)98:23-35;丘恩达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术(Bioresource Technol.)96:2014-2018)。AFEX预处理导致纤维素的解聚和半纤维素的部分水解。木质素-碳水化合物复合物被裂解。

有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下萃取30-60分钟而将纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素被去除。

适合的预处理方法的其他实例由谢尔(Schell)等人,2003,应用生物化学与生物技术(Appl.Biochem.and Biotechnol.)105-108:69-85,和马塞尔(Mosier)等人,2005,生物资源技术(Bioresource Technology)96:673-686,以及美国公开申请号2002/0164730进行描述。

在一个方面中,化学预处理优选是以酸处理进行,并且更优选持续稀酸和/或弱酸处理。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1-5,更优选1-4,并且最优选1-3的pH范围内进行。在一个方面中,该酸浓度在优选从0.01wt%至20wt%酸,更优选0.05wt%至10wt%酸,甚至更优选0.1wt%至5wt%酸,并且最优选0.2wt%至2.0wt%酸的范围中。使酸与纤维素材料相接触,并在优选160℃-220℃,并且更优选165℃-195℃范围内的温度下保持从几秒到几分钟,例如1秒至60分钟范围内的时间。

在另一个方面中,预处理是作为氨纤维爆炸步骤(AFEX预处理步骤)进行。

在另一个方面中,预处理在水性浆料中进行。在优选的方面,在预处理过程中纤维素材料以优选10wt%-80wt%之间,更优选20wt%-70wt%之间,并且最优选30wt%-60wt%之间,例如50wt%左右的量存在。可以使用本领域已知的任何方法不洗涤或洗涤预处理的纤维素材料,例如用水洗涤。

机械预处理:术语“机械预处理”是指各种类型的研磨或碾磨(例如,干磨、湿磨、或振动球磨)。

物理预处理:术语“物理预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何预处理。例如,物理预处理可包括辐射(例如微波辐射)、汽蒸/蒸汽爆炸、水热解及其组合。

物理预处理可以包括高压和/或高温(蒸汽爆炸)。在一个方面中,高压意指在优选约300至约600psi,更优选约350至约550psi,并且最优选约400至约500psi,例如450psi左右的范围中的压力。在另一个方面中,高温意指在约100℃至约300℃,优选约140℃至约235℃范围内的温度。在一个优选方面,在分批过程中,以蒸汽枪水解器系统(例如从顺智公司(Sunds Defibrator AB),瑞典(Sweden)可获得的Sunds水解器(Sunds Hydrolyzer))来进行机械预处理,该系统使用如上所定义的高压和高温。

组合的物理和化学预处理:纤维素材料可以物理地并且且化学地预处理。例如,该预处理步骤可包括稀酸或弱酸预处理以及高温和/或高压处理。这些物理预处理和化学预处理可以根据需要顺序地进行或同时进行。也可以包括机械预处理。

因此,在一个优选方面中,使纤维素材料经受机械、化学或物理预处理、或其任何组合,以促进纤维素、半纤维素、和/或木质素的分离和/或释放。

生物预处理:术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物(参见,例如,舒·T.-A.(Hsu,T.-A.),1996,生物质的预处理(Pretreatment of biomass),生物乙醇手册:生产和利用,怀曼·C.E.编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;高希(Ghosh)和辛格(Singh),1993,用于纤维素生物质的酶/微生物转化的物理化学与生物处理(Physicochemical and biological treatments for enzymatic/microbial conversion of cellulosic biomass),应用微生物学进展(Adv.Appl.Microbiol.)39:295-333;麦克米兰·J.D.(McMillan,J.D.),1994,预处理木质纤维素生物质:综述(Pretreating lignocellulosic biomass:a review),用于燃料生产的生物质的酶转化(Enzymatic Conversion of Biomass for Fuels Production),希默尔·M.E.、贝克·J.O.、以及奥弗伦·R.P.(Overend,R.P.)编辑,美国化学学会讨论会系列566(ACS Symposium Series 566),美国化学学会(American Chemical Society),华盛顿特区,第15章;贡·C.S.(Gong,C.S.)、卡奥·N.J.(Cao,N.J.)、杜·J.(Du,J.)、以及曹·G.T.(Tsao,G.T.),1999,由可再生资源生产乙醇(Ethanol production from renewable resources),生物化学工程/生物技术的进展,舍佩尔·T.编辑,施普林格出版社德国海德堡柏林(Berlin Heidelberg,Germany),65:207-241);奥尔森(Olsson)和哈恩-哈格达尔(Hahn-Hagerdal),1996,用于乙醇生产的木质纤维素水解物的发酵(Fermentation of lignocellulosic hydrolysates for ethanol production),酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦蓝德(Vallander)和埃里克松(Eriksson),1990,由木质纤维素材料生产乙醇:技术现状(Production of ethanol from lignocellulosic materials:State of the art),生物化学工程/生物技术的进展42:63-95)。

糖化。在水解步骤(还称为糖化)中,将(例如预处理的)纤维素材料水解,以将纤维素以及可替代地还有半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性寡糖。水解由酶组合物在本发明的多肽的存在下酶促进行。该组合物可进一步包括一种或多种(若干种)半纤维素分解酶或木聚糖降解酶。还可顺序地添加这些组合物的酶。

酶水解优选在易于由本领域技术人员确定的条件下、在合适的含水环境中执行。在一个优选方面中,水解在适合于一种或多种酶的活性,即对于该一种或多种酶而言最佳的条件下进行。水解可以作为分批补料过程或连续过程进行,其中将预处理的纤维素材料(底物)逐渐补料至例如含酶的水解溶液中。

糖化通常在受控的pH、温度以及混合条件下在搅拌釜反应器或发酵罐中进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约96小时,更优选约16至约72小时,并且最优选约24至约48小时。温度优选约25℃至约70℃,更优选约30℃至约65℃,并且最优选约40℃至约60℃,特别是约50℃。pH在优选约3至约8,更优选约3.5至约7,并且最优选约4至约6、具体地约pH 5的范围中。干燥固体含量在优选约5wt%至约50wt%,更优选约10wt%至约40wt%,并且最优选约20wt%至约30wt%的范围中。

该酶组合物优选地包括多种具有纤维素分解活性和/或木聚糖降解活性的酶。在一个方面中,该酶组合物包括一种或多种(若干种)纤维素分解酶。在另一个方面中,该酶组合物包括一种或多种(若干种)木聚糖降解酶。在另一个方面中,该酶组合物包括一种或多种(若干种)纤维素分解酶和一种或多种(若干种)木聚糖降解酶。

该一种或多种(若干种)纤维素分解酶优选是选自下组,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。该一种或多种(若干种)木聚糖降解酶优选是选自下组,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。

在另一个方面中,该酶组合物进一步或甚至进一步包括具有纤维素分解增强活性的多肽(参见,例如WO 2005/074647、WO 2005/074656、以及WO 2007/089290)。在另一个方面中,该酶组合物可以进一步或甚至进一步包括一种或多种(若干种)另外的酶活性以改进含纤维素材料的降解。优选的另外的酶是半纤维素酶(例如α-D-葡糖醛酸糖苷酶、α-L-阿拉伯呋喃糖苷酶、内切-甘露聚糖酶、β-甘露糖苷酶、α-半乳糖苷酶、内切-α-L-阿拉伯聚糖酶、β-半乳糖苷酶)、碳水化合物-酯酶(例如乙酰基-木聚糖酯酶、乙酰基-甘露聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、葡萄糖醛酸酯酶)、果胶酶、蛋白酶、木质素分解酶(例如漆酶、锰过氧化物酶、木质素过氧化物酶、H2O2生产酶、氧化还原酶)、扩张蛋白、膨胀素、或其混合物。在本发明的方法中,可以在发酵之前或过程中,例如在糖化过程中,或在发酵微生物的繁殖过程中或之后添加这一种或多种另外的酶。

该酶组合物的一种或多种(若干种)组分可以是野生型蛋白、重组蛋白、或野生型蛋白与重组蛋白的组合。例如,一种或多种(若干种)组分可以是用作宿主细胞以重组表达该酶组合物的一种或多种(若干种)其他组分的细胞的原生蛋白质。该酶组合物的一种或多种(若干种)组分可以作为单组分产生,然后将这些单组分组合以形成该酶组合物。酶组合物可以是多组分和单组分蛋白制剂的组合。

用于本发明的方法中的酶可以处于适合用于此处所述的过程中的任何形式,例如像去除或未去除细胞的粗发酵液、具有或不具有细胞碎片的细胞裂解液、半纯化的或纯化的酶制剂、或作为酶来源的宿主细胞。酶组合物可以是干粉或颗粒、非尘颗粒、液体、稳定化的液体、或稳定化的受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。

在下面各段中对本发明进行了进一步的概述:

1.一种具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,该多肽选自下组,该组由以下各项组成:

(a)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;

(b)由多核苷酸编码的多肽,该多核苷酸在中严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列,(ii)(i)的全长补体杂交;

(c)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;

(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个位置包括取代、缺失、和/或插入;和

(e)(a)、(b)、(c)、或(d)的多肽的片段,该片段具有内切葡聚糖酶活性并且对用黄原胶裂解酶预处理的黄原胶具有活性。

2.如段落1所述的多肽,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。

3.如段落1或2中任一项所述的多肽,该多肽由多核苷酸编码,该多核苷酸在中-高严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列,或(ii)(i)的全长补体杂交;

4.如段落1-3中任一项所述的多肽,该多肽由多核苷酸编码,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。

5.如段落1-4中任一项所述的多肽,由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽组成。

6.如段落1-4中任一项所述的多肽,包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽。

7.如段落1-4中任一项所述的多肽,该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的一种变体,该变体在一个或多个位置,例如高达10个,例如,1、2、3、4、5、6、7、8、9、或10个位置包括取代、缺失、和/或插入。

8.如段落1至7所述的多肽,该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的片段,其中该片段具有内切葡聚糖酶活性并且对用黄原胶裂解酶预处理的黄原胶具有活性。

9.如段落1至8中任一项所述的多肽,其中该成熟多肽是SEQ ID NO:2中位置1至813中所示的多肽,SEQ ID NO:4中位置1至836中所示的多肽,SEQ ID NO:6中位置1至949中所示的多肽,SEQ ID NO:8中位置1至830中所示的多肽,SEQ ID NO:10中位置1至866中所示的多肽,SEQ ID NO:12中位置1至827中所示的多肽,SEQ ID NO:14中位置1至903中所示的多肽,SEQ ID NO:16中位置1至932中所示的多肽,SEQ ID NO:18中位置1至920中所示的多肽,SEQ ID NO:20中位置1至844中所示的多肽,SEQ ID NO:22中位置1至849中所示的多肽,SEQ ID NO:24中位置1至903中所示的多肽,SEQ ID NO:26中位置1至894中所示的多肽,SEQ ID NO:28中位置1至894中所示的多肽,SEQ ID NO:30中位置1至955中所示的多肽,SEQ ID NO:32中位置1至894中所示的多肽,SEQ ID NO:34中位置1至893中所示的多肽,SEQ ID NO:36中位置1至894中所示的多肽,SEQ ID NO:38中位置1至894中所示的多肽,和SEQ ID NO:40中位置1至867中所示的多肽中的任一项。

10.一种编码如段落1-9中任一项所述的多肽的多核苷酸。

11.一种核酸构建体或表达载体,该核酸构建体或表达载体包括如段落10所述的多核苷酸,该多核苷酸可操作地连接至指导多肽在表达宿主内产生的一个或多个控制序列。

12.一种重组宿主细胞,该重组宿主细胞包括如段落10所述的多核苷酸,该多核苷酸可操作地连接至指导多肽的产生的一个或多个控制序列。

13.一种产生如段落1-9中任一项所述的多肽的方法,该方法包括:在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽。

14.如段落13所述的方法,该方法进一步包括回收该多肽。

15.一种产生具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽的方法,该方法包括在有益于产生该多肽的条件下培养如段落12所述的宿主细胞。

16.一种用编码如段落1-9中任一项所述的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。

17.一种产生对用黄原胶裂解酶预处理的黄原胶具有内切葡聚糖酶活性和/或具有活性的多肽的方法,该方法包括在有益于产生该多肽的条件下培养如段落16所述的转基因植物或植物细胞。

18.如段落17所述的方法,该方法进一步包括回收该多肽。

19.一种包括如段落1-9中任一项所述的多肽的全培养液配制品或细胞培养组合物。

20.一种包括如段落1-9中任一项所述的多肽的组合物。

21.如段落20所述的组合物,该组合物进一步包括具有黄原胶裂解酶活性的多肽。

22.如段落20或21中任一项所述的组合物,该组合物是洗涤剂组合物,该洗涤剂组合物包括一种或多种洗涤剂组分。

23.如段落20-22中任一项所述的组合物,其中这些洗涤剂组分选自下组,该组包括表面活性剂、助洗剂、助水溶剂、漂白系统、聚合物、织物调色剂、辅料、分散剂、染料转移抑制剂、荧光增白剂以及污垢释放聚合物,或其任何混合物。

24.如段落20-23中任一项所述的组合物,其中该洗涤剂组合物处于以下形式:棒,均匀的片剂,具有两个或更多个层的片剂,具有一个或多个室的袋,规则的或压缩的粉末,颗粒,膏,凝胶,或规则的、压缩的或浓缩的液体。

25.如段落20-23中任一项所述的组合物用于降解黄原胶的用途。

26.如段落25所述的用途,用于控制钻井液的粘度。

27.如段落24所述的用途,用于洗涤或清洁纺织品和/或硬表面,例如餐具洗涤。

28.如段落24所述的用途,其中该洗涤剂组合物具有酶洗涤益处。

29.一种用于降解黄原胶的方法,该方法包括向黄原胶施用根据段落20-24中任一项所述的组合物。

30.如段落29所述的方法,其中该黄原胶在纺织品的表面上或硬表面上,例如餐具洗涤。

31.如段落29所述的方法,其中该黄原胶在由钻井孔穿透的地下地层的压裂中使用。

32.如段落29所述的方法,其中该黄原胶是钻孔滤饼中的组分。

33.一种用于降解或转化纤维素材料的方法,该方法包括:用根据段落20-24中任一项所述的酶组合物或在如段落1-9中任一项所述的多肽的存在下处理纤维素材料。

34.如段落33所述的方法,其中该纤维素材料是经预处理的。

35.如段落32或33所述的方法,其中该酶组合物包括选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、蛋白酶、漆酶、或过氧化物酶。

36.如段落35所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。

37.如段落35所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。

38.如段落33-37中任一项所述的方法,其进一步包括回收降解的纤维素材料。

39.如段落38所述的方法,其中该降解的纤维素材料是糖,该糖优选地选自下组,该组由以下各项组成:葡萄糖、木糖、甘露糖、半乳糖\以及阿拉伯糖。

40.一种用于产生发酵产物的方法,包括:

(a)在如段落1-9中任一项所述的多肽的存在下,用酶组合物对纤维素材料进行糖化;

(b)用一种或多种发酵微生物对该糖化的纤维素材料进行发酵,以产生该发酵产物;和

(c)从该发酵中回收该发酵产物。

通过以下实例进一步描述本发明,这些实例不应当解释为限制本发明的范围。

实例

实例1:搜索和鉴定假定的内切葡聚糖酶基因

基于专利申请号EP14170186.2的SEQ ID NO 2中披露的内切葡聚糖酶和UniProt release2013_04(贝罗奇(Bairoch)等人,2005)以及内部数据库中最接近的同系物,通过提取每种纤维素酶的C末端部分,使用MAFFT(加藤(Katoh),2002)创建多重比对,并使用HMMER3的hmmbuild(埃迪(Eddy),2011)构建HMM,来产生隐马尔科夫模型(HMM)。保守结构域的HMMER3的hmmsearch(埃迪,2011)发现了从DOE联合基因组研究所(DOE Joint Genome Institute),NCBI(国家生物技术信息中心(National Center for Biotechnology Information),核酸研究(Nucleic Acids Res.)2009年1月)和欧洲核苷酸档案(莱诺宁(Leinonen),核酸研究,2011年1月)可获得的公众可获得的基因组的和宏基因组的组装中的334个同系物。使用以下参数对blast命中(Blast hit)进行分类:覆盖>50%,二进制值>50和E值<1e-05。

实例2:内切葡聚糖酶编码基因的生物信息学分析

通过针对Pfam数据库(M.蓬塔(Punta),P.C.可希尔(Coggill),R.Y.埃伯哈特(Eberhardt),J.米斯特里(Mistry),J.塔特(Tate),C.博斯耐尔(Boursnell),N.庞(Pang),K.福斯卢德(Forslund),G.赛利克(Ceric),J.克莱门茨(Clements),A.赫格尔(Heger),L.霍尔姆(Holm),E.L.L.梭哈摩尔(Sonnhammer),S.R.埃迪,A.贝特曼(Bateman),R.D.费恩(Finn).Pfam:蛋白质家族数据库(the protein families database),核酸研究(Nucleic Acids Research)(2014)数据库问题(Database Issue)42:D222-D230)的氨基酸序列(SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40)的blast搜索和通过与专利申请号EP14170186.2的SEQ ID NO 2中披露的内切葡聚糖酶的氨基酸序列比对,来进一步将通过实例1中描述的程序选择的二十个分子分类。在一些情况下,针对Pfam数据库的blast搜索鉴定了相关性非常远的Pfam PF00150结构域,该结构域具有刚好高于由Pfam定义的噪声截止值的%序列一致性和HMM得分(%序列截止值为20.7%,并且HMM得分截止值为20.7)。在大多数情况下,%序列一致性低于噪声截止值。此外,相关性远的PF00150结构域仅是部分的,跨越在定义为在监管下的模型长度和在Pfam主页(pfam.sanger.ac.uk)可获得的模型区段的281个残基中的大约150个残基。此外,在SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40中鉴定了PF02018结构域或长度与PF02018结构域相等的非注释区域(non-annotated region)。Pf00150的假定的催化结构域由靠近β-链的羧基末端的两个谷氨酸四和七组成,其中一个充当质子供体,并且另一个作为亲核体(詹金斯(Jenkins)J,罗莱焦(Lo Leggio)L,哈里斯(Harris)G,和皮克斯吉尔(Pickersgill)R.,β-葡糖苷酶,β-半乳糖苷酶,家族A纤维素酶,家族F木聚糖酶和两种大麦葡聚糖酶形成具有8倍β/a结构并且具有靠近β-链的羧基末端的两个保守谷氨酸四和七的酶的超家族(Beta-glucosidase,beta-galactosidase,family A cellulases,family F xylanases and two barley glycanases form a superfamily of enzymes with 8-fold beta/alpha architecture and with two conserved glutamates near the carboxy-terminal ends of beta-strands four and seven.)欧洲生化学会联合会快报(FEBS Lett.)1995年4月10;362(3):281-5)。基于氨基酸序列比对,不管相关性远的PF00150结构域的存在,在所有分子(SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40)中鉴定了假定的谷氨酸质子供体和假定的谷氨酸亲核体(图1)。在高度保守区域中催化残基的存在强烈地表明分子之间的密切关系。假定的谷氨酸质子供体位于部分PF00150结构域中,并且假定的亲核体(E566)位于PF02018结构域之后(或在一些情况下,非注释区域长度等于PF02018结构域)。这表示PF02018结构域已经被引入谷氨酸催化残基之间,生成新颖的结构域结构。

实例3:内切葡聚糖酶的克隆和表达

获得内切葡聚糖酶基因的成熟肽编码部分(SEQ ID NO:1中位置67至2508,SEQ ID NO:3中位置76至2583,SEQ ID NO:5中位置67至2913,和SEQ ID NO:7中位置73至2562),作为合成基因。鉴定内切葡聚糖酶基因的成熟肽编码部分并将其插入大肠杆菌中。从大肠杆菌转化体纯化包含插入片段的表达质粒,并将其转化到枯草芽孢杆菌宿主细胞中。转化的宿主细胞在液体培养基中生长。通过SDS-PAGE和活性测试验证内切葡聚糖酶的表达。

实例4:内切葡聚糖酶的表征

将培养液在台式离心机中以20,000g离心20分钟,并将上清液直接用于内切葡聚糖酶的表征。AZCL-HE-纤维素(交联和染色纤维素)测定用于检测内切葡聚糖酶活性。通过温和搅拌,将1%AZCL-HE-纤维素(来自麦格酶公司(Megazyme))悬浮于0.01%Triton X-100中。将200微升的这种悬浮液和200微升测定缓冲液在艾本德管中混合并且置于冰上。添加20微升内切葡聚糖酶样品。通过将艾本德管转移至设定为测定温度的艾本德恒温混匀仪来启动测定。将管在艾本德恒温混匀仪上在其最高振摇速率(1400rpm)下孵育高达60min。通过转移该管返回至冰浴停止孵育。然后将管在冰冷离心机中离心2min,将200微升上清液转移至微量滴定板,并且读取OD590。枯草芽孢杆菌宿主菌株包括在该测定中。将ΔOD590=OD590(酶)–OD590(枯草芽孢杆菌宿主菌株)用于内切葡聚糖酶活性的测量。

可变测定条件

温度:30℃-80℃

底物:AZCL-HE-纤维素,AZCL-支链淀粉,AZCL-木葡聚糖和AZCL-凝胶多糖。

测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,调节至pH 3-11。

将上述内切葡聚糖酶测定用于获得pH活性曲线,温度-活性曲线连同底物特异性曲线。

实例5:黄原胶降解活性粘度测定

本发明的多肽的黄原胶降解活性可以当与内切葡聚糖酶一起孵育时,通过测量黄原胶溶液或改性黄原胶溶液的粘度的降低来测定。使用描述于WO 2011/107472中的粘度压力测定法进行粘度测量。

底物改性黄原胶(mXG)是用去除末端丙酮酸甘露糖的黄原胶裂解酶处理的黄原胶(XG),并且使用在南海(Nankai),桥本(Hashimoto)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol)65(6):2520-2526中描述的方法的改编版来制备:在2L烧杯中将2.5g黄原胶(斯比凯可(CP Kelco))用5mL的96%乙醇润湿。添加500mL的100mM ACES缓冲液pH 7.00,并且将溶液在环境温度下搅拌2h。添加250μL黄原胶裂解酶(麦格酶公司产品E-XANLB,芽胞杆菌属物种),并且将溶液在50℃下孵育20h。在水解后,在搅拌下,将1400mL的96%乙醇添加到500mL样品中。发生沉淀,并且在大约5min后,倾析出乙醇,由此去除丙酮酸甘露糖残余物。将500mL的96%乙醇再次添加到剩余的溶液中,并在任何沉淀后倾析。将样品在华特门(Whatman)过滤器GF/C上在蒸发漏斗上干燥。将过滤器在50℃下干燥20h。收集样品,研磨并通过300μM筛过筛。

水解条件如下:50℃,0.6%黄原胶(XG)或0.3%改性黄原胶(mXG),在50mM HEPES缓冲液+0.01%triton X-100(pH 7.0)中。在热平衡时添加酶。在热平衡后并且在酶添加之前测量初始粘度。对照与代替酶的添加的缓冲液相同。

粘度的降低是酶活性的量度。当内切葡聚糖酶和黄原胶裂解酶与黄原胶一起孵育时,或当内切葡聚糖酶与改性黄原胶单独孵育时,观察到粘度的显著下降。这表明一旦去除丙酮酸甘露糖,底物现在是空间可用的并且被内切葡聚糖酶降解。

改性黄原胶:底物改性黄原胶(mXG)是用去除末端丙酮酸甘露糖的黄原胶裂解酶处理的黄原胶(XG),并且使用在南海(Nankai),桥本(Hashimoto)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol)65(6):2520-2526中描述的方法的改编版来制备:在2L烧杯中将2.5g黄原胶(斯比凯可(CP Kelco))用5mL的96%乙醇润湿。添加500mL的100mM ACES缓冲液pH 7.00,并且将溶液在环境温度下搅拌2h。添加250μL黄原胶裂解酶(麦格酶公司产品E-XANLB,芽胞杆菌属物种),并且将溶液在50℃下孵育20h。在水解后,在搅拌下,将1400mL的96%乙醇添加到500mL样品中。发生沉淀,并且在大约5min后,倾析出乙醇,由此去除丙酮酸甘露糖残余物。将500mL的96%乙醇再次添加到剩余的溶液中,并在任何沉淀后倾析。将样品在华特门(Whatman)过滤器GF/C上在蒸发漏斗上干燥。将过滤器在50℃下干燥20h。收集样品,研磨并通过300μM筛过筛。

实例6:还原末端测定

使用由莱韦尔(Lever)(1972),分析化学(Anal.Biochem.)47:273-279,1972研发的比色测定,通过用黄原胶裂解酶预处理的黄原胶(mXG,如实例5中制备)上的还原末端,确定内切葡聚糖酶活性。产生的任何还原末端都将与PAHBAH反应,从而产生颜色的变化,该颜色变化在用于该测定的条件下与酶活性成比例。

如以上描述的通过还原末端确定黄原胶裂解酶活性,除了将0.1%黄原胶用作底物以外。

材料和化学品:0.1%底物:24ml Milli-Q水中的用黄原胶裂解酶预处理的6ml(5mg/ml)黄原胶。

活性缓冲液:100mM乙酸钠,100mM MES,1mM CaCl2,在0.01%曲通X100中,pH 7。

Ka-Na-酒石酸盐/NaOH缓冲液:将Ka-Na-酒石酸盐(50g)和NaOH(20g)溶解于水中,至总体积为1升。储存在4℃下。

终止溶液:将PAHBAH(西格玛H-9882)溶解于Ka-Na-酒石酸盐/NaOH溶液中,至浓度为15mg/ml(例如,将500mg PAHBAH溶解于33ml Ka-Na-酒石酸盐/NaOH溶液中)

样品制备:使用BioMek液体处理机器人,将酶样品在柯仕达条(costarstrip)中的活性缓冲液中稀释至0.1mg/ml。将50μl的底物和50μl的每种稀释的样品转移至96孔PCR-MTP板,向每个样品中添加50μl活性缓冲液并将溶液混合。将密封的PCR-板在37℃下、在PCR机中孵育15min,然后立即冷却至10℃。向每个样品中添加75μl的终止溶液,将混合物振荡,并且将75μl的每个样品丢弃。将这些样品在95℃下孵育10min,然后在10℃下孵育1min。将150μl的每种样品转移至新的96孔PCR-MTP并且测量405nm处的吸光度。

比色反应与产生的还原末端的量成比例,并且因此与存在的内切葡聚糖酶的量成比例。

序列表

<110> 诺维信公司

<120> 具有内切葡聚糖酶活性的多肽

<130> 12789-WO-PCT

<160> 42

<170> PatentIn版本3.5

<210> 1

<211> 2511

<212> DNA

<213> 土壤宏基因组

<220>

<221> 信号肽

<222> (1)..(66)

<220>

<221> CDS

<222> (1)..(2508)

<220>

<221> 成熟肽

<222> (67)..(2508)

<400> 1

atg ctt cgc gcg gct ttg gcg gca atg gtt atg gcg ggc gct ctg acg 48

Met Leu Arg Ala Ala Leu Ala Ala Met Val Met Ala Gly Ala Leu Thr

-20 -15 -10

gcg ggt tcg gcc gcg ggc gag atg ttc ccc ttc acc atg cca tgg aac 96

Ala Gly Ser Ala Ala Gly Glu Met Phe Pro Phe Thr Met Pro Trp Asn

-5 -1 1 5 10

gac gcc ggc acc ggc aat atc acc gac ctg tcg gcg tgg aac gat aag 144

Asp Ala Gly Thr Gly Asn Ile Thr Asp Leu Ser Ala Trp Asn Asp Lys

15 20 25

ccg gcg ggg gcg agc ggc ttc gtc acc gtc gcg ggc ggc cat ctg gtg 192

Pro Ala Gly Ala Ser Gly Phe Val Thr Val Ala Gly Gly His Leu Val

30 35 40

gcg ggc ggc aaa cgg ctg caa ctc ctc ggc gtc aac gtg acc ttc ggc 240

Ala Gly Gly Lys Arg Leu Gln Leu Leu Gly Val Asn Val Thr Phe Gly

45 50 55

tcc aac gcg cct gag cat gcc gat gcc gat atc gtg gcg cgc cgg atg 288

Ser Asn Ala Pro Glu His Ala Asp Ala Asp Ile Val Ala Arg Arg Met

60 65 70

gcc cgc ttc ggc atc aat atc gtg cgg ctg cac cat atg gac acc tat 336

Ala Arg Phe Gly Ile Asn Ile Val Arg Leu His His Met Asp Thr Tyr

75 80 85 90

gag gcg ccg ttc ggg att ctg gaa aag gat cgc gtc acc ctc aac ccc 384

Glu Ala Pro Phe Gly Ile Leu Glu Lys Asp Arg Val Thr Leu Asn Pro

95 100 105

gac tat ctc gac aag ctg gac tat ttc gtc gcc gcg ctg aag cgg cag 432

Asp Tyr Leu Asp Lys Leu Asp Tyr Phe Val Ala Ala Leu Lys Arg Gln

110 115 120

ggc att tat gtc gac atc aac ctg cat gtc ggc cgc gcc tat ccg ggc 480

Gly Ile Tyr Val Asp Ile Asn Leu His Val Gly Arg Ala Tyr Pro Gly

125 130 135

ttt gcg agt tgg ccg ggc ggc gac agc tat ttc aag ggc gtc gat cac 528

Phe Ala Ser Trp Pro Gly Gly Asp Ser Tyr Phe Lys Gly Val Asp His

140 145 150

ttc gag ccg cag atg atc cgc ttg cag aag gat ttc gcc cgc gac ctg 576

Phe Glu Pro Gln Met Ile Arg Leu Gln Lys Asp Phe Ala Arg Asp Leu

155 160 165 170

ctc cac cat cgc aat ccc tat acc ggc acc cgt tat gcc gac gaa ccg 624

Leu His His Arg Asn Pro Tyr Thr Gly Thr Arg Tyr Ala Asp Glu Pro

175 180 185

gcg gtc gcc atc gtc gag atc aac aac gag aac ggc ctg atc cgc gaa 672

Ala Val Ala Ile Val Glu Ile Asn Asn Glu Asn Gly Leu Ile Arg Glu

190 195 200

tgg ggc gcc ggg gcg ctc gac gcc atg acc gag ccg ctg cgc ggt gag 720

Trp Gly Ala Gly Ala Leu Asp Ala Met Thr Glu Pro Leu Arg Gly Glu

205 210 215

atg acc cgg caa tgg aat gtc tgg ctg aag cag cgc tat ggc agc gat 768

Met Thr Arg Gln Trp Asn Val Trp Leu Lys Gln Arg Tyr Gly Ser Asp

220 225 230

gcg gca ctg cgc caa gcg tgg ggc gcg cgc agc gaa ccg ctc ggc aac 816

Ala Ala Leu Arg Gln Ala Trp Gly Ala Arg Ser Glu Pro Leu Gly Asn

235 240 245 250

gag atg ttc acc acc ggc tgg caa ttg cag acg ctt ggc ggt gcg cac 864

Glu Met Phe Thr Thr Gly Trp Gln Leu Gln Thr Leu Gly Gly Ala His

255 260 265

gca acg ctg acg ccg acc gcg gtc ggg ctc gcc ctg acc atg acc ggc 912

Ala Thr Leu Thr Pro Thr Ala Val Gly Leu Ala Leu Thr Met Thr Gly

270 275 280

aaa ggc caa gag agc tgg cac acg cag atg cac caa ggc ggg ctg aat 960

Lys Gly Gln Glu Ser Trp His Thr Gln Met His Gln Gly Gly Leu Asn

285 290 295

ttc acc gcc gaa cga ccc tac acc ctg acg ctg cgg ctt cgg gcc gat 1008

Phe Thr Ala Glu Arg Pro Tyr Thr Leu Thr Leu Arg Leu Arg Ala Asp

300 305 310

cac ccg atg aaa gtc gcg gtg cag gcg atg cag acc cac gaa ccg tgg 1056

His Pro Met Lys Val Ala Val Gln Ala Met Gln Thr His Glu Pro Trp

315 320 325 330

aaa tgg ttg ttg tcc gat acc att tcg gtc ggc acc gaa tgg aag acg 1104

Lys Trp Leu Leu Ser Asp Thr Ile Ser Val Gly Thr Glu Trp Lys Thr

335 340 345

gtg cat ttc acg ttt gtg ccc gcc ttc ggc gag acc ggc gcg cgg ctg 1152

Val His Phe Thr Phe Val Pro Ala Phe Gly Glu Thr Gly Ala Arg Leu

350 355 360

acg ctg ggc ggt ctc ggg ttt gag acc ggc aca ctg gag att gcc gaa 1200

Thr Leu Gly Gly Leu Gly Phe Glu Thr Gly Thr Leu Glu Ile Ala Glu

365 370 375

gcg agt ttg cgg ccc ggc ggc acg tcg ggg ctg aaa ccg ggc gaa aat 1248

Ala Ser Leu Arg Pro Gly Gly Thr Ser Gly Leu Lys Pro Gly Glu Asn

380 385 390

ctc gac cgc ggc agc gtc gcg atc agc gaa tat agt tcc cgc ttc agc 1296

Leu Asp Arg Gly Ser Val Ala Ile Ser Glu Tyr Ser Ser Arg Phe Ser

395 400 405 410

cgc acg ccg gcg gcg caa cgc gat tgg ctg aat ttc ctg tgg gat acc 1344

Arg Thr Pro Ala Ala Gln Arg Asp Trp Leu Asn Phe Leu Trp Asp Thr

415 420 425

gaa acc cac tat tgg gcc gag atg cag cgg ttc ctg aag gcc gat ctc 1392

Glu Thr His Tyr Trp Ala Glu Met Gln Arg Phe Leu Lys Ala Asp Leu

430 435 440

ggc gtc aaa tcg ctg ctc gtc ggg acg cag acg gtg tac agc ccg gcg 1440

Gly Val Lys Ser Leu Leu Val Gly Thr Gln Thr Val Tyr Ser Pro Ala

445 450 455

cca atc caa tcc ggc ctc gat gtc gtc gac gat cac gcc tat tgg cag 1488

Pro Ile Gln Ser Gly Leu Asp Val Val Asp Asp His Ala Tyr Trp Gln

460 465 470

cat ccg cat ttc ccc ggc cgc gcc tgg gat ccg ggc aac tgg cgg atc 1536

His Pro His Phe Pro Gly Arg Ala Trp Asp Pro Gly Asn Trp Arg Ile

475 480 485 490

aac aat ctg ccg atg gcg ggc ctc gaa ggc ggc ggc acg att gcc gat 1584

Asn Asn Leu Pro Met Ala Gly Leu Glu Gly Gly Gly Thr Ile Ala Asp

495 500 505

ctg gcg ctg cgc cgc gtg ccc ggc aag ccg ttc atc gtg acg gaa tac 1632

Leu Ala Leu Arg Arg Val Pro Gly Lys Pro Phe Ile Val Thr Glu Tyr

510 515 520

aac gcg cca gcg ccg aac gac tac caa ggc gag gcc atg ccg ctg gtt 1680

Asn Ala Pro Ala Pro Asn Asp Tyr Gln Gly Glu Ala Met Pro Leu Val

525 530 535

gcg gcg tat ggc gcg cta cag gat tgg gac ggc att ttc ctg ttc gac 1728

Ala Ala Tyr Gly Ala Leu Gln Asp Trp Asp Gly Ile Phe Leu Phe Asp

540 545 550

tac ggc ggc tgg gac aac aac tgg cac acc gat cat atc gac agc ttc 1776

Tyr Gly Gly Trp Asp Asn Asn Trp His Thr Asp His Ile Asp Ser Phe

555 560 565 570

ttc gac agc cgc tcc aat ccg gtg aaa ctg gcg agc ttg atc gcg acc 1824

Phe Asp Ser Arg Ser Asn Pro Val Lys Leu Ala Ser Leu Ile Ala Thr

575 580 585

gcc gcg atg ctg cgg cgg ggc gat gtc gcg gcg gcc gct ccg acg cgt 1872

Ala Ala Met Leu Arg Arg Gly Asp Val Ala Ala Ala Ala Pro Thr Arg

590 595 600

gca agc atg ccg gac cgc gcg gcg tgg atc gaa gcg ctg cgc caa tcg 1920

Ala Ser Met Pro Asp Arg Ala Ala Trp Ile Glu Ala Leu Arg Gln Ser

605 610 615

gcg tat ccg ccc agc gga gcc aat ttc ggc atg gcg aaa gac gcg gcc 1968

Ala Tyr Pro Pro Ser Gly Ala Asn Phe Gly Met Ala Lys Asp Ala Ala

620 625 630

ttg gcg cgc tcg gtc ggc gcg atc gcg ggc aac ggg gtg gcg ccg tca 2016

Leu Ala Arg Ser Val Gly Ala Ile Ala Gly Asn Gly Val Ala Pro Ser

635 640 645 650

tgg ccg gtc aag agc gag acg ggt gaa ctc act tgg ggt ctc ggc ggc 2064

Trp Pro Val Lys Ser Glu Thr Gly Glu Leu Thr Trp Gly Leu Gly Gly

655 660 665

aag acc gtg gtg atc gat gcg cct cgc agc aag ggt ctg atc ggc ccg 2112

Lys Thr Val Val Ile Asp Ala Pro Arg Ser Lys Gly Leu Ile Gly Pro

670 675 680

cgg ctc ggc cat gaa tat gac gcg cat ggc gtc ggg ctg gaa ctg acc 2160

Arg Leu Gly His Glu Tyr Asp Ala His Gly Val Gly Leu Glu Leu Thr

685 690 695

gaa gcg caa ggc gat tgg ggc gtg gtg acc gcg acc gtc gtt cag ggt 2208

Glu Ala Gln Gly Asp Trp Gly Val Val Thr Ala Thr Val Val Gln Gly

700 705 710

acg gat ttt tcg tcg ccg ggg cgc att ctg gtg acg acg ctc ggc cgc 2256

Thr Asp Phe Ser Ser Pro Gly Arg Ile Leu Val Thr Thr Leu Gly Arg

715 720 725 730

gaa gag aat acc gga cag caa tgg acc gac gcg acg cgg act tcg gtt 2304

Glu Glu Asn Thr Gly Gln Gln Trp Thr Asp Ala Thr Arg Thr Ser Val

735 740 745

ggc cgc aat tgg ggc gca gcg ccg gtg ctg gtc gag ggt ttg ggc gcg 2352

Gly Arg Asn Trp Gly Ala Ala Pro Val Leu Val Glu Gly Leu Gly Ala

750 755 760

cgc atc acc ctg ccc gtt ccg gca gcg cgg gtg tcg gcg ttt gcg ctc 2400

Arg Ile Thr Leu Pro Val Pro Ala Ala Arg Val Ser Ala Phe Ala Leu

765 770 775

gat gcg ctg ggc aat cgt acc acg gca ctg ccg gtg agc ggt tcg agt 2448

Asp Ala Leu Gly Asn Arg Thr Thr Ala Leu Pro Val Ser Gly Ser Ser

780 785 790

cgc gcc aca atc gaa ctc ggc gcg cgg tat cag acg ctg tgg tat gag 2496

Arg Ala Thr Ile Glu Leu Gly Ala Arg Tyr Gln Thr Leu Trp Tyr Glu

795 800 805 810

gtg gtg gtg aag tag 2511

Val Val Val Lys

<210> 2

<211> 836

<212> PRT

<213> 土壤宏基因组

<400> 2

Met Leu Arg Ala Ala Leu Ala Ala Met Val Met Ala Gly Ala Leu Thr

-20 -15 -10

Ala Gly Ser Ala Ala Gly Glu Met Phe Pro Phe Thr Met Pro Trp Asn

-5 -1 1 5 10

Asp Ala Gly Thr Gly Asn Ile Thr Asp Leu Ser Ala Trp Asn Asp Lys

15 20 25

Pro Ala Gly Ala Ser Gly Phe Val Thr Val Ala Gly Gly His Leu Val

30 35 40

Ala Gly Gly Lys Arg Leu Gln Leu Leu Gly Val Asn Val Thr Phe Gly

45 50 55

Ser Asn Ala Pro Glu His Ala Asp Ala Asp Ile Val Ala Arg Arg Met

60 65 70

Ala Arg Phe Gly Ile Asn Ile Val Arg Leu His His Met Asp Thr Tyr

75 80 85 90

Glu Ala Pro Phe Gly Ile Leu Glu Lys Asp Arg Val Thr Leu Asn Pro

95 100 105

Asp Tyr Leu Asp Lys Leu Asp Tyr Phe Val Ala Ala Leu Lys Arg Gln

110 115 120

Gly Ile Tyr Val Asp Ile Asn Leu His Val Gly Arg Ala Tyr Pro Gly

125 130 135

Phe Ala Ser Trp Pro Gly Gly Asp Ser Tyr Phe Lys Gly Val Asp His

140 145 150

Phe Glu Pro Gln Met Ile Arg Leu Gln Lys Asp Phe Ala Arg Asp Leu

155 160 165 170

Leu His His Arg Asn Pro Tyr Thr Gly Thr Arg Tyr Ala Asp Glu Pro

175 180 185

Ala Val Ala Ile Val Glu Ile Asn Asn Glu Asn Gly Leu Ile Arg Glu

190 195 200

Trp Gly Ala Gly Ala Leu Asp Ala Met Thr Glu Pro Leu Arg Gly Glu

205 210 215

Met Thr Arg Gln Trp Asn Val Trp Leu Lys Gln Arg Tyr Gly Ser Asp

220 225 230

Ala Ala Leu Arg Gln Ala Trp Gly Ala Arg Ser Glu Pro Leu Gly Asn

235 240 245 250

Glu Met Phe Thr Thr Gly Trp Gln Leu Gln Thr Leu Gly Gly Ala His

255 260 265

Ala Thr Leu Thr Pro Thr Ala Val Gly Leu Ala Leu Thr Met Thr Gly

270 275 280

Lys Gly Gln Glu Ser Trp His Thr Gln Met His Gln Gly Gly Leu Asn

285 290 295

Phe Thr Ala Glu Arg Pro Tyr Thr Leu Thr Leu Arg Leu Arg Ala Asp

300 305 310

His Pro Met Lys Val Ala Val Gln Ala Met Gln Thr His Glu Pro Trp

315 320 325 330

Lys Trp Leu Leu Ser Asp Thr Ile Ser Val Gly Thr Glu Trp Lys Thr

335 340 345

Val His Phe Thr Phe Val Pro Ala Phe Gly Glu Thr Gly Ala Arg Leu

350 355 360

Thr Leu Gly Gly Leu Gly Phe Glu Thr Gly Thr Leu Glu Ile Ala Glu

365 370 375

Ala Ser Leu Arg Pro Gly Gly Thr Ser Gly Leu Lys Pro Gly Glu Asn

380 385 390

Leu Asp Arg Gly Ser Val Ala Ile Ser Glu Tyr Ser Ser Arg Phe Ser

395 400 405 410

Arg Thr Pro Ala Ala Gln Arg Asp Trp Leu Asn Phe Leu Trp Asp Thr

415 420 425

Glu Thr His Tyr Trp Ala Glu Met Gln Arg Phe Leu Lys Ala Asp Leu

430 435 440

Gly Val Lys Ser Leu Leu Val Gly Thr Gln Thr Val Tyr Ser Pro Ala

445 450 455

Pro Ile Gln Ser Gly Leu Asp Val Val Asp Asp His Ala Tyr Trp Gln

460 465 470

His Pro His Phe Pro Gly Arg Ala Trp Asp Pro Gly Asn Trp Arg Ile

475 480 485 490

Asn Asn Leu Pro Met Ala Gly Leu Glu Gly Gly Gly Thr Ile Ala Asp

495 500 505

Leu Ala Leu Arg Arg Val Pro Gly Lys Pro Phe Ile Val Thr Glu Tyr

510 515 520

Asn Ala Pro Ala Pro Asn Asp Tyr Gln Gly Glu Ala Met Pro Leu Val

525 530 535

Ala Ala Tyr Gly Ala Leu Gln Asp Trp Asp Gly Ile Phe Leu Phe Asp

540 545 550

Tyr Gly Gly Trp Asp Asn Asn Trp His Thr Asp His Ile Asp Ser Phe

555 560 565 570

Phe Asp Ser Arg Ser Asn Pro Val Lys Leu Ala Ser Leu Ile Ala Thr

575 580 585

Ala Ala Met Leu Arg Arg Gly Asp Val Ala Ala Ala Ala Pro Thr Arg

590 595 600

Ala Ser Met Pro Asp Arg Ala Ala Trp Ile Glu Ala Leu Arg Gln Ser

605 610 615

Ala Tyr Pro Pro Ser Gly Ala Asn Phe Gly Met Ala Lys Asp Ala Ala

620 625 630

Leu Ala Arg Ser Val Gly Ala Ile Ala Gly Asn Gly Val Ala Pro Ser

635 640 645 650

Trp Pro Val Lys Ser Glu Thr Gly Glu Leu Thr Trp Gly Leu Gly Gly

655 660 665

Lys Thr Val Val Ile Asp Ala Pro Arg Ser Lys Gly Leu Ile Gly Pro

670 675 680

Arg Leu Gly His Glu Tyr Asp Ala His Gly Val Gly Leu Glu Leu Thr

685 690 695

Glu Ala Gln Gly Asp Trp Gly Val Val Thr Ala Thr Val Val Gln Gly

700 705 710

Thr Asp Phe Ser Ser Pro Gly Arg Ile Leu Val Thr Thr Leu Gly Arg

715 720 725 730

Glu Glu Asn Thr Gly Gln Gln Trp Thr Asp Ala Thr Arg Thr Ser Val

735 740 745

Gly Arg Asn Trp Gly Ala Ala Pro Val Leu Val Glu Gly Leu Gly Ala

750 755 760

Arg Ile Thr Leu Pro Val Pro Ala Ala Arg Val Ser Ala Phe Ala Leu

765 770 775

Asp Ala Leu Gly Asn Arg Thr Thr Ala Leu Pro Val Ser Gly Ser Ser

780 785 790

Arg Ala Thr Ile Glu Leu Gly Ala Arg Tyr Gln Thr Leu Trp Tyr Glu

795 800 805 810

Val Val Val Lys

<210> 3

<211> 2586

<212> DNA

<213> 废水宏基因组

<220>

<221> CDS

<222> (1)..(2583)

<220>

<221> 信号肽

<222> (1)..(75)

<220>

<221> 成熟肽

<222> (76)..(2583)

<400> 3

ttg cgt tta aat ttc gcc tcc ttt cag ttg tta gct tgg tta atg ttt 48

Leu Arg Leu Asn Phe Ala Ser Phe Gln Leu Leu Ala Trp Leu Met Phe

-25 -20 -15 -10

tcc gtc tca gtg gat gca ttg tcc gct gac agt gat ttt ttt cct tac 96

Ser Val Ser Val Asp Ala Leu Ser Ala Asp Ser Asp Phe Phe Pro Tyr

-5 -1 1 5

aaa gtc cga tgg gac gaa gct tct gtt agt gca gtt aat ctg cgc gac 144

Lys Val Arg Trp Asp Glu Ala Ser Val Ser Ala Val Asn Leu Arg Asp

10 15 20

tgg aat cat aga ccc gct ggt agg ctc ggt tgg gtt acg gct cgt gat 192

Trp Asn His Arg Pro Ala Gly Arg Leu Gly Trp Val Thr Ala Arg Asp

25 30 35

ggg cat ctt tat gtt gga aag tct agg cta cgt ttc ttt ggc gtt aat 240

Gly His Leu Tyr Val Gly Lys Ser Arg Leu Arg Phe Phe Gly Val Asn

40 45 50 55

gtt gtc ttt cgg gga gca atg cct gag cgt gat gag gcg gag aaa att 288

Val Val Phe Arg Gly Ala Met Pro Glu Arg Asp Glu Ala Glu Lys Ile

60 65 70

gca gca cgt ttg gct aag tta ggc ttc aat gtg gtc cga ttt cat cat 336

Ala Ala Arg Leu Ala Lys Leu Gly Phe Asn Val Val Arg Phe His His

75 80 85

atg gat acg ctt gtt agt ccc aat ggt ctg ctc aag gat gat ctg cgt 384

Met Asp Thr Leu Val Ser Pro Asn Gly Leu Leu Lys Asp Asp Leu Arg

90 95 100

act ttt gat cca gct cag cta gat aaa ctg gat tac ttt att gca gct 432

Thr Phe Asp Pro Ala Gln Leu Asp Lys Leu Asp Tyr Phe Ile Ala Ala

105 110 115

ttg aag cga gaa ggt atc tac agc gat ctt aat ctt cat gta ggg cgt 480

Leu Lys Arg Glu Gly Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg

120 125 130 135

ctt tat cct ggt ttt gat cgt tgg cgt gat gcc gct gga aat cag cag 528

Leu Tyr Pro Gly Phe Asp Arg Trp Arg Asp Ala Ala Gly Asn Gln Gln

140 145 150

cct gag gct tgg aaa ggg gtt gat gtt ttc tat cct cct atg gtc gat 576

Pro Glu Ala Trp Lys Gly Val Asp Val Phe Tyr Pro Pro Met Val Asp

155 160 165

cag cag aaa gag tac gca aaa gag ttg ctg act cat gta aat cct tat 624

Gln Gln Lys Glu Tyr Ala Lys Glu Leu Leu Thr His Val Asn Pro Tyr

170 175 180

tta ggt aag cga tat tta gat gag cct gct gtc gcc att gtc gag ctc 672

Leu Gly Lys Arg Tyr Leu Asp Glu Pro Ala Val Ala Ile Val Glu Leu

185 190 195

aat aat gag aat ggg ctg atc tat agt tgg agg cgc ggc gat ctt gac 720

Asn Asn Glu Asn Gly Leu Ile Tyr Ser Trp Arg Arg Gly Asp Leu Asp

200 205 210 215

ctg atg agt gag ccg tat cgt gga gag ttg caa cgt cta tgg aac tct 768

Leu Met Ser Glu Pro Tyr Arg Gly Glu Leu Gln Arg Leu Trp Asn Ser

220 225 230

tgg ctt gtt acc cac tat aag agt gac gct ggc ttg cgt ttg gcg tgg 816

Trp Leu Val Thr His Tyr Lys Ser Asp Ala Gly Leu Arg Leu Ala Trp

235 240 245

gag aca aaa gaa gta cct atg ggt atg gag atg ctg gtc agt ccc gga 864

Glu Thr Lys Glu Val Pro Met Gly Met Glu Met Leu Val Ser Pro Gly

250 255 260

gca cct acc ggg ctt gtt cgt gag tgg acg ctg cag tct gtg ggg cag 912

Ala Pro Thr Gly Leu Val Arg Glu Trp Thr Leu Gln Ser Val Gly Gln

265 270 275

gcg aga gcg ata ctt gat ggg tat gag gat ggg atc cag cat ctt aac 960

Ala Arg Ala Ile Leu Asp Gly Tyr Glu Asp Gly Ile Gln His Leu Asn

280 285 290 295

gtt ctt cag cca ggt act gag cgt tgg cac gtt cag gtt cat caa aaa 1008

Val Leu Gln Pro Gly Thr Glu Arg Trp His Val Gln Val His Gln Lys

300 305 310

tct ttg tcg ttt aag gct ggc gaa ctc tac acc cta cat ttg cga ttg 1056

Ser Leu Ser Phe Lys Ala Gly Glu Leu Tyr Thr Leu His Leu Arg Leu

315 320 325

cgc gct aat aag cct cgg tct gta cgt ctc atg gct gtg caa aac cat 1104

Arg Ala Asn Lys Pro Arg Ser Val Arg Leu Met Ala Val Gln Asn His

330 335 340

gct ccg ttt cgg tct ttg tgg gag cag agg ctc aag ctt gat tct gag 1152

Ala Pro Phe Arg Ser Leu Trp Glu Gln Arg Leu Lys Leu Asp Ser Glu

345 350 355

tgg cag gag ttc gta ttt gtt ttt agt tcc cct atc gat gaa gcg ctt 1200

Trp Gln Glu Phe Val Phe Val Phe Ser Ser Pro Ile Asp Glu Ala Leu

360 365 370 375

gca cgg cta act ttg ggt gat ctg gga gct gac tca gga gag att tgg 1248

Ala Arg Leu Thr Leu Gly Asp Leu Gly Ala Asp Ser Gly Glu Ile Trp

380 385 390

att gca ggc agt agt tta aga gcg ggc ggt gat ttt aag ttt ggc gaa 1296

Ile Ala Gly Ser Ser Leu Arg Ala Gly Gly Asp Phe Lys Phe Gly Glu

395 400 405

agc gac tcg tta gtg aag cgc aat gtt ccg att ttt act agc agt gac 1344

Ser Asp Ser Leu Val Lys Arg Asn Val Pro Ile Phe Thr Ser Ser Asp

410 415 420

ttt gga agt cgt tcg ttg cgc gct cag aga gac tgg ctg aac ttt ctg 1392

Phe Gly Ser Arg Ser Leu Arg Ala Gln Arg Asp Trp Leu Asn Phe Leu

425 430 435

tgg gac gtt gag gcg caa tat tgg tcg gaa atg cag ggt tat tta aaa 1440

Trp Asp Val Glu Ala Gln Tyr Trp Ser Glu Met Gln Gly Tyr Leu Lys

440 445 450 455

aat aag ctg ggt gta aag tct ttg gtc att ggg acg caa cta aat cat 1488

Asn Lys Leu Gly Val Lys Ser Leu Val Ile Gly Thr Gln Leu Asn His

460 465 470

agt ccc tcg ctg att cag aga aat atg gat gtg ctg gat gcc cat gct 1536

Ser Pro Ser Leu Ile Gln Arg Asn Met Asp Val Leu Asp Ala His Ala

475 480 485

tat tgg gat cat ccg cgt ttt ccg gat ggt tta tgg agc cct atc aat 1584

Tyr Trp Asp His Pro Arg Phe Pro Asp Gly Leu Trp Ser Pro Ile Asn

490 495 500

tgg ctc att gat aat aag gct atg gcc ggt gtt gat ggg gga ggg gct 1632

Trp Leu Ile Asp Asn Lys Ala Met Ala Gly Val Asp Gly Gly Gly Ala

505 510 515

att tcc cgc ctc gca ttg atg cgg ctg ccg gga aag cca ttt gtt gtt 1680

Ile Ser Arg Leu Ala Leu Met Arg Leu Pro Gly Lys Pro Phe Val Val

520 525 530 535

acg gaa tat aat cat cct gca cct aat gag ttt gca gct gag act ttt 1728

Thr Glu Tyr Asn His Pro Ala Pro Asn Glu Phe Ala Ala Glu Thr Phe

540 545 550

ccg ctt gtt gct gca tac gcg gcg atg caa gac tgg gat ggt gtt ttt 1776

Pro Leu Val Ala Ala Tyr Ala Ala Met Gln Asp Trp Asp Gly Val Phe

555 560 565

cta ttc agc tat ggg act cat agc aga agt tgg aaa agg gat tat gtt 1824

Leu Phe Ser Tyr Gly Thr His Ser Arg Ser Trp Lys Arg Asp Tyr Val

570 575 580

gat aat ttt ttc gac ata aat gct aat cca aat aaa ttt acg agt act 1872

Asp Asn Phe Phe Asp Ile Asn Ala Asn Pro Asn Lys Phe Thr Ser Thr

585 590 595

ttg gcg gcg gcg gcg ctt ttt cgc cgt ggt gac gtt tct tcc caa cga 1920

Leu Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ser Ser Gln Arg

600 605 610 615

ggt gct ttt tcc acc gtt cta cca agt cga tcc gca ttt ata gat gct 1968

Gly Ala Phe Ser Thr Val Leu Pro Ser Arg Ser Ala Phe Ile Asp Ala

620 625 630

ctg cgc cag ata aat aaa aac tat ctt ccg tct ggg ggg gat ttt ggc 2016

Leu Arg Gln Ile Asn Lys Asn Tyr Leu Pro Ser Gly Gly Asp Phe Gly

635 640 645

gtt agc agt aat tct gcg atg cgc gag cct gtt gct ttg act ggg cct 2064

Val Ser Ser Asn Ser Ala Met Arg Glu Pro Val Ala Leu Thr Gly Pro

650 655 660

gtt cgt gtt gat tct ctt ctg cca ata aag agc ctg aca ggg cag ctt 2112

Val Arg Val Asp Ser Leu Leu Pro Ile Lys Ser Leu Thr Gly Gln Leu

665 670 675

gtc tgg ggt gtt gat aaa agc cca aca gta agt ata aat acg cct ttg 2160

Val Trp Gly Val Asp Lys Ser Pro Thr Val Ser Ile Asn Thr Pro Leu

680 685 690 695

agt aaa ggc ttg att ggt gcc agt ctt gct gaa cca ttt gat gca tct 2208

Ser Lys Gly Leu Ile Gly Ala Ser Leu Ala Glu Pro Phe Asp Ala Ser

700 705 710

gga gta cat ttg caa ctg ttg ggt tca gat act ggg agt ggg gtt gtt 2256

Gly Val His Leu Gln Leu Leu Gly Ser Asp Thr Gly Ser Gly Val Val

715 720 725

ttt ctt acg ctt ata gat gga tca agt ttt tct ggc ccc gga aga tta 2304

Phe Leu Thr Leu Ile Asp Gly Ser Ser Phe Ser Gly Pro Gly Arg Leu

730 735 740

tta att act gcg ctt ggt aac agt aaa aat acc aat caa gtc tgg gtg 2352

Leu Ile Thr Ala Leu Gly Asn Ser Lys Asn Thr Asn Gln Val Trp Val

745 750 755

gat aag acg cgt gca agc ctt ggg ggg aag tgg ggg caa gcc cct gtt 2400

Asp Lys Thr Arg Ala Ser Leu Gly Gly Lys Trp Gly Gln Ala Pro Val

760 765 770 775

ctt gtc gaa ggt gtt cgt agt cgt att act ttg cct atc tca agc tct 2448

Leu Val Glu Gly Val Arg Ser Arg Ile Thr Leu Pro Ile Ser Ser Ser

780 785 790

caa gtt cgt gct tgg gct tta gat gag gag ggc cgc cgc aag gag att 2496

Gln Val Arg Ala Trp Ala Leu Asp Glu Glu Gly Arg Arg Lys Glu Ile

795 800 805

gtt gtg gtt cgc gga aat gaa aat gcg gta att gaa acg gga cct aaa 2544

Val Val Val Arg Gly Asn Glu Asn Ala Val Ile Glu Thr Gly Pro Lys

810 815 820

tat aag agt ttg tgg tac gag gtg gaa gtt ctt gca aat tga 2586

Tyr Lys Ser Leu Trp Tyr Glu Val Glu Val Leu Ala Asn

825 830 835

<210> 4

<211> 861

<212> PRT

<213> 废水宏基因组

<400> 4

Leu Arg Leu Asn Phe Ala Ser Phe Gln Leu Leu Ala Trp Leu Met Phe

-25 -20 -15 -10

Ser Val Ser Val Asp Ala Leu Ser Ala Asp Ser Asp Phe Phe Pro Tyr

-5 -1 1 5

Lys Val Arg Trp Asp Glu Ala Ser Val Ser Ala Val Asn Leu Arg Asp

10 15 20

Trp Asn His Arg Pro Ala Gly Arg Leu Gly Trp Val Thr Ala Arg Asp

25 30 35

Gly His Leu Tyr Val Gly Lys Ser Arg Leu Arg Phe Phe Gly Val Asn

40 45 50 55

Val Val Phe Arg Gly Ala Met Pro Glu Arg Asp Glu Ala Glu Lys Ile

60 65 70

Ala Ala Arg Leu Ala Lys Leu Gly Phe Asn Val Val Arg Phe His His

75 80 85

Met Asp Thr Leu Val Ser Pro Asn Gly Leu Leu Lys Asp Asp Leu Arg

90 95 100

Thr Phe Asp Pro Ala Gln Leu Asp Lys Leu Asp Tyr Phe Ile Ala Ala

105 110 115

Leu Lys Arg Glu Gly Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg

120 125 130 135

Leu Tyr Pro Gly Phe Asp Arg Trp Arg Asp Ala Ala Gly Asn Gln Gln

140 145 150

Pro Glu Ala Trp Lys Gly Val Asp Val Phe Tyr Pro Pro Met Val Asp

155 160 165

Gln Gln Lys Glu Tyr Ala Lys Glu Leu Leu Thr His Val Asn Pro Tyr

170 175 180

Leu Gly Lys Arg Tyr Leu Asp Glu Pro Ala Val Ala Ile Val Glu Leu

185 190 195

Asn Asn Glu Asn Gly Leu Ile Tyr Ser Trp Arg Arg Gly Asp Leu Asp

200 205 210 215

Leu Met Ser Glu Pro Tyr Arg Gly Glu Leu Gln Arg Leu Trp Asn Ser

220 225 230

Trp Leu Val Thr His Tyr Lys Ser Asp Ala Gly Leu Arg Leu Ala Trp

235 240 245

Glu Thr Lys Glu Val Pro Met Gly Met Glu Met Leu Val Ser Pro Gly

250 255 260

Ala Pro Thr Gly Leu Val Arg Glu Trp Thr Leu Gln Ser Val Gly Gln

265 270 275

Ala Arg Ala Ile Leu Asp Gly Tyr Glu Asp Gly Ile Gln His Leu Asn

280 285 290 295

Val Leu Gln Pro Gly Thr Glu Arg Trp His Val Gln Val His Gln Lys

300 305 310

Ser Leu Ser Phe Lys Ala Gly Glu Leu Tyr Thr Leu His Leu Arg Leu

315 320 325

Arg Ala Asn Lys Pro Arg Ser Val Arg Leu Met Ala Val Gln Asn His

330 335 340

Ala Pro Phe Arg Ser Leu Trp Glu Gln Arg Leu Lys Leu Asp Ser Glu

345 350 355

Trp Gln Glu Phe Val Phe Val Phe Ser Ser Pro Ile Asp Glu Ala Leu

360 365 370 375

Ala Arg Leu Thr Leu Gly Asp Leu Gly Ala Asp Ser Gly Glu Ile Trp

380 385 390

Ile Ala Gly Ser Ser Leu Arg Ala Gly Gly Asp Phe Lys Phe Gly Glu

395 400 405

Ser Asp Ser Leu Val Lys Arg Asn Val Pro Ile Phe Thr Ser Ser Asp

410 415 420

Phe Gly Ser Arg Ser Leu Arg Ala Gln Arg Asp Trp Leu Asn Phe Leu

425 430 435

Trp Asp Val Glu Ala Gln Tyr Trp Ser Glu Met Gln Gly Tyr Leu Lys

440 445 450 455

Asn Lys Leu Gly Val Lys Ser Leu Val Ile Gly Thr Gln Leu Asn His

460 465 470

Ser Pro Ser Leu Ile Gln Arg Asn Met Asp Val Leu Asp Ala His Ala

475 480 485

Tyr Trp Asp His Pro Arg Phe Pro Asp Gly Leu Trp Ser Pro Ile Asn

490 495 500

Trp Leu Ile Asp Asn Lys Ala Met Ala Gly Val Asp Gly Gly Gly Ala

505 510 515

Ile Ser Arg Leu Ala Leu Met Arg Leu Pro Gly Lys Pro Phe Val Val

520 525 530 535

Thr Glu Tyr Asn His Pro Ala Pro Asn Glu Phe Ala Ala Glu Thr Phe

540 545 550

Pro Leu Val Ala Ala Tyr Ala Ala Met Gln Asp Trp Asp Gly Val Phe

555 560 565

Leu Phe Ser Tyr Gly Thr His Ser Arg Ser Trp Lys Arg Asp Tyr Val

570 575 580

Asp Asn Phe Phe Asp Ile Asn Ala Asn Pro Asn Lys Phe Thr Ser Thr

585 590 595

Leu Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ser Ser Gln Arg

600 605 610 615

Gly Ala Phe Ser Thr Val Leu Pro Ser Arg Ser Ala Phe Ile Asp Ala

620 625 630

Leu Arg Gln Ile Asn Lys Asn Tyr Leu Pro Ser Gly Gly Asp Phe Gly

635 640 645

Val Ser Ser Asn Ser Ala Met Arg Glu Pro Val Ala Leu Thr Gly Pro

650 655 660

Val Arg Val Asp Ser Leu Leu Pro Ile Lys Ser Leu Thr Gly Gln Leu

665 670 675

Val Trp Gly Val Asp Lys Ser Pro Thr Val Ser Ile Asn Thr Pro Leu

680 685 690 695

Ser Lys Gly Leu Ile Gly Ala Ser Leu Ala Glu Pro Phe Asp Ala Ser

700 705 710

Gly Val His Leu Gln Leu Leu Gly Ser Asp Thr Gly Ser Gly Val Val

715 720 725

Phe Leu Thr Leu Ile Asp Gly Ser Ser Phe Ser Gly Pro Gly Arg Leu

730 735 740

Leu Ile Thr Ala Leu Gly Asn Ser Lys Asn Thr Asn Gln Val Trp Val

745 750 755

Asp Lys Thr Arg Ala Ser Leu Gly Gly Lys Trp Gly Gln Ala Pro Val

760 765 770 775

Leu Val Glu Gly Val Arg Ser Arg Ile Thr Leu Pro Ile Ser Ser Ser

780 785 790

Gln Val Arg Ala Trp Ala Leu Asp Glu Glu Gly Arg Arg Lys Glu Ile

795 800 805

Val Val Val Arg Gly Asn Glu Asn Ala Val Ile Glu Thr Gly Pro Lys

810 815 820

Tyr Lys Ser Leu Trp Tyr Glu Val Glu Val Leu Ala Asn

825 830 835

<210> 5

<211> 2916

<212> DNA

<213> Lewinella cohaerens

<220>

<221> CDS

<222> (1)..(2913)

<220>

<221> 信号肽

<222> (1)..(66)

<220>

<221> 成熟肽

<222> (67)..(2913)

<400> 5

atg acc att cat ttc cgc ata cag cta tcc cta ttt gcc ctt gta ttt 48

Met Thr Ile His Phe Arg Ile Gln Leu Ser Leu Phe Ala Leu Val Phe

-20 -15 -10

agc tcg ctc ctc ttt ggt caa aac ttc tcg aat ggc ttt cct ttt gca 96

Ser Ser Leu Leu Phe Gly Gln Asn Phe Ser Asn Gly Phe Pro Phe Ala

-5 -1 1 5 10

ttg cct gtc gat gac aat acc tct tct gta ttt cta ccg gca ttc cct 144

Leu Pro Val Asp Asp Asn Thr Ser Ser Val Phe Leu Pro Ala Phe Pro

15 20 25

gcc agc cct ata aca gaa gcg aaa aga gta gta cct gag ggt agg caa 192

Ala Ser Pro Ile Thr Glu Ala Lys Arg Val Val Pro Glu Gly Arg Gln

30 35 40

ttc gtg cgc caa ggt gaa gcc atc cgt ttt tgg ggt gtc aat atc acg 240

Phe Val Arg Gln Gly Glu Ala Ile Arg Phe Trp Gly Val Asn Ile Thr

45 50 55

tct tca gct tgt ttc cct acc cat acc gag gca gaa acc atc gct cga 288

Ser Ser Ala Cys Phe Pro Thr His Thr Glu Ala Glu Thr Ile Ala Arg

60 65 70

cgc ctt aga aag atg ggg atc aac ctt gtc cgt ttt cat cac ctt gac 336

Arg Leu Arg Lys Met Gly Ile Asn Leu Val Arg Phe His His Leu Asp

75 80 85 90

aac ccc gca tgg gca ggt aat gag ggt aca atc ttc ctc aat agc caa 384

Asn Pro Ala Trp Ala Gly Asn Glu Gly Thr Ile Phe Leu Asn Ser Gln

95 100 105

gac aat acc ctc caa att gac cct gta agc atg gat cgc ctc aac tat 432

Asp Asn Thr Leu Gln Ile Asp Pro Val Ser Met Asp Arg Leu Asn Tyr

110 115 120

ttc att tct cgc ctc aaa caa gaa ggc gtc tat gtc aat tta aac ctc 480

Phe Ile Ser Arg Leu Lys Gln Glu Gly Val Tyr Val Asn Leu Asn Leu

125 130 135

cat gtt acg cgt act ttt cgg tta aac gac ggt gtc ccc ctc gct gat 528

His Val Thr Arg Thr Phe Arg Leu Asn Asp Gly Val Pro Leu Ala Asp

140 145 150

tca atc gct gac ttt ggt aaa gta gtc acg cta tac gac cct cag cta 576

Ser Ile Ala Asp Phe Gly Lys Val Val Thr Leu Tyr Asp Pro Gln Leu

155 160 165 170

caa gct cta caa aaa gaa tat gct aat gaa tta ctg gcc caa gtc aac 624

Gln Ala Leu Gln Lys Glu Tyr Ala Asn Glu Leu Leu Ala Gln Val Asn

175 180 185

ccc tac act gga ata aca ctt gca cta gat cct gtc gta gta atg gta 672

Pro Tyr Thr Gly Ile Thr Leu Ala Leu Asp Pro Val Val Val Met Val

190 195 200

gag atg aac aac gaa aat agc atc tac ggc tgg tgg aaa agc aac gcc 720

Glu Met Asn Asn Glu Asn Ser Ile Tyr Gly Trp Trp Lys Ser Asn Ala

205 210 215

ttg cgc cct ttt aac caa gga ggc cga ctg acg gtc tat cat cat gaa 768

Leu Arg Pro Phe Asn Gln Gly Gly Arg Leu Thr Val Tyr His His Glu

220 225 230

atg ctc aat gac cgt tgg cat acc ttc tta gga caa gaa tat gcc gat 816

Met Leu Asn Asp Arg Trp His Thr Phe Leu Gly Gln Glu Tyr Ala Asp

235 240 245 250

gat gaa agc cta gca gcc agt tgg aac aac gga acc atc ccc gct ggc 864

Asp Glu Ser Leu Ala Ala Ser Trp Asn Asn Gly Thr Ile Pro Ala Gly

255 260 265

acc gag gaa aac ctc acc aac ccc gac ctc gaa gag gga cta tta caa 912

Thr Glu Glu Asn Leu Thr Asn Pro Asp Leu Glu Glu Gly Leu Leu Gln

270 275 280

gcc cct tgg tta ttg gaa acc cat gac att gca caa gct aat att act 960

Ala Pro Trp Leu Leu Glu Thr His Asp Ile Ala Gln Ala Asn Ile Thr

285 290 295

ctc gac aat acc aat cct caa tca ggt aat caa tgt gtt gct tta cag 1008

Leu Asp Asn Thr Asn Pro Gln Ser Gly Asn Gln Cys Val Ala Leu Gln

300 305 310

gtt aca cag gcg acg gga aca gaa tgg cat ata cag ttc aag caa aac 1056

Val Thr Gln Ala Thr Gly Thr Glu Trp His Ile Gln Phe Lys Gln Asn

315 320 325 330

gac ctc aac ttc caa cgc gac tct acc tat gaa ttg cgg ttt tgg gca 1104

Asp Leu Asn Phe Gln Arg Asp Ser Thr Tyr Glu Leu Arg Phe Trp Ala

335 340 345

cgg act gac acc gaa cgg gat ttt tcc att tcc ttc ctt cgt gat gat 1152

Arg Thr Asp Thr Glu Arg Asp Phe Ser Ile Ser Phe Leu Arg Asp Asp

350 355 360

gcc ccc tat acc tgg tac agt ggt cga aca ttt acg gcc aac act cag 1200

Ala Pro Tyr Thr Trp Tyr Ser Gly Arg Thr Phe Thr Ala Asn Thr Gln

365 370 375

tgg cag gaa ttc cgc tta ctg ttt aca gct tct gaa agt act acc gct 1248

Trp Gln Glu Phe Arg Leu Leu Phe Thr Ala Ser Glu Ser Thr Thr Ala

380 385 390

ggc cga ctc agt atc agc cca ctt ggt ggc aat ggc acc tat tgg ttt 1296

Gly Arg Leu Ser Ile Ser Pro Leu Gly Gly Asn Gly Thr Tyr Trp Phe

395 400 405 410

gat aac ttc tca tta tct aat cca gcg gtg gat ggc ctg cta cca ggc 1344

Asp Asn Phe Ser Leu Ser Asn Pro Ala Val Asp Gly Leu Leu Pro Gly

415 420 425

gaa agc ctc aat acc gcc agc atc aaa cgt atc cct tgg agc caa cgc 1392

Glu Ser Leu Asn Thr Ala Ser Ile Lys Arg Ile Pro Trp Ser Gln Arg

430 435 440

cta agt tac acc cct gcc agg gta gct gac cta agc cgc ttt tac gta 1440

Leu Ser Tyr Thr Pro Ala Arg Val Ala Asp Leu Ser Arg Phe Tyr Val

445 450 455

gct ctt caa gcg gag cac ttc cgt gaa atg aaa gaa tac ctc acg gat 1488

Ala Leu Gln Ala Glu His Phe Arg Glu Met Lys Glu Tyr Leu Thr Asp

460 465 470

cag ttg ctt gtg agt gct gct att acc ggc acc aat gcg cta gtt ggt 1536

Gln Leu Leu Val Ser Ala Ala Ile Thr Gly Thr Asn Ala Leu Val Gly

475 480 485 490

cct gcc gat gtg gta cat caa ttg gat ctc gac tat ttg gat gat cat 1584

Pro Ala Asp Val Val His Gln Leu Asp Leu Asp Tyr Leu Asp Asp His

495 500 505

agc tac tgg gat cat cct cac ttt cct aat act gcc tgg gat agc tac 1632

Ser Tyr Trp Asp His Pro His Phe Pro Asn Thr Ala Trp Asp Ser Tyr

510 515 520

gac tgg ctc att aac aac caa ccg cag gtg cta gac cct aac ttt gaa 1680

Asp Trp Leu Ile Asn Asn Gln Pro Gln Val Leu Asp Pro Asn Phe Glu

525 530 535

gcc atc acc cat gct ttt tct gga ctg gca cgc acc gat caa cct ttc 1728

Ala Ile Thr His Ala Phe Ser Gly Leu Ala Arg Thr Asp Gln Pro Phe

540 545 550

aca ctt tcc gaa tac aac cac ggt gct cct aat cgc tac cgc gtt gag 1776

Thr Leu Ser Glu Tyr Asn His Gly Ala Pro Asn Arg Tyr Arg Val Glu

555 560 565 570

atg ccc cat agc ata ttg gcc tat gct gcc ttt cag ggg gca gat ggc 1824

Met Pro His Ser Ile Leu Ala Tyr Ala Ala Phe Gln Gly Ala Asp Gly

575 580 585

atc atg ttt tat act tac gcc gga gag cgc aat caa gac aac gat ctt 1872

Ile Met Phe Tyr Thr Tyr Ala Gly Glu Arg Asn Gln Asp Asn Asp Leu

590 595 600

gtt aat aat ttc ttt gac ttg cac cgt gac cat tcc ata atg gcc caa 1920

Val Asn Asn Phe Phe Asp Leu His Arg Asp His Ser Ile Met Ala Gln

605 610 615

ttt cca ggg gtc gcg atg gct tac cga cga ggg tac ctt cag gaa gca 1968

Phe Pro Gly Val Ala Met Ala Tyr Arg Arg Gly Tyr Leu Gln Glu Ala

620 625 630

caa caa ccc tta atg gcc aat tac aaa gaa gaa gat atc cat agg ttt 2016

Gln Gln Pro Leu Met Ala Asn Tyr Lys Glu Glu Asp Ile His Arg Phe

635 640 645 650

cct atc gta gac aat caa ggc cgc tgg ggg cgt tat aca cct tat gac 2064

Pro Ile Val Asp Asn Gln Gly Arg Trp Gly Arg Tyr Thr Pro Tyr Asp

655 660 665

aaa agg tta att ttg aca aca ggc gta cag acg ggt agt tac gac gct 2112

Lys Arg Leu Ile Leu Thr Thr Gly Val Gln Thr Gly Ser Tyr Asp Ala

670 675 680

cca caa acc agt aat ttt acg gag tgg cct tct cct cca gaa gag gta 2160

Pro Gln Thr Ser Asn Phe Thr Glu Trp Pro Ser Pro Pro Glu Glu Val

685 690 695

ttt aca aca ttc aat gga gaa aca acg ctg aac act act gaa ggg cta 2208

Phe Thr Thr Phe Asn Gly Glu Thr Thr Leu Asn Thr Thr Glu Gly Leu

700 705 710

tta acc acc aat acc gat aaa ttt tgt agt gtt aca ggt ttc ttt tct 2256

Leu Thr Thr Asn Thr Asp Lys Phe Cys Ser Val Thr Gly Phe Phe Ser

715 720 725 730

acc gcc aca gat atg aca ttg gat gcc ttg acc ata aat tct ggc aat 2304

Thr Ala Thr Asp Met Thr Leu Asp Ala Leu Thr Ile Asn Ser Gly Asn

735 740 745

gac ttt ggg act ttg caa tgg atc agt ctt gat gat caa cca cta cct 2352

Asp Phe Gly Thr Leu Gln Trp Ile Ser Leu Asp Asp Gln Pro Leu Pro

750 755 760

gaa gct aaa aaa tct tta atc acc tta act gct gcc cag caa aac aca 2400

Glu Ala Lys Lys Ser Leu Ile Thr Leu Thr Ala Ala Gln Gln Asn Thr

765 770 775

aac atg act tgg aat ggc acc aat acc att cac aac aat tgg ggt aac 2448

Asn Met Thr Trp Asn Gly Thr Asn Thr Ile His Asn Asn Trp Gly Asn

780 785 790

gca ccg acg gaa caa aaa cca cta cag gtg gca ata gag atg gca tta 2496

Ala Pro Thr Glu Gln Lys Pro Leu Gln Val Ala Ile Glu Met Ala Leu

795 800 805 810

aat gcc gat tat ata aaa ctt tac cct tta gat gtt tat gcc aca cct 2544

Asn Ala Asp Tyr Ile Lys Leu Tyr Pro Leu Asp Val Tyr Ala Thr Pro

815 820 825

acg gac tct atc cta gta tta cca aat agt caa ggc cat ttt cct att 2592

Thr Asp Ser Ile Leu Val Leu Pro Asn Ser Gln Gly His Phe Pro Ile

830 835 840

ctc tta gat caa tac caa tac gaa acc cta tgg ttt ggc att aat act 2640

Leu Leu Asp Gln Tyr Gln Tyr Glu Thr Leu Trp Phe Gly Ile Asn Thr

845 850 855

ttt att ggc cca gtc agc act ctt gaa agc gac cag cca act cca ttt 2688

Phe Ile Gly Pro Val Ser Thr Leu Glu Ser Asp Gln Pro Thr Pro Phe

860 865 870

cac ttc tac cct aat ccg gta tta agt gga caa cct gtg caa att aca 2736

His Phe Tyr Pro Asn Pro Val Leu Ser Gly Gln Pro Val Gln Ile Thr

875 880 885 890

gga cca gaa aaa agc act ata ctg ctt ttc aac atc tta ggg cag ttg 2784

Gly Pro Glu Lys Ser Thr Ile Leu Leu Phe Asn Ile Leu Gly Gln Leu

895 900 905

gtt aat caa caa gaa atc aat acc cct ttt tat cgc tta gat acc act 2832

Val Asn Gln Gln Glu Ile Asn Thr Pro Phe Tyr Arg Leu Asp Thr Thr

910 915 920

ggc tta aca gct ggc act tac caa tta gtg ttc cta aac gaa aat agg 2880

Gly Leu Thr Ala Gly Thr Tyr Gln Leu Val Phe Leu Asn Glu Asn Arg

925 930 935

caa cga cta aat aat acc cta ttg atc atc aaa taa 2916

Gln Arg Leu Asn Asn Thr Leu Leu Ile Ile Lys

940 945

<210> 6

<211> 971

<212> PRT

<213> Lewinella cohaerens

<400> 6

Met Thr Ile His Phe Arg Ile Gln Leu Ser Leu Phe Ala Leu Val Phe

-20 -15 -10

Ser Ser Leu Leu Phe Gly Gln Asn Phe Ser Asn Gly Phe Pro Phe Ala

-5 -1 1 5 10

Leu Pro Val Asp Asp Asn Thr Ser Ser Val Phe Leu Pro Ala Phe Pro

15 20 25

Ala Ser Pro Ile Thr Glu Ala Lys Arg Val Val Pro Glu Gly Arg Gln

30 35 40

Phe Val Arg Gln Gly Glu Ala Ile Arg Phe Trp Gly Val Asn Ile Thr

45 50 55

Ser Ser Ala Cys Phe Pro Thr His Thr Glu Ala Glu Thr Ile Ala Arg

60 65 70

Arg Leu Arg Lys Met Gly Ile Asn Leu Val Arg Phe His His Leu Asp

75 80 85 90

Asn Pro Ala Trp Ala Gly Asn Glu Gly Thr Ile Phe Leu Asn Ser Gln

95 100 105

Asp Asn Thr Leu Gln Ile Asp Pro Val Ser Met Asp Arg Leu Asn Tyr

110 115 120

Phe Ile Ser Arg Leu Lys Gln Glu Gly Val Tyr Val Asn Leu Asn Leu

125 130 135

His Val Thr Arg Thr Phe Arg Leu Asn Asp Gly Val Pro Leu Ala Asp

140 145 150

Ser Ile Ala Asp Phe Gly Lys Val Val Thr Leu Tyr Asp Pro Gln Leu

155 160 165 170

Gln Ala Leu Gln Lys Glu Tyr Ala Asn Glu Leu Leu Ala Gln Val Asn

175 180 185

Pro Tyr Thr Gly Ile Thr Leu Ala Leu Asp Pro Val Val Val Met Val

190 195 200

Glu Met Asn Asn Glu Asn Ser Ile Tyr Gly Trp Trp Lys Ser Asn Ala

205 210 215

Leu Arg Pro Phe Asn Gln Gly Gly Arg Leu Thr Val Tyr His His Glu

220 225 230

Met Leu Asn Asp Arg Trp His Thr Phe Leu Gly Gln Glu Tyr Ala Asp

235 240 245 250

Asp Glu Ser Leu Ala Ala Ser Trp Asn Asn Gly Thr Ile Pro Ala Gly

255 260 265

Thr Glu Glu Asn Leu Thr Asn Pro Asp Leu Glu Glu Gly Leu Leu Gln

270 275 280

Ala Pro Trp Leu Leu Glu Thr His Asp Ile Ala Gln Ala Asn Ile Thr

285 290 295

Leu Asp Asn Thr Asn Pro Gln Ser Gly Asn Gln Cys Val Ala Leu Gln

300 305 310

Val Thr Gln Ala Thr Gly Thr Glu Trp His Ile Gln Phe Lys Gln Asn

315 320 325 330

Asp Leu Asn Phe Gln Arg Asp Ser Thr Tyr Glu Leu Arg Phe Trp Ala

335 340 345

Arg Thr Asp Thr Glu Arg Asp Phe Ser Ile Ser Phe Leu Arg Asp Asp

350 355 360

Ala Pro Tyr Thr Trp Tyr Ser Gly Arg Thr Phe Thr Ala Asn Thr Gln

365 370 375

Trp Gln Glu Phe Arg Leu Leu Phe Thr Ala Ser Glu Ser Thr Thr Ala

380 385 390

Gly Arg Leu Ser Ile Ser Pro Leu Gly Gly Asn Gly Thr Tyr Trp Phe

395 400 405 410

Asp Asn Phe Ser Leu Ser Asn Pro Ala Val Asp Gly Leu Leu Pro Gly

415 420 425

Glu Ser Leu Asn Thr Ala Ser Ile Lys Arg Ile Pro Trp Ser Gln Arg

430 435 440

Leu Ser Tyr Thr Pro Ala Arg Val Ala Asp Leu Ser Arg Phe Tyr Val

445 450 455

Ala Leu Gln Ala Glu His Phe Arg Glu Met Lys Glu Tyr Leu Thr Asp

460 465 470

Gln Leu Leu Val Ser Ala Ala Ile Thr Gly Thr Asn Ala Leu Val Gly

475 480 485 490

Pro Ala Asp Val Val His Gln Leu Asp Leu Asp Tyr Leu Asp Asp His

495 500 505

Ser Tyr Trp Asp His Pro His Phe Pro Asn Thr Ala Trp Asp Ser Tyr

510 515 520

Asp Trp Leu Ile Asn Asn Gln Pro Gln Val Leu Asp Pro Asn Phe Glu

525 530 535

Ala Ile Thr His Ala Phe Ser Gly Leu Ala Arg Thr Asp Gln Pro Phe

540 545 550

Thr Leu Ser Glu Tyr Asn His Gly Ala Pro Asn Arg Tyr Arg Val Glu

555 560 565 570

Met Pro His Ser Ile Leu Ala Tyr Ala Ala Phe Gln Gly Ala Asp Gly

575 580 585

Ile Met Phe Tyr Thr Tyr Ala Gly Glu Arg Asn Gln Asp Asn Asp Leu

590 595 600

Val Asn Asn Phe Phe Asp Leu His Arg Asp His Ser Ile Met Ala Gln

605 610 615

Phe Pro Gly Val Ala Met Ala Tyr Arg Arg Gly Tyr Leu Gln Glu Ala

620 625 630

Gln Gln Pro Leu Met Ala Asn Tyr Lys Glu Glu Asp Ile His Arg Phe

635 640 645 650

Pro Ile Val Asp Asn Gln Gly Arg Trp Gly Arg Tyr Thr Pro Tyr Asp

655 660 665

Lys Arg Leu Ile Leu Thr Thr Gly Val Gln Thr Gly Ser Tyr Asp Ala

670 675 680

Pro Gln Thr Ser Asn Phe Thr Glu Trp Pro Ser Pro Pro Glu Glu Val

685 690 695

Phe Thr Thr Phe Asn Gly Glu Thr Thr Leu Asn Thr Thr Glu Gly Leu

700 705 710

Leu Thr Thr Asn Thr Asp Lys Phe Cys Ser Val Thr Gly Phe Phe Ser

715 720 725 730

Thr Ala Thr Asp Met Thr Leu Asp Ala Leu Thr Ile Asn Ser Gly Asn

735 740 745

Asp Phe Gly Thr Leu Gln Trp Ile Ser Leu Asp Asp Gln Pro Leu Pro

750 755 760

Glu Ala Lys Lys Ser Leu Ile Thr Leu Thr Ala Ala Gln Gln Asn Thr

765 770 775

Asn Met Thr Trp Asn Gly Thr Asn Thr Ile His Asn Asn Trp Gly Asn

780 785 790

Ala Pro Thr Glu Gln Lys Pro Leu Gln Val Ala Ile Glu Met Ala Leu

795 800 805 810

Asn Ala Asp Tyr Ile Lys Leu Tyr Pro Leu Asp Val Tyr Ala Thr Pro

815 820 825

Thr Asp Ser Ile Leu Val Leu Pro Asn Ser Gln Gly His Phe Pro Ile

830 835 840

Leu Leu Asp Gln Tyr Gln Tyr Glu Thr Leu Trp Phe Gly Ile Asn Thr

845 850 855

Phe Ile Gly Pro Val Ser Thr Leu Glu Ser Asp Gln Pro Thr Pro Phe

860 865 870

His Phe Tyr Pro Asn Pro Val Leu Ser Gly Gln Pro Val Gln Ile Thr

875 880 885 890

Gly Pro Glu Lys Ser Thr Ile Leu Leu Phe Asn Ile Leu Gly Gln Leu

895 900 905

Val Asn Gln Gln Glu Ile Asn Thr Pro Phe Tyr Arg Leu Asp Thr Thr

910 915 920

Gly Leu Thr Ala Gly Thr Tyr Gln Leu Val Phe Leu Asn Glu Asn Arg

925 930 935

Gln Arg Leu Asn Asn Thr Leu Leu Ile Ile Lys

940 945

<210> 7

<211> 2565

<212> DNA

<213> Chthoniobacter flavus

<220>

<221> CDS

<222> (1)..(2562)

<220>

<221> 信号肽

<222> (1)..(72)

<220>

<221> 成熟肽

<222> (73)..(2562)

<400> 7

atg aat ctt cgc caa act ctc ccc gtc ctc tcc gtt gcg gcc gcc tta 48

Met Asn Leu Arg Gln Thr Leu Pro Val Leu Ser Val Ala Ala Ala Leu

-20 -15 -10

ctt acg gcg cca gtc gtt cgc gct gcc gat ttg ttc cct ttc gtc ctg 96

Leu Thr Ala Pro Val Val Arg Ala Ala Asp Leu Phe Pro Phe Val Leu

-5 -1 1 5

ccg tgg gac gat gcc agc cct tcc atc acc aac gtc agc tcc tgg ctg 144

Pro Trp Asp Asp Ala Ser Pro Ser Ile Thr Asn Val Ser Ser Trp Leu

10 15 20

gac aag ccg gcc ggg aaa gac ggc ttc gtc tac acg cac gat gga cat 192

Asp Lys Pro Ala Gly Lys Asp Gly Phe Val Tyr Thr His Asp Gly His

25 30 35 40

ctt ttc gcc ggc aag aag cgc atc cgt ttc ttt ggg gtc aac ctc gcc 240

Leu Phe Ala Gly Lys Lys Arg Ile Arg Phe Phe Gly Val Asn Leu Ala

45 50 55

ttc gcc gga aat ttc ccc aat cac aac gat gcc gac ccc gtg gcg gct 288

Phe Ala Gly Asn Phe Pro Asn His Asn Asp Ala Asp Pro Val Ala Ala

60 65 70

cgc atg gca aaa ttt ggc atc aac tgt gtc cgc ttt cac cac atg gat 336

Arg Met Ala Lys Phe Gly Ile Asn Cys Val Arg Phe His His Met Asp

75 80 85

acg ggc ttt gcg ccg gcc gga ttg ctg aag aag gac aag aag acc ttc 384

Thr Gly Phe Ala Pro Ala Gly Leu Leu Lys Lys Asp Lys Lys Thr Phe

90 95 100

gac gag gac tcg ctc gac cgg ctc gat tac ttc att gcc cag ctc aaa 432

Asp Glu Asp Ser Leu Asp Arg Leu Asp Tyr Phe Ile Ala Gln Leu Lys

105 110 115 120

aag aac ggg atc tat gcc gac ctg aat ctc cac gtc ggc ctc gaa tat 480

Lys Asn Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Leu Glu Tyr

125 130 135

ccc ggc ttc aag aaa tgg gaa ggc gct tcg aac ttc ttc aag ggc gtg 528

Pro Gly Phe Lys Lys Trp Glu Gly Ala Ser Asn Phe Phe Lys Gly Val

140 145 150

gac aat ttt ttt cca ccg ttc atc gag cag cag cgc gag tac gcg cgc 576

Asp Asn Phe Phe Pro Pro Phe Ile Glu Gln Gln Arg Glu Tyr Ala Arg

155 160 165

atg ctg ctc acg cac gtc aat gct tat acc cac aag cct tat acc gat 624

Met Leu Leu Thr His Val Asn Ala Tyr Thr His Lys Pro Tyr Thr Asp

170 175 180

gaa tcg gcc gtc gcc ttc atc gag atc aac aat gag aat ggg ctg atc 672

Glu Ser Ala Val Ala Phe Ile Glu Ile Asn Asn Glu Asn Gly Leu Ile

185 190 195 200

atg gaa tgg aac aac ggg acg ctc gat gcc atg ccc gat cct ttc gcc 720

Met Glu Trp Asn Asn Gly Thr Leu Asp Ala Met Pro Asp Pro Phe Ala

205 210 215

gcc gag ttg cga aag cag tgg aac gac tgg ttg aaa aag aaa tac gac 768

Ala Glu Leu Arg Lys Gln Trp Asn Asp Trp Leu Lys Lys Lys Tyr Asp

220 225 230

acc ccg gcc aag ctc gcc ggg gca tgg gga aaa ggc gcg gag ccg ctc 816

Thr Pro Ala Lys Leu Ala Gly Ala Trp Gly Lys Gly Ala Glu Pro Leu

235 240 245

ggt cag gag atg ctc aag ccc acg cat acc gcc tgg cat ctc gag caa 864

Gly Gln Glu Met Leu Lys Pro Thr His Thr Ala Trp His Leu Glu Gln

250 255 260

cac ggc gag gcc aag tcg gag ttg agt tcc gaa ccc ggc gaa ggg tcc 912

His Gly Glu Ala Lys Ser Glu Leu Ser Ser Glu Pro Gly Glu Gly Ser

265 270 275 280

gcg ggg gaa acc ctg cac gtc cac gta acc caa ccg ggc cag gaa agc 960

Ala Gly Glu Thr Leu His Val His Val Thr Gln Pro Gly Gln Glu Ser

285 290 295

tgg cat gtg cag ttg gga cag gcg ggg cta aag ctg gcc gcc ggc aag 1008

Trp His Val Gln Leu Gly Gln Ala Gly Leu Lys Leu Ala Ala Gly Lys

300 305 310

acc tac acg ctg cac ttg cgc gcc aag gcg gac gct ccc cgg cgg att 1056

Thr Tyr Thr Leu His Leu Arg Ala Lys Ala Asp Ala Pro Arg Arg Ile

315 320 325

agc atc ggg ctg agc cag gct cat gaa ccg tgg aag aca ctt ggc agc 1104

Ser Ile Gly Leu Ser Gln Ala His Glu Pro Trp Lys Thr Leu Gly Ser

330 335 340

cag agt gtc cgg ctc acc acg gag tgg cag gac gtc cat ttc tcc ata 1152

Gln Ser Val Arg Leu Thr Thr Glu Trp Gln Asp Val His Phe Ser Ile

345 350 355 360

ccg gtc gcg aat acc gag gaa aat gcc cgc ttc tcc ttc acc agt ctc 1200

Pro Val Ala Asn Thr Glu Glu Asn Ala Arg Phe Ser Phe Thr Ser Leu

365 370 375

ggc agc gcg gtc ggt gac tac tgg ttt tcc gac gcg tcg ctg cgt cct 1248

Gly Ser Ala Val Gly Asp Tyr Trp Phe Ser Asp Ala Ser Leu Arg Pro

380 385 390

ggc ggg gtc atc gcg ctg caa gcg ggt gaa tcg gtc ggg aac att cct 1296

Gly Gly Val Ile Ala Leu Gln Ala Gly Glu Ser Val Gly Asn Ile Pro

395 400 405

ttc ttc cgc aag aaa gaa atc ggc atg cgc acc ctc acc gca caa cgc 1344

Phe Phe Arg Lys Lys Glu Ile Gly Met Arg Thr Leu Thr Ala Gln Arg

410 415 420

gat tgg aac gct ttc ctc gtc gac acc gag gtg aac tat tgg acg ggc 1392

Asp Trp Asn Ala Phe Leu Val Asp Thr Glu Val Asn Tyr Trp Thr Gly

425 430 435 440

atg cgc cat ttc gtc cgc gaa gag ttg cat gcg cac agc cag gtc gtc 1440

Met Arg His Phe Val Arg Glu Glu Leu His Ala His Ser Gln Val Val

445 450 455

ggc tcg gcc acc ggc ttc agc cca tgg ctg gcg cag gcg aag ctc gat 1488

Gly Ser Ala Thr Gly Phe Ser Pro Trp Leu Ala Gln Ala Lys Leu Asp

460 465 470

gtc gtc gat gcg cac agc tat tgg cag cat ccg cat ttt ccc cac aaa 1536

Val Val Asp Ala His Ser Tyr Trp Gln His Pro His Phe Pro His Lys

475 480 485

cca tgg gac ccg ggc gac tgg acg gtg caa aac gtc tcg atg gcc ggc 1584

Pro Trp Asp Pro Gly Asp Trp Thr Val Gln Asn Val Ser Met Ala Gly

490 495 500

gcg ccc gac gga ggc aca ctc ccg ggc ctc gca cta cgg cgc gtg gcc 1632

Ala Pro Asp Gly Gly Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Ala

505 510 515 520

ggc aag cct ttc atc gtc acc gaa tat aac gcc tcc gca ccg aac acc 1680

Gly Lys Pro Phe Ile Val Thr Glu Tyr Asn Ala Ser Ala Pro Asn Thr

525 530 535

tat tcg agt gag gct ttc ctc gaa ctc tgc gcc atc gcg ggc ttg cag 1728

Tyr Ser Ser Glu Ala Phe Leu Glu Leu Cys Ala Ile Ala Gly Leu Gln

540 545 550

gac tgg gac ggg gtc ttt gct ttt gcc tac agc cac cgc gaa aac gat 1776

Asp Trp Asp Gly Val Phe Ala Phe Ala Tyr Ser His Arg Glu Asn Asp

555 560 565

tgg aac acc gag cac atc atg ggc ttt ttc gat atc gac cag cac ccg 1824

Trp Asn Thr Glu His Ile Met Gly Phe Phe Asp Ile Asp Gln His Pro

570 575 580

acg aag atg gcc acg cta ccc gcg gcg ctc gcg ctc ttt atg cgg ggc 1872

Thr Lys Met Ala Thr Leu Pro Ala Ala Leu Ala Leu Phe Met Arg Gly

585 590 595 600

gat atc aaa ccc ccg ggc gaa ccc gtc atc gcg gac acc acc tgg aac 1920

Asp Ile Lys Pro Pro Gly Glu Pro Val Ile Ala Asp Thr Thr Trp Asn

605 610 615

gac gcg ctt gaa tcg gtc cgc aaa gga gga tcg tgg gtc gat gcc aat 1968

Asp Ala Leu Glu Ser Val Arg Lys Gly Gly Ser Trp Val Asp Ala Asn

620 625 630

acc tac ggc att ccg aaa gag gaa gcg ttt cgg cgc gcc atc ggc atg 2016

Thr Tyr Gly Ile Pro Lys Glu Glu Ala Phe Arg Arg Ala Ile Gly Met

635 640 645

cgc atc ggc cag gcc acc aaa gtc aac gtg ccg ccg cca tcc gga gat 2064

Arg Ile Gly Gln Ala Thr Lys Val Asn Val Pro Pro Pro Ser Gly Asp

650 655 660

tcg tcg gtg att cgc agt gac aac ggc cag ttc acc tgg gac acc gtt 2112

Ser Ser Val Ile Arg Ser Asp Asn Gly Gln Phe Thr Trp Asp Thr Val

665 670 675 680

tcg cac cgc atg ctc ctc gcg agt ccg cgt tca gcg ggc gtg atc ggc 2160

Ser His Arg Met Leu Leu Ala Ser Pro Arg Ser Ala Gly Val Ile Gly

685 690 695

tcg ctc aaa gag ggc gaa acg atc gac ctc ggc agt gtg cga atc atc 2208

Ser Leu Lys Glu Gly Glu Thr Ile Asp Leu Gly Ser Val Arg Ile Ile

700 705 710

ccg ggt ccc acg cgg cag aac tgg gcg acg atc aat gcc acg gtc atc 2256

Pro Gly Pro Thr Arg Gln Asn Trp Ala Thr Ile Asn Ala Thr Val Ile

715 720 725

gcc ggc ccg gat ttt gaa cac gcg aag cgc att ctc atc acg gcc acg 2304

Ala Gly Pro Asp Phe Glu His Ala Lys Arg Ile Leu Ile Thr Ala Thr

730 735 740

ggt ctg gcc gaa aac acc ggc atg aag tgg aag gat gcg cag aag tcg 2352

Gly Leu Ala Glu Asn Thr Gly Met Lys Trp Lys Asp Ala Gln Lys Ser

745 750 755 760

agc gta ggc gcc gac tgg ggc cac gag cct tcg ctc gtc gag ggg atc 2400

Ser Val Gly Ala Asp Trp Gly His Glu Pro Ser Leu Val Glu Gly Ile

765 770 775

tcc gcc aag atc ggc gtg cct ttc cag aaa ggc gct cag gcg tgg tct 2448

Ser Ala Lys Ile Gly Val Pro Phe Gln Lys Gly Ala Gln Ala Trp Ser

780 785 790

ctc gac gcg cgc ggg cag cgc caa acc gag atc cct gtg aag cga ggg 2496

Leu Asp Ala Arg Gly Gln Arg Gln Thr Glu Ile Pro Val Lys Arg Gly

795 800 805

aca ggc aaa acg gag atc gag att tcc ccc aat caa cag acg ctc tgg 2544

Thr Gly Lys Thr Glu Ile Glu Ile Ser Pro Asn Gln Gln Thr Leu Trp

810 815 820

tgg gag atc gag atc ccg taa 2565

Trp Glu Ile Glu Ile Pro

825 830

<210> 8

<211> 854

<212> PRT

<213> Chthoniobacter flavus

<400> 8

Met Asn Leu Arg Gln Thr Leu Pro Val Leu Ser Val Ala Ala Ala Leu

-20 -15 -10

Leu Thr Ala Pro Val Val Arg Ala Ala Asp Leu Phe Pro Phe Val Leu

-5 -1 1 5

Pro Trp Asp Asp Ala Ser Pro Ser Ile Thr Asn Val Ser Ser Trp Leu

10 15 20

Asp Lys Pro Ala Gly Lys Asp Gly Phe Val Tyr Thr His Asp Gly His

25 30 35 40

Leu Phe Ala Gly Lys Lys Arg Ile Arg Phe Phe Gly Val Asn Leu Ala

45 50 55

Phe Ala Gly Asn Phe Pro Asn His Asn Asp Ala Asp Pro Val Ala Ala

60 65 70

Arg Met Ala Lys Phe Gly Ile Asn Cys Val Arg Phe His His Met Asp

75 80 85

Thr Gly Phe Ala Pro Ala Gly Leu Leu Lys Lys Asp Lys Lys Thr Phe

90 95 100

Asp Glu Asp Ser Leu Asp Arg Leu Asp Tyr Phe Ile Ala Gln Leu Lys

105 110 115 120

Lys Asn Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Leu Glu Tyr

125 130 135

Pro Gly Phe Lys Lys Trp Glu Gly Ala Ser Asn Phe Phe Lys Gly Val

140 145 150

Asp Asn Phe Phe Pro Pro Phe Ile Glu Gln Gln Arg Glu Tyr Ala Arg

155 160 165

Met Leu Leu Thr His Val Asn Ala Tyr Thr His Lys Pro Tyr Thr Asp

170 175 180

Glu Ser Ala Val Ala Phe Ile Glu Ile Asn Asn Glu Asn Gly Leu Ile

185 190 195 200

Met Glu Trp Asn Asn Gly Thr Leu Asp Ala Met Pro Asp Pro Phe Ala

205 210 215

Ala Glu Leu Arg Lys Gln Trp Asn Asp Trp Leu Lys Lys Lys Tyr Asp

220 225 230

Thr Pro Ala Lys Leu Ala Gly Ala Trp Gly Lys Gly Ala Glu Pro Leu

235 240 245

Gly Gln Glu Met Leu Lys Pro Thr His Thr Ala Trp His Leu Glu Gln

250 255 260

His Gly Glu Ala Lys Ser Glu Leu Ser Ser Glu Pro Gly Glu Gly Ser

265 270 275 280

Ala Gly Glu Thr Leu His Val His Val Thr Gln Pro Gly Gln Glu Ser

285 290 295

Trp His Val Gln Leu Gly Gln Ala Gly Leu Lys Leu Ala Ala Gly Lys

300 305 310

Thr Tyr Thr Leu His Leu Arg Ala Lys Ala Asp Ala Pro Arg Arg Ile

315 320 325

Ser Ile Gly Leu Ser Gln Ala His Glu Pro Trp Lys Thr Leu Gly Ser

330 335 340

Gln Ser Val Arg Leu Thr Thr Glu Trp Gln Asp Val His Phe Ser Ile

345 350 355 360

Pro Val Ala Asn Thr Glu Glu Asn Ala Arg Phe Ser Phe Thr Ser Leu

365 370 375

Gly Ser Ala Val Gly Asp Tyr Trp Phe Ser Asp Ala Ser Leu Arg Pro

380 385 390

Gly Gly Val Ile Ala Leu Gln Ala Gly Glu Ser Val Gly Asn Ile Pro

395 400 405

Phe Phe Arg Lys Lys Glu Ile Gly Met Arg Thr Leu Thr Ala Gln Arg

410 415 420

Asp Trp Asn Ala Phe Leu Val Asp Thr Glu Val Asn Tyr Trp Thr Gly

425 430 435 440

Met Arg His Phe Val Arg Glu Glu Leu His Ala His Ser Gln Val Val

445 450 455

Gly Ser Ala Thr Gly Phe Ser Pro Trp Leu Ala Gln Ala Lys Leu Asp

460 465 470

Val Val Asp Ala His Ser Tyr Trp Gln His Pro His Phe Pro His Lys

475 480 485

Pro Trp Asp Pro Gly Asp Trp Thr Val Gln Asn Val Ser Met Ala Gly

490 495 500

Ala Pro Asp Gly Gly Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Ala

505 510 515 520

Gly Lys Pro Phe Ile Val Thr Glu Tyr Asn Ala Ser Ala Pro Asn Thr

525 530 535

Tyr Ser Ser Glu Ala Phe Leu Glu Leu Cys Ala Ile Ala Gly Leu Gln

540 545 550

Asp Trp Asp Gly Val Phe Ala Phe Ala Tyr Ser His Arg Glu Asn Asp

555 560 565

Trp Asn Thr Glu His Ile Met Gly Phe Phe Asp Ile Asp Gln His Pro

570 575 580

Thr Lys Met Ala Thr Leu Pro Ala Ala Leu Ala Leu Phe Met Arg Gly

585 590 595 600

Asp Ile Lys Pro Pro Gly Glu Pro Val Ile Ala Asp Thr Thr Trp Asn

605 610 615

Asp Ala Leu Glu Ser Val Arg Lys Gly Gly Ser Trp Val Asp Ala Asn

620 625 630

Thr Tyr Gly Ile Pro Lys Glu Glu Ala Phe Arg Arg Ala Ile Gly Met

635 640 645

Arg Ile Gly Gln Ala Thr Lys Val Asn Val Pro Pro Pro Ser Gly Asp

650 655 660

Ser Ser Val Ile Arg Ser Asp Asn Gly Gln Phe Thr Trp Asp Thr Val

665 670 675 680

Ser His Arg Met Leu Leu Ala Ser Pro Arg Ser Ala Gly Val Ile Gly

685 690 695

Ser Leu Lys Glu Gly Glu Thr Ile Asp Leu Gly Ser Val Arg Ile Ile

700 705 710

Pro Gly Pro Thr Arg Gln Asn Trp Ala Thr Ile Asn Ala Thr Val Ile

715 720 725

Ala Gly Pro Asp Phe Glu His Ala Lys Arg Ile Leu Ile Thr Ala Thr

730 735 740

Gly Leu Ala Glu Asn Thr Gly Met Lys Trp Lys Asp Ala Gln Lys Ser

745 750 755 760

Ser Val Gly Ala Asp Trp Gly His Glu Pro Ser Leu Val Glu Gly Ile

765 770 775

Ser Ala Lys Ile Gly Val Pro Phe Gln Lys Gly Ala Gln Ala Trp Ser

780 785 790

Leu Asp Ala Arg Gly Gln Arg Gln Thr Glu Ile Pro Val Lys Arg Gly

795 800 805

Thr Gly Lys Thr Glu Ile Glu Ile Ser Pro Asn Gln Gln Thr Leu Trp

810 815 820

Trp Glu Ile Glu Ile Pro

825 830

<210> 9

<211> 2715

<212> DNA

<213> 堆肥宏基因组

<220>

<221> CDS

<222> (1)..(2712)

<220>

<221> 信号肽

<222> (1)..(75)

<220>

<221> 成熟肽

<222> (115)..(2706)

<220>

<221> prot_结构域

<222> (115)..(804)

<220>

<221> prot_结构域

<222> (1504)..(2706)

<220>

<221> prot_结构域

<222> (1516)..(2043)

<400> 9

atg gtc cac ccc cgc ctg cgc aga ccc ctc ctc cga ctg ctc ctc gcc 48

Met Val His Pro Arg Leu Arg Arg Pro Leu Leu Arg Leu Leu Leu Ala

-35 -30 -25

gtt tct ccc gtc ttt tcc gcc ctc gct gcg tcg gcc gcg gac ggc gtc 96

Val Ser Pro Val Phe Ser Ala Leu Ala Ala Ser Ala Ala Asp Gly Val

-20 -15 -10

ccc ttc gac ggc ttc ccc ttt cac atc ccg ccc acc ggc acc gtc ccc 144

Pro Phe Asp Gly Phe Pro Phe His Ile Pro Pro Thr Gly Thr Val Pro

-5 -1 1 5 10

ggc acc gcg ccc gcc gcc ctc ggc ctc ccc gcc cgc ccc gcc gac agc 192

Gly Thr Ala Pro Ala Ala Leu Gly Leu Pro Ala Arg Pro Ala Asp Ser

15 20 25

ccg atc gtc atc cgc ggc gac cag ttc atc cgg gcc gac acc ggc gaa 240

Pro Ile Val Ile Arg Gly Asp Gln Phe Ile Arg Ala Asp Thr Gly Glu

30 35 40

ccc atc cgc ttc tgg ggc gtc aac ctc tcc ttc gcc ggc gcg ttc ccc 288

Pro Ile Arg Phe Trp Gly Val Asn Leu Ser Phe Ala Gly Ala Phe Pro

45 50 55

gat cac gaa aac gcc gat cgc atc gcc gcc cgc ctg gcc agc ctc ggc 336

Asp His Glu Asn Ala Asp Arg Ile Ala Ala Arg Leu Ala Ser Leu Gly

60 65 70

gtc aac atc gtg cgc ttc cac cac atc gac cag cgc cgc ttc ccc ggc 384

Val Asn Ile Val Arg Phe His His Ile Asp Gln Arg Arg Phe Pro Gly

75 80 85 90

ggc ctc tgg cac cgc gac gcc ccc ggc gcc tcc gcc aat ccc cgc gag 432

Gly Leu Trp His Arg Asp Ala Pro Gly Ala Ser Ala Asn Pro Arg Glu

95 100 105

gac gac atc gag cac cgc gtc ttc gac ccc gaa tcc ctc gac cgc ctc 480

Asp Asp Ile Glu His Arg Val Phe Asp Pro Glu Ser Leu Asp Arg Leu

110 115 120

gac tac ctc gtc gcc cgc ctg aag gcg cac ggc atc tac gcc aat ctc 528

Asp Tyr Leu Val Ala Arg Leu Lys Ala His Gly Ile Tyr Ala Asn Leu

125 130 135

aac ctc aag gtc tcc cgc acc ttc agc acc tac gac ggc ccc gcc ttc 576

Asn Leu Lys Val Ser Arg Thr Phe Ser Thr Tyr Asp Gly Pro Ala Phe

140 145 150

ccc gcg ccc gcc gcc gac gaa ttc acc ccc cgc aaa ggc aaa ggc ttc 624

Pro Ala Pro Ala Ala Asp Glu Phe Thr Pro Arg Lys Gly Lys Gly Phe

155 160 165 170

gac cag ttc tac acg ccg gcc atc gag gcc cag aaa acc ttc gcc cgc 672

Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala Gln Lys Thr Phe Ala Arg

175 180 185

ctc ctc ctc acc cac cgc aac ccc tac acc ggc tcc acc tac gcc gcc 720

Leu Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Ser Thr Tyr Ala Ala

190 195 200

gag ccc gcc gtc gcc caa gtc gag atc aac aac gag aac ggc atc ctc 768

Glu Pro Ala Val Ala Gln Val Glu Ile Asn Asn Glu Asn Gly Ile Leu

205 210 215

tgg gcc tgg aac tac aac ctc ctc gac cgc ctc ccc gcc ccc tat ctc 816

Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg Leu Pro Ala Pro Tyr Leu

220 225 230

gcc gaa ctc tcc tcc cgc tgg aac acc tgg ctg cgc gcc cgc tac ccc 864

Ala Glu Leu Ser Ser Arg Trp Asn Thr Trp Leu Arg Ala Arg Tyr Pro

235 240 245 250

gac acc gcc gcc ctc cgc gcc gcc tgg gcg gac ggc tcg gcc gcc gca 912

Asp Thr Ala Ala Leu Arg Ala Ala Trp Ala Asp Gly Ser Ala Ala Ala

255 260 265

tcc tcc gtc ctt tcc ccc ggc gcg ccc gcg agc acc gat ctt ctc gcc 960

Ser Ser Val Leu Ser Pro Gly Ala Pro Ala Ser Thr Asp Leu Leu Ala

270 275 280

ggc gtc gcc ccg gaa ctc cgc acc gcc aga aga gcc cgc gcc acg ctc 1008

Gly Val Ala Pro Glu Leu Arg Thr Ala Arg Arg Ala Arg Ala Thr Leu

285 290 295

ctc ccc ccg ccc gcg cgc gac acc ggc gac gcg gac gcc gac gac acc 1056

Leu Pro Pro Pro Ala Arg Asp Thr Gly Asp Ala Asp Ala Asp Asp Thr

300 305 310

acc gcg ctg cgc ctc acc gtg gac gaa gtc ccc gac gcc gcc tcg tgg 1104

Thr Ala Leu Arg Leu Thr Val Asp Glu Val Pro Asp Ala Ala Ser Trp

315 320 325 330

aac gtc cgc tgc aac tac ccg ctc acc ctc tcc ccc ggc gcg acc tac 1152

Asn Val Arg Cys Asn Tyr Pro Leu Thr Leu Ser Pro Gly Ala Thr Tyr

335 340 345

ctc gcc acc ctc cgc ctc cgg gcc aac cgt gag gaa aaa atc gcc ctg 1200

Leu Ala Thr Leu Arg Leu Arg Ala Asn Arg Glu Glu Lys Ile Ala Leu

350 355 360

cgc ctg cgc gac ccc gac aac caa aac ctc gcc gcg ccg cgc acg ctc 1248

Arg Leu Arg Asp Pro Asp Asn Gln Asn Leu Ala Ala Pro Arg Thr Leu

365 370 375

aac ctc gag acc gac tgg aaa cgg cac acc ctc acc ttt gcc gtc ccc 1296

Asn Leu Glu Thr Asp Trp Lys Arg His Thr Leu Thr Phe Ala Val Pro

380 385 390

gcc ggc gac cac ccc gcc gac acg ctc gcc gcc ctg ctc tcc ctc gaa 1344

Ala Gly Asp His Pro Ala Asp Thr Leu Ala Ala Leu Leu Ser Leu Glu

395 400 405 410

gcg ggc cgc ccc ggt ctc gtc ctc gac atc gac gcc gcc tcc ttc cgc 1392

Ala Gly Arg Pro Gly Leu Val Leu Asp Ile Asp Ala Ala Ser Phe Arg

415 420 425

ctc aac ctc ctc gcc ggc ctg ccc tcc ggc caa ggc atc gac ccc ggc 1440

Leu Asn Leu Leu Ala Gly Leu Pro Ser Gly Gln Gly Ile Asp Pro Gly

430 435 440

gac cgc ccc gtc gcc tgg gtg ctc cgc cgc gac ctg ccc gac cgc acc 1488

Asp Arg Pro Val Ala Trp Val Leu Arg Arg Asp Leu Pro Asp Arg Thr

445 450 455

ccc gcc acc gtc acc gac atc atg cgc ttc ctg cgc gac acc gag gtc 1536

Pro Ala Thr Val Thr Asp Ile Met Arg Phe Leu Arg Asp Thr Glu Val

460 465 470

gcc tac tgg cgc gag atg cac gcc tat ctc cgc gac gaa ctc ggc gtc 1584

Ala Tyr Trp Arg Glu Met His Ala Tyr Leu Arg Asp Glu Leu Gly Val

475 480 485 490

gtc gcc ccc atc gcc ggc acc gcc gtc ggc tac tcc acc ccg cag atc 1632

Val Ala Pro Ile Ala Gly Thr Ala Val Gly Tyr Ser Thr Pro Gln Ile

495 500 505

cag gcc gag acc ggc gac ttc gtg gac acc cac cgc tac tgg ggc gcg 1680

Gln Ala Glu Thr Gly Asp Phe Val Asp Thr His Arg Tyr Trp Gly Ala

510 515 520

ccg cgt ttc ccc agg ttc gac cgc tcc aag ccc tgg acc gtc gaa cag 1728

Pro Arg Phe Pro Arg Phe Asp Arg Ser Lys Pro Trp Thr Val Glu Gln

525 530 535

aag gcc atg gtc gcg cat ccc ggc tca tcc aca ttc gaa cgc atg gcc 1776

Lys Ala Met Val Ala His Pro Gly Ser Ser Thr Phe Glu Arg Met Ala

540 545 550

gcc cgt cgc gtc ttc ggg cgt cct ttc acc gtc acc gaa tac aac cac 1824

Ala Arg Arg Val Phe Gly Arg Pro Phe Thr Val Thr Glu Tyr Asn His

555 560 565 570

ccg ccc tcc agc gac cat cac gcc gag gcc ttc ccg ctg ctc gcc ctc 1872

Pro Pro Ser Ser Asp His His Ala Glu Ala Phe Pro Leu Leu Ala Leu

575 580 585

tac ggc tcc gcg cag gat tgg gac gcg ctc ttc caa ttc gcc tac gcc 1920

Tyr Gly Ser Ala Gln Asp Trp Asp Ala Leu Phe Gln Phe Ala Tyr Ala

590 595 600

cac tcc ccc gac gcc tgg gaa ggc gac acg ctc cgg ggc ttc ttc gac 1968

His Ser Pro Asp Ala Trp Glu Gly Asp Thr Leu Arg Gly Phe Phe Asp

605 610 615

acc gcg ccc aac ccc gcg cac acc gtc gcc gcg ctg gcc gca tcc gac 2016

Thr Ala Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser Asp

620 625 630

atc ttc cga aaa cgc cgc gtc gcc ccg ttc tcc gaa gcc gtc gcc gtc 2064

Ile Phe Arg Lys Arg Arg Val Ala Pro Phe Ser Glu Ala Val Ala Val

635 640 645 650

cac gtt cct ctc gaa cgc cag ctc gaa cgg cag aac aac tac gcc ttc 2112

His Val Pro Leu Glu Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala Phe

655 660 665

ccg cga ctc gtc gag gcc tgc gcc gtc ttc ggc ggc ctc ccc gcc gac 2160

Pro Arg Leu Val Glu Ala Cys Ala Val Phe Gly Gly Leu Pro Ala Asp

670 675 680

gcc tgg ctg cac cgc cgc gtc ggt ctc gcg ctc cac ccc ggc gaa caa 2208

Ala Trp Leu His Arg Arg Val Gly Leu Ala Leu His Pro Gly Glu Gln

685 690 695

ccc gcg tcg ctc cct ccc gcc gcc tct ggc cat cac ctt gtc tgg gac 2256

Pro Ala Ser Leu Pro Pro Ala Ala Ser Gly His His Leu Val Trp Asp

700 705 710

gcc gcg cac gcc ggc tcc gcc cac gtc cgc ttc gtc ggc gac ggc gcc 2304

Ala Ala His Ala Gly Ser Ala His Val Arg Phe Val Gly Asp Gly Ala

715 720 725 730

gcc ggc ctc gtc ggt ttc gtc gcc ggc cgg aca ctc gac ctc ggc tgg 2352

Ala Gly Leu Val Gly Phe Val Ala Gly Arg Thr Leu Asp Leu Gly Trp

735 740 745

ctg cgt atc act cca ggc act aca tcg ctc gac ggt ttc tcc gtc gtc 2400

Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asp Gly Phe Ser Val Val

750 755 760

atg ctc aac gcc gtc gac ggc cag ccc ctc ggc gcg ccc ggc cgc cac 2448

Met Leu Asn Ala Val Asp Gly Gln Pro Leu Gly Ala Pro Gly Arg His

765 770 775

ctg ctc acc gtc gtc gtg cgc gcc gcc aac cgc cac atg gga tgg aac 2496

Leu Leu Thr Val Val Val Arg Ala Ala Asn Arg His Met Gly Trp Asn

780 785 790

gcc gac cgc acc ggc ttc ggc acc gcg tgg ggc gaa ggc ccc gcc ctc 2544

Ala Asp Arg Thr Gly Phe Gly Thr Ala Trp Gly Glu Gly Pro Ala Leu

795 800 805 810

gtc gag acc gcc ccc gtc gac ctc gcc ttc ctc aag ccg gcg cgc gtc 2592

Val Glu Thr Ala Pro Val Asp Leu Ala Phe Leu Lys Pro Ala Arg Val

815 820 825

cac gcg ctc gcg ccc gac ggc acg cgc cgc gtc gag ctc gcg ccc gcg 2640

His Ala Leu Ala Pro Asp Gly Thr Arg Arg Val Glu Leu Ala Pro Ala

830 835 840

gag ggt tcc ggc tcc gcc gtc cgg ttc cgc gcc ggc ccg gaa tac cgc 2688

Glu Gly Ser Gly Ser Ala Val Arg Phe Arg Ala Gly Pro Glu Tyr Arg

845 850 855

acc ctc tgg tat gag att tcc ctc tga 2715

Thr Leu Trp Tyr Glu Ile Ser Leu

860 865

<210> 10

<211> 904

<212> PRT

<213> 堆肥宏基因组

<400> 10

Met Val His Pro Arg Leu Arg Arg Pro Leu Leu Arg Leu Leu Leu Ala

-35 -30 -25

Val Ser Pro Val Phe Ser Ala Leu Ala Ala Ser Ala Ala Asp Gly Val

-20 -15 -10

Pro Phe Asp Gly Phe Pro Phe His Ile Pro Pro Thr Gly Thr Val Pro

-5 -1 1 5 10

Gly Thr Ala Pro Ala Ala Leu Gly Leu Pro Ala Arg Pro Ala Asp Ser

15 20 25

Pro Ile Val Ile Arg Gly Asp Gln Phe Ile Arg Ala Asp Thr Gly Glu

30 35 40

Pro Ile Arg Phe Trp Gly Val Asn Leu Ser Phe Ala Gly Ala Phe Pro

45 50 55

Asp His Glu Asn Ala Asp Arg Ile Ala Ala Arg Leu Ala Ser Leu Gly

60 65 70

Val Asn Ile Val Arg Phe His His Ile Asp Gln Arg Arg Phe Pro Gly

75 80 85 90

Gly Leu Trp His Arg Asp Ala Pro Gly Ala Ser Ala Asn Pro Arg Glu

95 100 105

Asp Asp Ile Glu His Arg Val Phe Asp Pro Glu Ser Leu Asp Arg Leu

110 115 120

Asp Tyr Leu Val Ala Arg Leu Lys Ala His Gly Ile Tyr Ala Asn Leu

125 130 135

Asn Leu Lys Val Ser Arg Thr Phe Ser Thr Tyr Asp Gly Pro Ala Phe

140 145 150

Pro Ala Pro Ala Ala Asp Glu Phe Thr Pro Arg Lys Gly Lys Gly Phe

155 160 165 170

Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala Gln Lys Thr Phe Ala Arg

175 180 185

Leu Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Ser Thr Tyr Ala Ala

190 195 200

Glu Pro Ala Val Ala Gln Val Glu Ile Asn Asn Glu Asn Gly Ile Leu

205 210 215

Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg Leu Pro Ala Pro Tyr Leu

220 225 230

Ala Glu Leu Ser Ser Arg Trp Asn Thr Trp Leu Arg Ala Arg Tyr Pro

235 240 245 250

Asp Thr Ala Ala Leu Arg Ala Ala Trp Ala Asp Gly Ser Ala Ala Ala

255 260 265

Ser Ser Val Leu Ser Pro Gly Ala Pro Ala Ser Thr Asp Leu Leu Ala

270 275 280

Gly Val Ala Pro Glu Leu Arg Thr Ala Arg Arg Ala Arg Ala Thr Leu

285 290 295

Leu Pro Pro Pro Ala Arg Asp Thr Gly Asp Ala Asp Ala Asp Asp Thr

300 305 310

Thr Ala Leu Arg Leu Thr Val Asp Glu Val Pro Asp Ala Ala Ser Trp

315 320 325 330

Asn Val Arg Cys Asn Tyr Pro Leu Thr Leu Ser Pro Gly Ala Thr Tyr

335 340 345

Leu Ala Thr Leu Arg Leu Arg Ala Asn Arg Glu Glu Lys Ile Ala Leu

350 355 360

Arg Leu Arg Asp Pro Asp Asn Gln Asn Leu Ala Ala Pro Arg Thr Leu

365 370 375

Asn Leu Glu Thr Asp Trp Lys Arg His Thr Leu Thr Phe Ala Val Pro

380 385 390

Ala Gly Asp His Pro Ala Asp Thr Leu Ala Ala Leu Leu Ser Leu Glu

395 400 405 410

Ala Gly Arg Pro Gly Leu Val Leu Asp Ile Asp Ala Ala Ser Phe Arg

415 420 425

Leu Asn Leu Leu Ala Gly Leu Pro Ser Gly Gln Gly Ile Asp Pro Gly

430 435 440

Asp Arg Pro Val Ala Trp Val Leu Arg Arg Asp Leu Pro Asp Arg Thr

445 450 455

Pro Ala Thr Val Thr Asp Ile Met Arg Phe Leu Arg Asp Thr Glu Val

460 465 470

Ala Tyr Trp Arg Glu Met His Ala Tyr Leu Arg Asp Glu Leu Gly Val

475 480 485 490

Val Ala Pro Ile Ala Gly Thr Ala Val Gly Tyr Ser Thr Pro Gln Ile

495 500 505

Gln Ala Glu Thr Gly Asp Phe Val Asp Thr His Arg Tyr Trp Gly Ala

510 515 520

Pro Arg Phe Pro Arg Phe Asp Arg Ser Lys Pro Trp Thr Val Glu Gln

525 530 535

Lys Ala Met Val Ala His Pro Gly Ser Ser Thr Phe Glu Arg Met Ala

540 545 550

Ala Arg Arg Val Phe Gly Arg Pro Phe Thr Val Thr Glu Tyr Asn His

555 560 565 570

Pro Pro Ser Ser Asp His His Ala Glu Ala Phe Pro Leu Leu Ala Leu

575 580 585

Tyr Gly Ser Ala Gln Asp Trp Asp Ala Leu Phe Gln Phe Ala Tyr Ala

590 595 600

His Ser Pro Asp Ala Trp Glu Gly Asp Thr Leu Arg Gly Phe Phe Asp

605 610 615

Thr Ala Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser Asp

620 625 630

Ile Phe Arg Lys Arg Arg Val Ala Pro Phe Ser Glu Ala Val Ala Val

635 640 645 650

His Val Pro Leu Glu Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala Phe

655 660 665

Pro Arg Leu Val Glu Ala Cys Ala Val Phe Gly Gly Leu Pro Ala Asp

670 675 680

Ala Trp Leu His Arg Arg Val Gly Leu Ala Leu His Pro Gly Glu Gln

685 690 695

Pro Ala Ser Leu Pro Pro Ala Ala Ser Gly His His Leu Val Trp Asp

700 705 710

Ala Ala His Ala Gly Ser Ala His Val Arg Phe Val Gly Asp Gly Ala

715 720 725 730

Ala Gly Leu Val Gly Phe Val Ala Gly Arg Thr Leu Asp Leu Gly Trp

735 740 745

Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asp Gly Phe Ser Val Val

750 755 760

Met Leu Asn Ala Val Asp Gly Gln Pro Leu Gly Ala Pro Gly Arg His

765 770 775

Leu Leu Thr Val Val Val Arg Ala Ala Asn Arg His Met Gly Trp Asn

780 785 790

Ala Asp Arg Thr Gly Phe Gly Thr Ala Trp Gly Glu Gly Pro Ala Leu

795 800 805 810

Val Glu Thr Ala Pro Val Asp Leu Ala Phe Leu Lys Pro Ala Arg Val

815 820 825

His Ala Leu Ala Pro Asp Gly Thr Arg Arg Val Glu Leu Ala Pro Ala

830 835 840

Glu Gly Ser Gly Ser Ala Val Arg Phe Arg Ala Gly Pro Glu Tyr Arg

845 850 855

Thr Leu Trp Tyr Glu Ile Ser Leu

860 865

<210> 11

<211> 2586

<212> DNA

<213> 人类粪便宏基因组

<220>

<221> CDS

<222> (1)..(2583)

<220>

<221> 信号肽

<222> (1)..(72)

<220>

<221> 成熟肽

<222> (103)..(2565)

<220>

<221> prot_结构域

<222> (103)..(768)

<220>

<221> prot_结构域

<222> (886)..(1209)

<220>

<221> prot_结构域

<222> (1297)..(2565)

<400> 11

atg aca cga aaa ttc ttt att cca ctc acg ctc ggc ggg ctg ttg ctc 48

Met Thr Arg Lys Phe Phe Ile Pro Leu Thr Leu Gly Gly Leu Leu Leu

-30 -25 -20

gga agt ccg ctt aca gcc gcg aac acg gat gcc gtt ccg gag ggc tat 96

Gly Ser Pro Leu Thr Ala Ala Asn Thr Asp Ala Val Pro Glu Gly Tyr

-15 -10 -5

cag ccg ttc ccg ttg caa tgg gat gac aca ctc gcc ggg aca gca acc 144

Gln Pro Phe Pro Leu Gln Trp Asp Asp Thr Leu Ala Gly Thr Ala Thr

-1 1 5 10

gat gtt tct ttc ctc aac gaa aaa cct gcc gga aaa aac ggg cgt ctg 192

Asp Val Ser Phe Leu Asn Glu Lys Pro Ala Gly Lys Asn Gly Arg Leu

15 20 25 30

atc gtt cgc gac gcc cat ttt gtc gaa agt tcc aca gga aaa cgt gtc 240

Ile Val Arg Asp Ala His Phe Val Glu Ser Ser Thr Gly Lys Arg Val

35 40 45

cgt ctg att gga atc ggg att ggc ggt gat gcg ctt ttc gaa atg gat 288

Arg Leu Ile Gly Ile Gly Ile Gly Gly Asp Ala Leu Phe Glu Met Asp

50 55 60

cac gct gcg gca gaa aag gct gca cgg cgt ctt gca aaa gcc ggt gtc 336

His Ala Ala Ala Glu Lys Ala Ala Arg Arg Leu Ala Lys Ala Gly Val

65 70 75

aac gtg gtc cgt ttc cac aat ctt gat ggt tcc gat cga gac cgg gat 384

Asn Val Val Arg Phe His Asn Leu Asp Gly Ser Asp Arg Asp Arg Asp

80 85 90

act ctc att gat ttc aag caa ccg ggc tcc gag cac ttc aat ccc aga 432

Thr Leu Ile Asp Phe Lys Gln Pro Gly Ser Glu His Phe Asn Pro Arg

95 100 105 110

cac ctt gat att ctg gac tat ttc ttc gcc tgt ctg aaa aag gag gga 480

His Leu Asp Ile Leu Asp Tyr Phe Phe Ala Cys Leu Lys Lys Glu Gly

115 120 125

atc tat act gtg atg ggt ctg aaa gtc aac cgg act ctc cgg aaa ggg 528

Ile Tyr Thr Val Met Gly Leu Lys Val Asn Arg Thr Leu Arg Lys Gly

130 135 140

gat gat ctt ccg gaa ggc gtc gac aac gcc gga aaa cgg gtt gac cgc 576

Asp Asp Leu Pro Glu Gly Val Asp Asn Ala Gly Lys Arg Val Asp Arg

145 150 155

ttc aac cgc gca tgg atc gaa tcg cag aaa cgc tgg gcg aaa aac ctg 624

Phe Asn Arg Ala Trp Ile Glu Ser Gln Lys Arg Trp Ala Lys Asn Leu

160 165 170

ctg acc cgt caa aat ccc tat acg aag aca acg ctg gcg gaa gat ccc 672

Leu Thr Arg Gln Asn Pro Tyr Thr Lys Thr Thr Leu Ala Glu Asp Pro

175 180 185 190

gcc gtt ctg agt gtg gaa ctc aac aac gaa agt gcg ctt ctg ttt gaa 720

Ala Val Leu Ser Val Glu Leu Asn Asn Glu Ser Ala Leu Leu Phe Glu

195 200 205

aat ctg aac tgg atc gac acg ctt ccc gct ccc tac aaa cgg gag ctg 768

Asn Leu Asn Trp Ile Asp Thr Leu Pro Ala Pro Tyr Lys Arg Glu Leu

210 215 220

acc gcc ctc tgg aat gac ttc ctt tcc cgc aaa tac aaa aac gac aaa 816

Thr Ala Leu Trp Asn Asp Phe Leu Ser Arg Lys Tyr Lys Asn Asp Lys

225 230 235

gcc ctc ctt gcc gcc tgg aac cgg gac acc agt ctc ccc gga gcc tct 864

Ala Leu Leu Ala Ala Trp Asn Arg Asp Thr Ser Leu Pro Gly Ala Ser

240 245 250

ctc ctg aat ccg gaa ggc cga tgg ggc ttc gaa cag ccg gac gca ttg 912

Leu Leu Asn Pro Glu Gly Arg Trp Gly Phe Glu Gln Pro Asp Ala Leu

255 260 265 270

aag gtt ttc cgc aat acc gcc gac tcg gtt tcg gca acc gta aca cgg 960

Lys Val Phe Arg Asn Thr Ala Asp Ser Val Ser Ala Thr Val Thr Arg

275 280 285

cgc agt aat cag gac tgg cag atc cag ttt cag cgt tcc gga ctc tcc 1008

Arg Ser Asn Gln Asp Trp Gln Ile Gln Phe Gln Arg Ser Gly Leu Ser

290 295 300

ctt gaa aac gga aaa acc tac acg ctg gag ttc gac gtg cga ggc gaa 1056

Leu Glu Asn Gly Lys Thr Tyr Thr Leu Glu Phe Asp Val Arg Gly Glu

305 310 315

ggc gac ccg atc cgc atc gtt ctg tcc cag gac cgt ccc gac tgg cac 1104

Gly Asp Pro Ile Arg Ile Val Leu Ser Gln Asp Arg Pro Asp Trp His

320 325 330

aac tgc gga ctc gaa gcc tcc tta tcc ctg acc tcc gaa tgg aga cac 1152

Asn Cys Gly Leu Glu Ala Ser Leu Ser Leu Thr Ser Glu Trp Arg His

335 340 345 350

cag cgc tac agc ttc cag gca aag aat gcg gat ccc gga cac gtc cgg 1200

Gln Arg Tyr Ser Phe Gln Ala Lys Asn Ala Asp Pro Gly His Val Arg

355 360 365

atc tct ttc ggt gtc gga cat gca cgg aaa gtg gaa atc gcc gcc gtc 1248

Ile Ser Phe Gly Val Gly His Ala Arg Lys Val Glu Ile Ala Ala Val

370 375 380

cgc ctt ttc cct gga acg aaa ccg gtc tcc gcc cgt ctc tcc tcc ggc 1296

Arg Leu Phe Pro Gly Thr Lys Pro Val Ser Ala Arg Leu Ser Ser Gly

385 390 395

agc att ccg ctt ccc gtt gcg ccg aac gat gcc atg agc gct gac tta 1344

Ser Ile Pro Leu Pro Val Ala Pro Asn Asp Ala Met Ser Ala Asp Leu

400 405 410

ctg gag ttt atg gtc gaa ctt gac acc cgc tat gcg gag gag atg ctg 1392

Leu Glu Phe Met Val Glu Leu Asp Thr Arg Tyr Ala Glu Glu Met Leu

415 420 425 430

gac tac ctg cgg aag gat ctc aac gta aaa agt ctg gtg atc gac acg 1440

Asp Tyr Leu Arg Lys Asp Leu Asn Val Lys Ser Leu Val Ile Asp Thr

435 440 445

cag atc gac tgg ggc gga ctc tcc gga ctc cgc cgc gaa aaa cgg atg 1488

Gln Ile Asp Trp Gly Gly Leu Ser Gly Leu Arg Arg Glu Lys Arg Met

450 455 460

gat tac gtt gat gcc cat gcc tac tgg ggg cat ccg gaa ttc acc gga 1536

Asp Tyr Val Asp Ala His Ala Tyr Trp Gly His Pro Glu Phe Thr Gly

465 470 475

gga agc tgg gag ttc aaa ccg ggt tgc tgg aag att ctc aac cag tca 1584

Gly Ser Trp Glu Phe Lys Pro Gly Cys Trp Lys Ile Leu Asn Gln Ser

480 485 490

cag att ccc cgc att gta cac ggc ggc tgg tgt ccg ctg gag cag ttc 1632

Gln Ile Pro Arg Ile Val His Gly Gly Trp Cys Pro Leu Glu Gln Phe

495 500 505 510

agc cga tac cgg atc agc acc aag cct ttt tcc att tcc gaa cac gat 1680

Ser Arg Tyr Arg Ile Ser Thr Lys Pro Phe Ser Ile Ser Glu His Asp

515 520 525

tat ccc tat ccg cac gac tac gcg gtt gag atg atg ccg ctt ctg gtc 1728

Tyr Pro Tyr Pro His Asp Tyr Ala Val Glu Met Met Pro Leu Leu Val

530 535 540

agc gtg gct ctg cgg cag gac tgg gac atg ctt cag ctc ttc atc cac 1776

Ser Val Ala Leu Arg Gln Asp Trp Asp Met Leu Gln Leu Phe Ile His

545 550 555

ggg acc ttc ctt acc cgc gga aaa tcc gcc ggc atc agc cac atg ttt 1824

Gly Thr Phe Leu Thr Arg Gly Lys Ser Ala Gly Ile Ser His Met Phe

560 565 570

gat cag acc aat cat ccc ggc aag atc ggt ttc ttt ccg gct gct gcg 1872

Asp Gln Thr Asn His Pro Gly Lys Ile Gly Phe Phe Pro Ala Ala Ala

575 580 585 590

ctg att ttc cgt cgc ggt atg ttc gaa ccc gct ccg aaa acg gtg gaa 1920

Leu Ile Phe Arg Arg Gly Met Phe Glu Pro Ala Pro Lys Thr Val Glu

595 600 605

ctc cgt ctt ccg gag cag ccg tgg cgc tgg ttc ggc aat cgc ttt gac 1968

Leu Arg Leu Pro Glu Gln Pro Trp Arg Trp Phe Gly Asn Arg Phe Asp

610 615 620

cgg gcg tgg gcg gag acc gga gta cgg cgc agt ctt ctt gac tcc cgg 2016

Arg Ala Trp Ala Glu Thr Gly Val Arg Arg Ser Leu Leu Asp Ser Arg

625 630 635

atg aca atc gtt ccc gat gcg ctg aaa acg ccc ggt cgg gct gag gca 2064

Met Thr Ile Val Pro Asp Ala Leu Lys Thr Pro Gly Arg Ala Glu Ala

640 645 650

tgc gtc tcc gct ccc gat gaa ccg gac cgc ccg atg cgc gga tgg acc 2112

Cys Val Ser Ala Pro Asp Glu Pro Asp Arg Pro Met Arg Gly Trp Thr

655 660 665 670

gaa gga gag aaa aac ttc ttt aca gcg gtc gct ccg cag tgt att gtt 2160

Glu Gly Glu Lys Asn Phe Phe Thr Ala Val Ala Pro Gln Cys Ile Val

675 680 685

ctc tgc ggt cat ttc ggc gga agg acg atg gat gtc ggc gat ctc cgt 2208

Leu Cys Gly His Phe Gly Gly Arg Thr Met Asp Val Gly Asp Leu Arg

690 695 700

ctc cgg gca cgt cca ttc ccc ggc gat ttc ggc gcg gca gtt ctg gtc 2256

Leu Arg Ala Arg Pro Phe Pro Gly Asp Phe Gly Ala Ala Val Leu Val

705 710 715

tcc cgc gat gaa cgt cct ctt ccg gca tcc gga gat att ctc ttc acg 2304

Ser Arg Asp Glu Arg Pro Leu Pro Ala Ser Gly Asp Ile Leu Phe Thr

720 725 730

att gca ggg cgc ttc gaa aac tcc ggg gtt atc tgg aac aag gag cgt 2352

Ile Ala Gly Arg Phe Glu Asn Ser Gly Val Ile Trp Asn Lys Glu Arg

735 740 745 750

gat gcg ctc ctc aac cgt tct cca tgg tgg ggc aat cct ccg gtt ctc 2400

Asp Ala Leu Leu Asn Arg Ser Pro Trp Trp Gly Asn Pro Pro Val Leu

755 760 765

ggt aca aaa acc gat gct gcc atc cgt ttc aaa acc gat ggg ccg cgc 2448

Gly Thr Lys Thr Asp Ala Ala Ile Arg Phe Lys Thr Asp Gly Pro Arg

770 775 780

acg gtc tac gcc ctt gat tcc aat gga aag cgg act gcc gaa ctg ccg 2496

Thr Val Tyr Ala Leu Asp Ser Asn Gly Lys Arg Thr Ala Glu Leu Pro

785 790 795

tcc gca tgg aag gac ggg cat ctc tcc ttc cat gtt cat ccg tca cac 2544

Ser Ala Trp Lys Asp Gly His Leu Ser Phe His Val His Pro Ser His

800 805 810

cgt tcc atg cac tac gaa atc gtc aaa gga gaa aac ctg tga 2586

Arg Ser Met His Tyr Glu Ile Val Lys Gly Glu Asn Leu

815 820 825

<210> 12

<211> 861

<212> PRT

<213> 人类粪便宏基因组

<400> 12

Met Thr Arg Lys Phe Phe Ile Pro Leu Thr Leu Gly Gly Leu Leu Leu

-30 -25 -20

Gly Ser Pro Leu Thr Ala Ala Asn Thr Asp Ala Val Pro Glu Gly Tyr

-15 -10 -5

Gln Pro Phe Pro Leu Gln Trp Asp Asp Thr Leu Ala Gly Thr Ala Thr

-1 1 5 10

Asp Val Ser Phe Leu Asn Glu Lys Pro Ala Gly Lys Asn Gly Arg Leu

15 20 25 30

Ile Val Arg Asp Ala His Phe Val Glu Ser Ser Thr Gly Lys Arg Val

35 40 45

Arg Leu Ile Gly Ile Gly Ile Gly Gly Asp Ala Leu Phe Glu Met Asp

50 55 60

His Ala Ala Ala Glu Lys Ala Ala Arg Arg Leu Ala Lys Ala Gly Val

65 70 75

Asn Val Val Arg Phe His Asn Leu Asp Gly Ser Asp Arg Asp Arg Asp

80 85 90

Thr Leu Ile Asp Phe Lys Gln Pro Gly Ser Glu His Phe Asn Pro Arg

95 100 105 110

His Leu Asp Ile Leu Asp Tyr Phe Phe Ala Cys Leu Lys Lys Glu Gly

115 120 125

Ile Tyr Thr Val Met Gly Leu Lys Val Asn Arg Thr Leu Arg Lys Gly

130 135 140

Asp Asp Leu Pro Glu Gly Val Asp Asn Ala Gly Lys Arg Val Asp Arg

145 150 155

Phe Asn Arg Ala Trp Ile Glu Ser Gln Lys Arg Trp Ala Lys Asn Leu

160 165 170

Leu Thr Arg Gln Asn Pro Tyr Thr Lys Thr Thr Leu Ala Glu Asp Pro

175 180 185 190

Ala Val Leu Ser Val Glu Leu Asn Asn Glu Ser Ala Leu Leu Phe Glu

195 200 205

Asn Leu Asn Trp Ile Asp Thr Leu Pro Ala Pro Tyr Lys Arg Glu Leu

210 215 220

Thr Ala Leu Trp Asn Asp Phe Leu Ser Arg Lys Tyr Lys Asn Asp Lys

225 230 235

Ala Leu Leu Ala Ala Trp Asn Arg Asp Thr Ser Leu Pro Gly Ala Ser

240 245 250

Leu Leu Asn Pro Glu Gly Arg Trp Gly Phe Glu Gln Pro Asp Ala Leu

255 260 265 270

Lys Val Phe Arg Asn Thr Ala Asp Ser Val Ser Ala Thr Val Thr Arg

275 280 285

Arg Ser Asn Gln Asp Trp Gln Ile Gln Phe Gln Arg Ser Gly Leu Ser

290 295 300

Leu Glu Asn Gly Lys Thr Tyr Thr Leu Glu Phe Asp Val Arg Gly Glu

305 310 315

Gly Asp Pro Ile Arg Ile Val Leu Ser Gln Asp Arg Pro Asp Trp His

320 325 330

Asn Cys Gly Leu Glu Ala Ser Leu Ser Leu Thr Ser Glu Trp Arg His

335 340 345 350

Gln Arg Tyr Ser Phe Gln Ala Lys Asn Ala Asp Pro Gly His Val Arg

355 360 365

Ile Ser Phe Gly Val Gly His Ala Arg Lys Val Glu Ile Ala Ala Val

370 375 380

Arg Leu Phe Pro Gly Thr Lys Pro Val Ser Ala Arg Leu Ser Ser Gly

385 390 395

Ser Ile Pro Leu Pro Val Ala Pro Asn Asp Ala Met Ser Ala Asp Leu

400 405 410

Leu Glu Phe Met Val Glu Leu Asp Thr Arg Tyr Ala Glu Glu Met Leu

415 420 425 430

Asp Tyr Leu Arg Lys Asp Leu Asn Val Lys Ser Leu Val Ile Asp Thr

435 440 445

Gln Ile Asp Trp Gly Gly Leu Ser Gly Leu Arg Arg Glu Lys Arg Met

450 455 460

Asp Tyr Val Asp Ala His Ala Tyr Trp Gly His Pro Glu Phe Thr Gly

465 470 475

Gly Ser Trp Glu Phe Lys Pro Gly Cys Trp Lys Ile Leu Asn Gln Ser

480 485 490

Gln Ile Pro Arg Ile Val His Gly Gly Trp Cys Pro Leu Glu Gln Phe

495 500 505 510

Ser Arg Tyr Arg Ile Ser Thr Lys Pro Phe Ser Ile Ser Glu His Asp

515 520 525

Tyr Pro Tyr Pro His Asp Tyr Ala Val Glu Met Met Pro Leu Leu Val

530 535 540

Ser Val Ala Leu Arg Gln Asp Trp Asp Met Leu Gln Leu Phe Ile His

545 550 555

Gly Thr Phe Leu Thr Arg Gly Lys Ser Ala Gly Ile Ser His Met Phe

560 565 570

Asp Gln Thr Asn His Pro Gly Lys Ile Gly Phe Phe Pro Ala Ala Ala

575 580 585 590

Leu Ile Phe Arg Arg Gly Met Phe Glu Pro Ala Pro Lys Thr Val Glu

595 600 605

Leu Arg Leu Pro Glu Gln Pro Trp Arg Trp Phe Gly Asn Arg Phe Asp

610 615 620

Arg Ala Trp Ala Glu Thr Gly Val Arg Arg Ser Leu Leu Asp Ser Arg

625 630 635

Met Thr Ile Val Pro Asp Ala Leu Lys Thr Pro Gly Arg Ala Glu Ala

640 645 650

Cys Val Ser Ala Pro Asp Glu Pro Asp Arg Pro Met Arg Gly Trp Thr

655 660 665 670

Glu Gly Glu Lys Asn Phe Phe Thr Ala Val Ala Pro Gln Cys Ile Val

675 680 685

Leu Cys Gly His Phe Gly Gly Arg Thr Met Asp Val Gly Asp Leu Arg

690 695 700

Leu Arg Ala Arg Pro Phe Pro Gly Asp Phe Gly Ala Ala Val Leu Val

705 710 715

Ser Arg Asp Glu Arg Pro Leu Pro Ala Ser Gly Asp Ile Leu Phe Thr

720 725 730

Ile Ala Gly Arg Phe Glu Asn Ser Gly Val Ile Trp Asn Lys Glu Arg

735 740 745 750

Asp Ala Leu Leu Asn Arg Ser Pro Trp Trp Gly Asn Pro Pro Val Leu

755 760 765

Gly Thr Lys Thr Asp Ala Ala Ile Arg Phe Lys Thr Asp Gly Pro Arg

770 775 780

Thr Val Tyr Ala Leu Asp Ser Asn Gly Lys Arg Thr Ala Glu Leu Pro

785 790 795

Ser Ala Trp Lys Asp Gly His Leu Ser Phe His Val His Pro Ser His

800 805 810

Arg Ser Met His Tyr Glu Ile Val Lys Gly Glu Asn Leu

815 820 825

<210> 13

<211> 2712

<212> DNA

<213> 闪烁杆菌属细菌

<400> 13

atgcggtggt ggatgttggt catcttggcg ttcatctctg gctttggggg ttggtggact 60

atgaggcaag ggttatcgca ggaaggcaaa caggatgcct tgcttttccc tttcgtttta 120

ccttgggacg atgcttctcc atcggtcacc aacatcagtc actggttgca caaacctgct 180

ggcaagtttg ggcatatccg tatcggcgct gacggtcgcc tttacgctgg caagcagcga 240

attcgtttcc tgggcgtgaa cttgtgtttc ggggcatgtt tcccgcgcaa agaggactct 300

gaaaaaattg cggcaaggat ggcgaagttc ggcatcaaca ttgttcgctt ccaccacatg 360

gacatgcaag aatttcccaa cggcatccgc cgtcggggcg tcccccacac ccgcgacctt 420

gaccctgaag cccttgacag acttgactac ctgattgccc aactgaaacg caacggcatc 480

tatgtcaact tgaacttgct cgtttcccgt cccttcaatg ccgccgacgg tttgcccaaa 540

gaaattgagc aactcggttg gaaggagcga cacatcgttg gcttcttcta cgaaccatgc 600

cttgagttgc aaaaggaata tgctcgcaag ttgctgacgc accgcaatcc ttacacgggg 660

ctcacctatg ctgaagaccc tgtcgtcgct ttcgtggaaa tcaacaacga gaacggtctc 720

attcacgctt ggcttagtgg ctctattgac cggatgccaa aagtttttca ggatgagttg 780

caacggcagt ggcatgcttg gctgaaagcc cgatacggca caacggagaa gttgcgcaaa 840

gcgtggggtg tcaaggaaga gcccttgggc aatgaaatgc tgaggaacac gaactttgag 900

gcagggttgc aaaattgggt tttggagcga cacgcgggtg ctgaagcaac agcggaagtt 960

gtcgctgaac ccatccctga actcaaaggt cttcgcttcg tccgcatcaa tgtcaccaaa 1020

cgaggacaag caggctggca tgtccaattc catcaaccga acctgaaagt ccaacccgac 1080

cgaccatata cgctttcctt ctgggcgcga gcggaacgac cttgcaccat ttcagtcgga 1140

atttcgcaag cccacgaacc ttggcagaac cttggcttca gtgccgaagt caaattgaca 1200

caggaatggc gtgaatatcg gttcaccttt accctcaaca ggggtgacga caacgctcgc 1260

gttatcttca gcaacttggg cgctcaaacg acaacttact ggttcgccgc cccctccctt 1320

cgccctggcg gaattgttgg cttggcagcc aacgaacgcc ttgaagatgg cactgtcccg 1380

attttccttc gcgctcgttt cggtgagcgc acacccgaag cgcaacggga ctggatgcga 1440

tttttgtggg agacggaaga tcgctattgg caaacaatct accgctacct caaggacgag 1500

ttggaagtta aggcattggt catcggcaca atcgtcggat gcagcacacc caacatgatg 1560

gcaaaacttg actgcgtgga cacacacgct tattggcaac atccgatgtt cccctcccga 1620

ccttgggatc ctgaggattg gattgtgccc aaccgaacga tggtcaacga acgaggcggg 1680

acgctgccag gtctggcgct gcgacgggtc ttaggcaaac ctcactccgt caccgaatac 1740

aatcatccag caccaaacac atactgcagc gaagccttcc ttttgctggc agcatatgca 1800

gccttgcagg attgggatgc tatctacgcc ttcagttact cgcaccgacg agatggttgg 1860

gacttaaggc gcattcccaa cttctttgac attgaccaac atcccacgaa gatggttacc 1920

cttatccctg cagcagcgat gtttgttcgg ggcgatgtga agcctgccaa gcagcaagtg 1980

gttgtcaggt tgacgaaaga gcaagaggtt gacttgttgc ggcgcagttg ggcttggttg 2040

ctcgtccacg caggtcatgt cggagttccc aacgaagcag cactcgtcca tcgggttgca 2100

attgcgacag atgggaagcg agttccgcca actgctctca agcccgaaca agtgaaaatt 2160

ggcggcaacc gatttgtgtc cgacactggc gaattgattt gggacttgac ggaaaaaggg 2220

cgcggggttg tcatcgttaa cgcccaaaac agcaaagccg ttatcgggtt cgtaggtggc 2280

aagcggtttg agttgagcag cgtcgtgatt gaacctgggc aaactatgca agacggttgg 2340

tgcgccatca cagtcacggc gatggaaggg aacttgccaa ctcgtccctt gcttcgtatc 2400

cttcgtccca tccgtttgct catcactgct acaggctacg cagagaacac cgacatgggt 2460

tggaaagaag ttcccggtta cccacccaaa tcaagttgcg gtcgcaactg gggcaaacca 2520

ccttcgttgg tggaaggcat ctctgccagc atcaccttgc cgttacccgc caagcgagtg 2580

caagcgtggg ctttggacga acggggtcaa cggaaatccc aaatcccagt cactgccgac 2640

ccatcaggca acgccgtcat ccgcatcagt ccccaatggc aaacgctttg gtatgaagtt 2700

gaggcgcggt aa 2712

<210> 14

<211> 903

<212> PRT

<213> 闪烁杆菌属细菌

<400> 14

Met Arg Trp Trp Met Leu Val Ile Leu Ala Phe Ile Ser Gly Phe Gly

1 5 10 15

Gly Trp Trp Thr Met Arg Gln Gly Leu Ser Gln Glu Gly Lys Gln Asp

20 25 30

Ala Leu Leu Phe Pro Phe Val Leu Pro Trp Asp Asp Ala Ser Pro Ser

35 40 45

Val Thr Asn Ile Ser His Trp Leu His Lys Pro Ala Gly Lys Phe Gly

50 55 60

His Ile Arg Ile Gly Ala Asp Gly Arg Leu Tyr Ala Gly Lys Gln Arg

65 70 75 80

Ile Arg Phe Leu Gly Val Asn Leu Cys Phe Gly Ala Cys Phe Pro Arg

85 90 95

Lys Glu Asp Ser Glu Lys Ile Ala Ala Arg Met Ala Lys Phe Gly Ile

100 105 110

Asn Ile Val Arg Phe His His Met Asp Met Gln Glu Phe Pro Asn Gly

115 120 125

Ile Arg Arg Arg Gly Val Pro His Thr Arg Asp Leu Asp Pro Glu Ala

130 135 140

Leu Asp Arg Leu Asp Tyr Leu Ile Ala Gln Leu Lys Arg Asn Gly Ile

145 150 155 160

Tyr Val Asn Leu Asn Leu Leu Val Ser Arg Pro Phe Asn Ala Ala Asp

165 170 175

Gly Leu Pro Lys Glu Ile Glu Gln Leu Gly Trp Lys Glu Arg His Ile

180 185 190

Val Gly Phe Phe Tyr Glu Pro Cys Leu Glu Leu Gln Lys Glu Tyr Ala

195 200 205

Arg Lys Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr Tyr Ala

210 215 220

Glu Asp Pro Val Val Ala Phe Val Glu Ile Asn Asn Glu Asn Gly Leu

225 230 235 240

Ile His Ala Trp Leu Ser Gly Ser Ile Asp Arg Met Pro Lys Val Phe

245 250 255

Gln Asp Glu Leu Gln Arg Gln Trp His Ala Trp Leu Lys Ala Arg Tyr

260 265 270

Gly Thr Thr Glu Lys Leu Arg Lys Ala Trp Gly Val Lys Glu Glu Pro

275 280 285

Leu Gly Asn Glu Met Leu Arg Asn Thr Asn Phe Glu Ala Gly Leu Gln

290 295 300

Asn Trp Val Leu Glu Arg His Ala Gly Ala Glu Ala Thr Ala Glu Val

305 310 315 320

Val Ala Glu Pro Ile Pro Glu Leu Lys Gly Leu Arg Phe Val Arg Ile

325 330 335

Asn Val Thr Lys Arg Gly Gln Ala Gly Trp His Val Gln Phe His Gln

340 345 350

Pro Asn Leu Lys Val Gln Pro Asp Arg Pro Tyr Thr Leu Ser Phe Trp

355 360 365

Ala Arg Ala Glu Arg Pro Cys Thr Ile Ser Val Gly Ile Ser Gln Ala

370 375 380

His Glu Pro Trp Gln Asn Leu Gly Phe Ser Ala Glu Val Lys Leu Thr

385 390 395 400

Gln Glu Trp Arg Glu Tyr Arg Phe Thr Phe Thr Leu Asn Arg Gly Asp

405 410 415

Asp Asn Ala Arg Val Ile Phe Ser Asn Leu Gly Ala Gln Thr Thr Thr

420 425 430

Tyr Trp Phe Ala Ala Pro Ser Leu Arg Pro Gly Gly Ile Val Gly Leu

435 440 445

Ala Ala Asn Glu Arg Leu Glu Asp Gly Thr Val Pro Ile Phe Leu Arg

450 455 460

Ala Arg Phe Gly Glu Arg Thr Pro Glu Ala Gln Arg Asp Trp Met Arg

465 470 475 480

Phe Leu Trp Glu Thr Glu Asp Arg Tyr Trp Gln Thr Ile Tyr Arg Tyr

485 490 495

Leu Lys Asp Glu Leu Glu Val Lys Ala Leu Val Ile Gly Thr Ile Val

500 505 510

Gly Cys Ser Thr Pro Asn Met Met Ala Lys Leu Asp Cys Val Asp Thr

515 520 525

His Ala Tyr Trp Gln His Pro Met Phe Pro Ser Arg Pro Trp Asp Pro

530 535 540

Glu Asp Trp Ile Val Pro Asn Arg Thr Met Val Asn Glu Arg Gly Gly

545 550 555 560

Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Leu Gly Lys Pro His Ser

565 570 575

Val Thr Glu Tyr Asn His Pro Ala Pro Asn Thr Tyr Cys Ser Glu Ala

580 585 590

Phe Leu Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp Trp Asp Ala Ile

595 600 605

Tyr Ala Phe Ser Tyr Ser His Arg Arg Asp Gly Trp Asp Leu Arg Arg

610 615 620

Ile Pro Asn Phe Phe Asp Ile Asp Gln His Pro Thr Lys Met Val Thr

625 630 635 640

Leu Ile Pro Ala Ala Ala Met Phe Val Arg Gly Asp Val Lys Pro Ala

645 650 655

Lys Gln Gln Val Val Val Arg Leu Thr Lys Glu Gln Glu Val Asp Leu

660 665 670

Leu Arg Arg Ser Trp Ala Trp Leu Leu Val His Ala Gly His Val Gly

675 680 685

Val Pro Asn Glu Ala Ala Leu Val His Arg Val Ala Ile Ala Thr Asp

690 695 700

Gly Lys Arg Val Pro Pro Thr Ala Leu Lys Pro Glu Gln Val Lys Ile

705 710 715 720

Gly Gly Asn Arg Phe Val Ser Asp Thr Gly Glu Leu Ile Trp Asp Leu

725 730 735

Thr Glu Lys Gly Arg Gly Val Val Ile Val Asn Ala Gln Asn Ser Lys

740 745 750

Ala Val Ile Gly Phe Val Gly Gly Lys Arg Phe Glu Leu Ser Ser Val

755 760 765

Val Ile Glu Pro Gly Gln Thr Met Gln Asp Gly Trp Cys Ala Ile Thr

770 775 780

Val Thr Ala Met Glu Gly Asn Leu Pro Thr Arg Pro Leu Leu Arg Ile

785 790 795 800

Leu Arg Pro Ile Arg Leu Leu Ile Thr Ala Thr Gly Tyr Ala Glu Asn

805 810 815

Thr Asp Met Gly Trp Lys Glu Val Pro Gly Tyr Pro Pro Lys Ser Ser

820 825 830

Cys Gly Arg Asn Trp Gly Lys Pro Pro Ser Leu Val Glu Gly Ile Ser

835 840 845

Ala Ser Ile Thr Leu Pro Leu Pro Ala Lys Arg Val Gln Ala Trp Ala

850 855 860

Leu Asp Glu Arg Gly Gln Arg Lys Ser Gln Ile Pro Val Thr Ala Asp

865 870 875 880

Pro Ser Gly Asn Ala Val Ile Arg Ile Ser Pro Gln Trp Gln Thr Leu

885 890 895

Trp Tyr Glu Val Glu Ala Arg

900

<210> 15

<211> 2799

<212> DNA

<213> 丰佑菌科细菌

<400> 15

atgttccccc cgatcgtccg aagcagcttt tacctcctcc ttgccgccgc gctgatcccg 60

gcctccgtca ccaccgcgcc tgccgcgacg cctgcggatg atctcccttt tgccaacggt 120

ttcccctttc acatccctcc caccggcacc gtcgccggca cggcgcccgc cgccctcgcc 180

atccccgctc gtcccgccgg agccgacggt cgggtcatcg tccgcggcga ccagttcctc 240

cttgccgata ccgggacccc catccgtttc tggggcgtca acctctgctt ctccggcgct 300

ttccccgacc acgccaccgc cgaccgcatc gccgcccgtc tcgccagtct cggcgtcaac 360

atcgtccgct tccaccacat cgaccagcgc cgctttcccg gcggcctgtg gcatcgcgat 420

tcccccggcg ccaccaacaa cccccgcgag gacaacatcg cgcaccgcac gctcgacccc 480

gaagcgctcg accgcctcga ctacctcgtc gcccgactca aggaacacgg catctacacc 540

aacctcaacc tgaaggtctc ccggatcttc agcaccttcg acgatcccgc gttcccggcc 600

cccgcgcctg gcgaaatcct tccgaagaaa ggcaaaggct tcgaccagtt ttacacgccc 660

gccatcgaag cgcagaaagc ctacgcccgc ctcctcctca cccgtcgcaa tgcctggacc 720

ggcctgacct gggccgaaga ccccgccgtc gcccaggtcg agatcaacaa cgaaaacggc 780

atcctctggg cctggaacta caacctgctc gatcgcctgc ccgcccccta cctcgccgag 840

ctcgccgcgc gctggaacac ctggctgcgc gcccgttaca cggacaccgc ggctctccgg 900

acagcctggg atccggcgag tggcgcgggc gtctcgcccg catccgacgt ggcacgggca 960

tccctgcccg tgagcgttgc ctcccggccc acctccgccg ccggtaacgc aaacgccgcc 1020

gccgcggacg ccgacctcct cgccgggatc agcccggctc ttttcaccgc gaagaaagcc 1080

cgggccacgc ttgcgcccct gcccgcgccc gacaccggcg atgccgacgc cgccgaatcc 1140

gccggcctgc gcctggccgt caacaacgtc cccggcgacg caacctggaa cgtccgttgc 1200

agttactccc tcacgcttcc cgcgctttcc tccggtgcgc cctggaccgt cacccttcgc 1260

cttcgcgcca acaaacccga aaaaatccgt ctgcgcctcc gttcccccga gcaaaacaag 1320

gatatcgccc cgccccgcac gctcaatctc gccaccacct ggaagaccca caccgtcact 1380

tttgccatcc ccgagcatgc cgctcccctc gccgcgcaac tgacgctcga agccggcctc 1440

cccggcctcg ttctcgacat cgcctccgcc agcctccgct cccacacccg ttcggggctc 1500

ccgcgcggcg agggacttgc ctccgacgag cgccccgtca cctggattcc gcgccgcgac 1560

ctctccgggc gaaccgatgc cgtcgtccgc gatgtcatgc acttcctgcg cgacaccgag 1620

atcgcctact ggcgtgaaat gcacgcgttc cttcgtgatg aactccgcgt cgccgctccc 1680

atcacgacca cggccgtcgg ttacaccacg tcgcagatcg ccgccgaaac cgctgacttc 1740

atcgacaccc atcgctactg gggcgcgcct cgctttcccg gtttcaaccg cagcaaaccc 1800

tggaccgtcg aacaaaaagc catggtcgcc cgtcccggcg aatccgccat cgaacgcatg 1860

gccgcccgcc gcgtcttcgg cctccctttc accgtcaccg aatacaacca cccgccctcc 1920

agcgatcacc acgccgaagg cttccccctc ctcgccctct ggggcgctgc gcaggattgg 1980

aacggcctct tcgaattcgc ctactcccac agcgacgcct gggaaagcga caccatgacc 2040

ggcttcttcg acaccgctcc caaccctgtt cacaccgtcg ccgctctcgc cgcctccgac 2100

ctcttccgca accgccgcct cgcccccctc gctcccgcga aatccggata cgtgcccctc 2160

gatcgccagc tcgaacggca aaacaacgac accttccctc gcctcatcga ggccgacgcc 2220

gttttcggcg gactcccgcc cgacgcctgg ctcgccaatc gtgtcggcct cgttcgccgc 2280

gccgatgaac agccggaaac gctcccgccg ccgccggcca gccagcaact cgcctggacc 2340

gccaccgatc ccgccaccgc ccacgtccgc tacacaggcg agggcgtcgc cggcctcgtc 2400

ggcttcgttt ccggccagac cctcgatctc ggctggctcc gtatcacccc cggagataca 2460

tcgctcggcg gtttttccgt cgtcatgctc aactccgtgg acggtcagcc cctcggcgca 2520

tccggccgct atctgctcac cacggcggtg cgcgccgcca accgcggcat gggctggaac 2580

gccgaccgca ccggcttcga caaaaaatgg ggatccggcc ccgcccaggc cgaatccgct 2640

ccggtcacgc tcgacttcgc ctccgcctcc ggcgtccgtg tgtatccgct gaatcccgac 2700

ggaacacgcc gcccggaact cccgcccgcc tccaccccgg gccgcttcga agccacaccc 2760

gccagcaaaa ccctctggtt tgaaatcaca ttcccgtaa 2799

<210> 16

<211> 932

<212> PRT

<213> 丰佑菌科细菌

<400> 16

Met Phe Pro Pro Ile Val Arg Ser Ser Phe Tyr Leu Leu Leu Ala Ala

1 5 10 15

Ala Leu Ile Pro Ala Ser Val Thr Thr Ala Pro Ala Ala Thr Pro Ala

20 25 30

Asp Asp Leu Pro Phe Ala Asn Gly Phe Pro Phe His Ile Pro Pro Thr

35 40 45

Gly Thr Val Ala Gly Thr Ala Pro Ala Ala Leu Ala Ile Pro Ala Arg

50 55 60

Pro Ala Gly Ala Asp Gly Arg Val Ile Val Arg Gly Asp Gln Phe Leu

65 70 75 80

Leu Ala Asp Thr Gly Thr Pro Ile Arg Phe Trp Gly Val Asn Leu Cys

85 90 95

Phe Ser Gly Ala Phe Pro Asp His Ala Thr Ala Asp Arg Ile Ala Ala

100 105 110

Arg Leu Ala Ser Leu Gly Val Asn Ile Val Arg Phe His His Ile Asp

115 120 125

Gln Arg Arg Phe Pro Gly Gly Leu Trp His Arg Asp Ser Pro Gly Ala

130 135 140

Thr Asn Asn Pro Arg Glu Asp Asn Ile Ala His Arg Thr Leu Asp Pro

145 150 155 160

Glu Ala Leu Asp Arg Leu Asp Tyr Leu Val Ala Arg Leu Lys Glu His

165 170 175

Gly Ile Tyr Thr Asn Leu Asn Leu Lys Val Ser Arg Ile Phe Ser Thr

180 185 190

Phe Asp Asp Pro Ala Phe Pro Ala Pro Ala Pro Gly Glu Ile Leu Pro

195 200 205

Lys Lys Gly Lys Gly Phe Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala

210 215 220

Gln Lys Ala Tyr Ala Arg Leu Leu Leu Thr Arg Arg Asn Ala Trp Thr

225 230 235 240

Gly Leu Thr Trp Ala Glu Asp Pro Ala Val Ala Gln Val Glu Ile Asn

245 250 255

Asn Glu Asn Gly Ile Leu Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg

260 265 270

Leu Pro Ala Pro Tyr Leu Ala Glu Leu Ala Ala Arg Trp Asn Thr Trp

275 280 285

Leu Arg Ala Arg Tyr Thr Asp Thr Ala Ala Leu Arg Thr Ala Trp Asp

290 295 300

Pro Ala Ser Gly Ala Gly Val Ser Pro Ala Ser Asp Val Ala Arg Ala

305 310 315 320

Ser Leu Pro Val Ser Val Ala Ser Arg Pro Thr Ser Ala Ala Gly Asn

325 330 335

Ala Asn Ala Ala Ala Ala Asp Ala Asp Leu Leu Ala Gly Ile Ser Pro

340 345 350

Ala Leu Phe Thr Ala Lys Lys Ala Arg Ala Thr Leu Ala Pro Leu Pro

355 360 365

Ala Pro Asp Thr Gly Asp Ala Asp Ala Ala Glu Ser Ala Gly Leu Arg

370 375 380

Leu Ala Val Asn Asn Val Pro Gly Asp Ala Thr Trp Asn Val Arg Cys

385 390 395 400

Ser Tyr Ser Leu Thr Leu Pro Ala Leu Ser Ser Gly Ala Pro Trp Thr

405 410 415

Val Thr Leu Arg Leu Arg Ala Asn Lys Pro Glu Lys Ile Arg Leu Arg

420 425 430

Leu Arg Ser Pro Glu Gln Asn Lys Asp Ile Ala Pro Pro Arg Thr Leu

435 440 445

Asn Leu Ala Thr Thr Trp Lys Thr His Thr Val Thr Phe Ala Ile Pro

450 455 460

Glu His Ala Ala Pro Leu Ala Ala Gln Leu Thr Leu Glu Ala Gly Leu

465 470 475 480

Pro Gly Leu Val Leu Asp Ile Ala Ser Ala Ser Leu Arg Ser His Thr

485 490 495

Arg Ser Gly Leu Pro Arg Gly Glu Gly Leu Ala Ser Asp Glu Arg Pro

500 505 510

Val Thr Trp Ile Pro Arg Arg Asp Leu Ser Gly Arg Thr Asp Ala Val

515 520 525

Val Arg Asp Val Met His Phe Leu Arg Asp Thr Glu Ile Ala Tyr Trp

530 535 540

Arg Glu Met His Ala Phe Leu Arg Asp Glu Leu Arg Val Ala Ala Pro

545 550 555 560

Ile Thr Thr Thr Ala Val Gly Tyr Thr Thr Ser Gln Ile Ala Ala Glu

565 570 575

Thr Ala Asp Phe Ile Asp Thr His Arg Tyr Trp Gly Ala Pro Arg Phe

580 585 590

Pro Gly Phe Asn Arg Ser Lys Pro Trp Thr Val Glu Gln Lys Ala Met

595 600 605

Val Ala Arg Pro Gly Glu Ser Ala Ile Glu Arg Met Ala Ala Arg Arg

610 615 620

Val Phe Gly Leu Pro Phe Thr Val Thr Glu Tyr Asn His Pro Pro Ser

625 630 635 640

Ser Asp His His Ala Glu Gly Phe Pro Leu Leu Ala Leu Trp Gly Ala

645 650 655

Ala Gln Asp Trp Asn Gly Leu Phe Glu Phe Ala Tyr Ser His Ser Asp

660 665 670

Ala Trp Glu Ser Asp Thr Met Thr Gly Phe Phe Asp Thr Ala Pro Asn

675 680 685

Pro Val His Thr Val Ala Ala Leu Ala Ala Ser Asp Leu Phe Arg Asn

690 695 700

Arg Arg Leu Ala Pro Leu Ala Pro Ala Lys Ser Gly Tyr Val Pro Leu

705 710 715 720

Asp Arg Gln Leu Glu Arg Gln Asn Asn Asp Thr Phe Pro Arg Leu Ile

725 730 735

Glu Ala Asp Ala Val Phe Gly Gly Leu Pro Pro Asp Ala Trp Leu Ala

740 745 750

Asn Arg Val Gly Leu Val Arg Arg Ala Asp Glu Gln Pro Glu Thr Leu

755 760 765

Pro Pro Pro Pro Ala Ser Gln Gln Leu Ala Trp Thr Ala Thr Asp Pro

770 775 780

Ala Thr Ala His Val Arg Tyr Thr Gly Glu Gly Val Ala Gly Leu Val

785 790 795 800

Gly Phe Val Ser Gly Gln Thr Leu Asp Leu Gly Trp Leu Arg Ile Thr

805 810 815

Pro Gly Asp Thr Ser Leu Gly Gly Phe Ser Val Val Met Leu Asn Ser

820 825 830

Val Asp Gly Gln Pro Leu Gly Ala Ser Gly Arg Tyr Leu Leu Thr Thr

835 840 845

Ala Val Arg Ala Ala Asn Arg Gly Met Gly Trp Asn Ala Asp Arg Thr

850 855 860

Gly Phe Asp Lys Lys Trp Gly Ser Gly Pro Ala Gln Ala Glu Ser Ala

865 870 875 880

Pro Val Thr Leu Asp Phe Ala Ser Ala Ser Gly Val Arg Val Tyr Pro

885 890 895

Leu Asn Pro Asp Gly Thr Arg Arg Pro Glu Leu Pro Pro Ala Ser Thr

900 905 910

Pro Gly Arg Phe Glu Ala Thr Pro Ala Ser Lys Thr Leu Trp Phe Glu

915 920 925

Ile Thr Phe Pro

930

<210> 17

<211> 2763

<212> DNA

<213> 丰佑菌科细菌

<400> 17

atgatcgccc atcgccccct gtttctcgtc tgtcgcctcc tgttcagcgg actggttgcc 60

tgttgcattt ccccaaacct cctgaacgcc gcctccccgc ccggcctctt tcccttcacc 120

atcgcctggg actctccgcc caccgccgtc acggacgcca gcgtcgctga tctcaccggc 180

tggctcgacg cccccgcagg caaacacggc tacatccgcg ccgaaggctc cgacttcatc 240

accaccgaca ccggccaacg catccgtttt ctcggcgtca acctcgcctt tgccgccaat 300

ttccccgagc acgccgacgc cgaaaaactc gccgcccgcc tcgcccgcct cggcgtcaac 360

tgcgtccgct tccaccacat ggacaggacc ggtctcctgc gcaacgccgc cggtcgccgc 420

tccagcatct ggagcgaaaa cgccgacggc cagaccctcg atcccgcgca actcgaccgc 480

ctcgactacc tcttcgccca actcaaggcg cgcggcattt acgccaacat caacctccac 540

gtctcccgca cctaccccgg tttccccgcc ggctccagat accacaaggc gctcgacatg 600

tttgtccccg gcatgatcgc cctccagaaa caatacgccc gcgacctcct gcatcacaaa 660

aacaactaca ccgggctccg ctacgccgac gaccccgccg tggccatcgt cgaaatcaac 720

aacgaaaacg gagtcgttgg acgctggtgg cgcggcaacc tcgacacgct cgatccgctt 780

tacgttggcg aactcaacac ccgctggaac gcttggctca cccgcaacca cggctcacct 840

gccgccgcgc tcgtcgcctg gaaaaacgcc gccgccgccg attccacgcc caccggcccc 900

gaactcctca aaaatcaccg tctcgccaat ctcgccaaaa actggacgct ccaaaactcc 960

tccccctccc ccctgctcgc cctcgaaccg cccgccagcc ccggccccgg catcgaaccg 1020

caaggcatcg tcctgcgcgt cctccccgac gctgccaaaa actcccgcgc ctcccttttg 1080

caacccgtct ccctcaagcc cggcgcgcgc cacaccttgc gcatcaccct cgaggccgat 1140

tctcccgccg aactcatcct cgacatcaag gacgcgcgtc cgccctggcg cacccacctc 1200

tccataaaaa ttcccgccac cgacaccctt cgtaccgtcg aaaacacctt cgtctataag 1260

gaaaacgccc cggcctccgg catccgcctc gccctcaacc tccgcgccac cgccagcccc 1320

gcctcgaaca atttccgcgt tcaggaaatc tcgctccgcg aaggcggctc ctccgcgaaa 1380

ctccccgcct tcgttgacgc ggaaaacgcc aacaattccg ccaacgccgc cgcttccgcc 1440

gccgctccca cttcggcgca ccgcgccctc gcctacctcc gtcgcgacgg ctttgaaacc 1500

ttctcgcccg ccgcctgcga cgactggctc cgcttcctct gggaaaccga ggacgactac 1560

tggaccgaca tgcgcgaata cctccgccgc gacctcggca tccgctccat actcgtcggc 1620

tcacaactcg gcgcctacag cctgctcccc ctccagcaga aattcgacgc ccttgaccac 1680

cacgcctact ggcagcaccc gcaaacccag gacaacgggc gcaggatcgt ccaaaacctc 1740

tccatggtca acgagcccgg cggagcctac gccgcctcgc ccgcgtttta ccgcgctgcc 1800

ggaaagccgt atctgctcac cgaatacaat cactcgtcgc ccaacacctt tggcgcggag 1860

gccttcccca tcatctccgc ctacggcgcg ttccaggact ggagcggcat cttcgtttac 1920

tcttacgcgc acggcaccgc gccgtgggac gccggatacc agcgcggcca gttcgacatt 1980

gaccagcatc ccctcaagct tgcgaccctt cccattgccg ccgccctttt cctgcgtggc 2040

gacaccgacg cccctgcggg tgtcaccacc aaaaccacca ccatcactcc ggaggaatac 2100

ctgcgccaga tgcgccgtgt cggccccaac gtttcggcga tcaccgccgg agccacccgc 2160

accgacgccc ttcgccaccg cgtcgccttc gccctcgccg aaaacaaaag tggcgcgggc 2220

gtcccgcccg caaccgttgc cactccgtct gccggaccca tcaccaccga gggcggcgca 2280

ctcacttggg acgccgcgcc caacgcgggc attttcacca ttcgctcacc tcgcaccaag 2340

gcagccatcg gcttcgcctg cggacgctcc tttgacctcg acggcctcgt cattacgccc 2400

ggccaaaccc tccaggactg gtcaaccatt gccgtctccc aaatgagcgg cgaccgcgtc 2460

ggctctcccg gacgcgccct gctcgtcgcc tgcggctaca tcgaaaacac cgggcaaatc 2520

tggcacgacc ccgtagccaa aaacagcgtc aaggaatcgg gtcgcgcccc aacgctcgtc 2580

gagggcattc ccgcgaaaat caccctcact cccgcccccg gcgtcaccgc cgtcgaagtc 2640

tggtcgctcg acgaacacgg acgccgcgcc cgctccgtcc ccgtcacccg cgatggcccc 2700

gccgccacct ttcacatcgg acccgattac cggaccatct ggtatgaagt catcactcaa 2760

taa 2763

<210> 18

<211> 920

<212> PRT

<213> 丰佑菌科细菌

<400> 18

Met Ile Ala His Arg Pro Leu Phe Leu Val Cys Arg Leu Leu Phe Ser

1 5 10 15

Gly Leu Val Ala Cys Cys Ile Ser Pro Asn Leu Leu Asn Ala Ala Ser

20 25 30

Pro Pro Gly Leu Phe Pro Phe Thr Ile Ala Trp Asp Ser Pro Pro Thr

35 40 45

Ala Val Thr Asp Ala Ser Val Ala Asp Leu Thr Gly Trp Leu Asp Ala

50 55 60

Pro Ala Gly Lys His Gly Tyr Ile Arg Ala Glu Gly Ser Asp Phe Ile

65 70 75 80

Thr Thr Asp Thr Gly Gln Arg Ile Arg Phe Leu Gly Val Asn Leu Ala

85 90 95

Phe Ala Ala Asn Phe Pro Glu His Ala Asp Ala Glu Lys Leu Ala Ala

100 105 110

Arg Leu Ala Arg Leu Gly Val Asn Cys Val Arg Phe His His Met Asp

115 120 125

Arg Thr Gly Leu Leu Arg Asn Ala Ala Gly Arg Arg Ser Ser Ile Trp

130 135 140

Ser Glu Asn Ala Asp Gly Gln Thr Leu Asp Pro Ala Gln Leu Asp Arg

145 150 155 160

Leu Asp Tyr Leu Phe Ala Gln Leu Lys Ala Arg Gly Ile Tyr Ala Asn

165 170 175

Ile Asn Leu His Val Ser Arg Thr Tyr Pro Gly Phe Pro Ala Gly Ser

180 185 190

Arg Tyr His Lys Ala Leu Asp Met Phe Val Pro Gly Met Ile Ala Leu

195 200 205

Gln Lys Gln Tyr Ala Arg Asp Leu Leu His His Lys Asn Asn Tyr Thr

210 215 220

Gly Leu Arg Tyr Ala Asp Asp Pro Ala Val Ala Ile Val Glu Ile Asn

225 230 235 240

Asn Glu Asn Gly Val Val Gly Arg Trp Trp Arg Gly Asn Leu Asp Thr

245 250 255

Leu Asp Pro Leu Tyr Val Gly Glu Leu Asn Thr Arg Trp Asn Ala Trp

260 265 270

Leu Thr Arg Asn His Gly Ser Pro Ala Ala Ala Leu Val Ala Trp Lys

275 280 285

Asn Ala Ala Ala Ala Asp Ser Thr Pro Thr Gly Pro Glu Leu Leu Lys

290 295 300

Asn His Arg Leu Ala Asn Leu Ala Lys Asn Trp Thr Leu Gln Asn Ser

305 310 315 320

Ser Pro Ser Pro Leu Leu Ala Leu Glu Pro Pro Ala Ser Pro Gly Pro

325 330 335

Gly Ile Glu Pro Gln Gly Ile Val Leu Arg Val Leu Pro Asp Ala Ala

340 345 350

Lys Asn Ser Arg Ala Ser Leu Leu Gln Pro Val Ser Leu Lys Pro Gly

355 360 365

Ala Arg His Thr Leu Arg Ile Thr Leu Glu Ala Asp Ser Pro Ala Glu

370 375 380

Leu Ile Leu Asp Ile Lys Asp Ala Arg Pro Pro Trp Arg Thr His Leu

385 390 395 400

Ser Ile Lys Ile Pro Ala Thr Asp Thr Leu Arg Thr Val Glu Asn Thr

405 410 415

Phe Val Tyr Lys Glu Asn Ala Pro Ala Ser Gly Ile Arg Leu Ala Leu

420 425 430

Asn Leu Arg Ala Thr Ala Ser Pro Ala Ser Asn Asn Phe Arg Val Gln

435 440 445

Glu Ile Ser Leu Arg Glu Gly Gly Ser Ser Ala Lys Leu Pro Ala Phe

450 455 460

Val Asp Ala Glu Asn Ala Asn Asn Ser Ala Asn Ala Ala Ala Ser Ala

465 470 475 480

Ala Ala Pro Thr Ser Ala His Arg Ala Leu Ala Tyr Leu Arg Arg Asp

485 490 495

Gly Phe Glu Thr Phe Ser Pro Ala Ala Cys Asp Asp Trp Leu Arg Phe

500 505 510

Leu Trp Glu Thr Glu Asp Asp Tyr Trp Thr Asp Met Arg Glu Tyr Leu

515 520 525

Arg Arg Asp Leu Gly Ile Arg Ser Ile Leu Val Gly Ser Gln Leu Gly

530 535 540

Ala Tyr Ser Leu Leu Pro Leu Gln Gln Lys Phe Asp Ala Leu Asp His

545 550 555 560

His Ala Tyr Trp Gln His Pro Gln Thr Gln Asp Asn Gly Arg Arg Ile

565 570 575

Val Gln Asn Leu Ser Met Val Asn Glu Pro Gly Gly Ala Tyr Ala Ala

580 585 590

Ser Pro Ala Phe Tyr Arg Ala Ala Gly Lys Pro Tyr Leu Leu Thr Glu

595 600 605

Tyr Asn His Ser Ser Pro Asn Thr Phe Gly Ala Glu Ala Phe Pro Ile

610 615 620

Ile Ser Ala Tyr Gly Ala Phe Gln Asp Trp Ser Gly Ile Phe Val Tyr

625 630 635 640

Ser Tyr Ala His Gly Thr Ala Pro Trp Asp Ala Gly Tyr Gln Arg Gly

645 650 655

Gln Phe Asp Ile Asp Gln His Pro Leu Lys Leu Ala Thr Leu Pro Ile

660 665 670

Ala Ala Ala Leu Phe Leu Arg Gly Asp Thr Asp Ala Pro Ala Gly Val

675 680 685

Thr Thr Lys Thr Thr Thr Ile Thr Pro Glu Glu Tyr Leu Arg Gln Met

690 695 700

Arg Arg Val Gly Pro Asn Val Ser Ala Ile Thr Ala Gly Ala Thr Arg

705 710 715 720

Thr Asp Ala Leu Arg His Arg Val Ala Phe Ala Leu Ala Glu Asn Lys

725 730 735

Ser Gly Ala Gly Val Pro Pro Ala Thr Val Ala Thr Pro Ser Ala Gly

740 745 750

Pro Ile Thr Thr Glu Gly Gly Ala Leu Thr Trp Asp Ala Ala Pro Asn

755 760 765

Ala Gly Ile Phe Thr Ile Arg Ser Pro Arg Thr Lys Ala Ala Ile Gly

770 775 780

Phe Ala Cys Gly Arg Ser Phe Asp Leu Asp Gly Leu Val Ile Thr Pro

785 790 795 800

Gly Gln Thr Leu Gln Asp Trp Ser Thr Ile Ala Val Ser Gln Met Ser

805 810 815

Gly Asp Arg Val Gly Ser Pro Gly Arg Ala Leu Leu Val Ala Cys Gly

820 825 830

Tyr Ile Glu Asn Thr Gly Gln Ile Trp His Asp Pro Val Ala Lys Asn

835 840 845

Ser Val Lys Glu Ser Gly Arg Ala Pro Thr Leu Val Glu Gly Ile Pro

850 855 860

Ala Lys Ile Thr Leu Thr Pro Ala Pro Gly Val Thr Ala Val Glu Val

865 870 875 880

Trp Ser Leu Asp Glu His Gly Arg Arg Ala Arg Ser Val Pro Val Thr

885 890 895

Arg Asp Gly Pro Ala Ala Thr Phe His Ile Gly Pro Asp Tyr Arg Thr

900 905 910

Ile Trp Tyr Glu Val Ile Thr Gln

915 920

<210> 19

<211> 2535

<212> DNA

<213> Paludibacterium yongneupense

<400> 19

atgacgctac gtttgcgcgt gctgctatgc ctgtttgcag cctgcggcgc gcatgccgcc 60

gacgcaccgc tgttccccta tcatttgccc tgggatgacg cttcgctgaa cctcagtaat 120

ctgcatgcct ggaatcctgc gcctgccggg cgttccggtt ttgtcggcgt ccgcaacggg 180

catctgtacg ccgagggccg ccgcctgcgc ttgctggggg tcaactgcgt attcggcggc 240

gcgctgcccg agcatgacgt cgccgagcgc atcgccgcgc gcatggcccg cttcggcatc 300

aatgccgtcc gcttccatca tatggacacc cggccggctc cggatggcct gctgctggcg 360

gaccgcctga ccttggatcc gaaagcactc gaccgtctcg actacttcat cgcggccctg 420

aaacgggtgg gcatttacag cgatctgaat ctgcatgtcg gtcgcagcta tccggggttc 480

gcaccctgga gcgacgcgca aggcaggccg cagcctcagt actggaaggg cgtcgacctg 540

ttctacccgc ccatgatcgc gatgcagcgc gattatgccc gcaccctgct gtcgcatcgc 600

aacccgtata ccgggcatca ataccgcgac gagcccgcgc tggcgctggt cgagatcaat 660

aatgaggacg gtttgatacg ggagtggcag gatggggcgc ttgaccgtat gagcgagccc 720

tatcgttccg aattaagaca gcgctggaat cgctggctgt cggcgcatta ccggtcgacc 780

gccgagctgg cccgcgcctg gagcgcacgt gacgacgtgc agggagacga gcgcttcgat 840

acgggtggca atggctggaa tctgcaggtg gtggagccgg cgcgtgcgcg ccagcagacg 900

gagggcgacg gctcgctgcg ggtgacggtc gaggcgacag acagcgagaa ctggcatgtg 960

cagctgcacc agctgcggca aagcttcgcg gccgggcaac cctacacctt gcgactgcgg 1020

ctgcgtgccg accgtccgct gcgggtgcgg ctggcggcga tgcaggcgca cccgccctgg 1080

cagtcgctgt ggcaaacggc ggtggatgtc gacacccgat ggcgcgacta tcgttttacc 1140

tttgcccccg tcgctgggga tggtgtggcg cgttttacgc tgggcggcct cggggaacag 1200

cgctccaccc tgtggttggg catggcgagc ctgaagacag gagggcgcct gggactgctg 1260

gctggcgagt cgctcgaggg gagcggagtc gacatctttg cgcgtggcga cgagggcgcc 1320

cgcagcgcgc aggggcagcg cgactggtta cagtttctat gggacacaga aacagaatac 1380

tgggatggca tgcgtaattt tctgcgccag accgtgggcc tgcgttcctt gctgattgga 1440

acgcaggtcg ggtatagccc ggccccgatc caggcgcgga tggatgtcgt ggatggccat 1500

gcttactggc agcatccgcg ctttcccggc cggccgtggg atcccgcaga ctggagtgtg 1560

gccaatacgc ccatggcggg catcgatggc ggcggcaccc tggccgacct ggctctgcgt 1620

cgcatggccg gcaagccttt tgtcgtcacc gagtacaatc atcccgcgcc gggtgagttc 1680

gtcgccgagg gactgccgct tctggccgcc tatgccgccc tgcaggactg ggatggcgta 1740

tttgttttcg attatggtgc cggcgatcac gatccgggtt tcattgcttc gtatttcgac 1800

attcaggccg atcccggcaa gatgagtgcg ctgccggccg cggccgcctt gttccggcgc 1860

ggtgacgttg cgacgcccgg gagcgcgggc ggcgccttac cttcgcccgc ggccatgatc 1920

gaggccatgc gtgccgggaa taccatgccg gcggcggatc agtttggcac cgcgcgcaac 1980

gaagcgctga ggcggccggt cgcgctcggc agcacgcctg ccggtccgcg gccgttaccg 2040

gtgcgtgcga tcggcgggca attggtatgg ggcgaggacg gccggaagac ggtcgtgatc 2100

gacactccgc gcagcaaggg attggtcggt gccggattgg gacgggacgt cgatgccggc 2160

ggcgtgggct tgcgtctgct gcaggcccgc cacaatagcg gcgtgctgct ggccacactg 2220

atggacgggc gtgacttttc gcacccgggc cgggttctgc tgacggcgat cggaagcgag 2280

gaaaacagcg ggcagcgctg gctggacgag gcgcacacca cgctcggacg gcaatggggg 2340

caggcgccgg tatgggtcga gggtattgcc gcccgcatcg tattgccggt cgcggcggcg 2400

cgggtcggcg cctgggcgct cgacgagcgc ggacaacggc ggcaggccct gccggtggct 2460

ggcgaccacg cgcatgcggt attcgaaacc agccccggct accgcgctct ttggtatgag 2520

cttgaaatcc gctga 2535

<210> 20

<211> 844

<212> PRT

<213> Paludibacterium yongneupense

<400> 20

Met Thr Leu Arg Leu Arg Val Leu Leu Cys Leu Phe Ala Ala Cys Gly

1 5 10 15

Ala His Ala Ala Asp Ala Pro Leu Phe Pro Tyr His Leu Pro Trp Asp

20 25 30

Asp Ala Ser Leu Asn Leu Ser Asn Leu His Ala Trp Asn Pro Ala Pro

35 40 45

Ala Gly Arg Ser Gly Phe Val Gly Val Arg Asn Gly His Leu Tyr Ala

50 55 60

Glu Gly Arg Arg Leu Arg Leu Leu Gly Val Asn Cys Val Phe Gly Gly

65 70 75 80

Ala Leu Pro Glu His Asp Val Ala Glu Arg Ile Ala Ala Arg Met Ala

85 90 95

Arg Phe Gly Ile Asn Ala Val Arg Phe His His Met Asp Thr Arg Pro

100 105 110

Ala Pro Asp Gly Leu Leu Leu Ala Asp Arg Leu Thr Leu Asp Pro Lys

115 120 125

Ala Leu Asp Arg Leu Asp Tyr Phe Ile Ala Ala Leu Lys Arg Val Gly

130 135 140

Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg Ser Tyr Pro Gly Phe

145 150 155 160

Ala Pro Trp Ser Asp Ala Gln Gly Arg Pro Gln Pro Gln Tyr Trp Lys

165 170 175

Gly Val Asp Leu Phe Tyr Pro Pro Met Ile Ala Met Gln Arg Asp Tyr

180 185 190

Ala Arg Thr Leu Leu Ser His Arg Asn Pro Tyr Thr Gly His Gln Tyr

195 200 205

Arg Asp Glu Pro Ala Leu Ala Leu Val Glu Ile Asn Asn Glu Asp Gly

210 215 220

Leu Ile Arg Glu Trp Gln Asp Gly Ala Leu Asp Arg Met Ser Glu Pro

225 230 235 240

Tyr Arg Ser Glu Leu Arg Gln Arg Trp Asn Arg Trp Leu Ser Ala His

245 250 255

Tyr Arg Ser Thr Ala Glu Leu Ala Arg Ala Trp Ser Ala Arg Asp Asp

260 265 270

Val Gln Gly Asp Glu Arg Phe Asp Thr Gly Gly Asn Gly Trp Asn Leu

275 280 285

Gln Val Val Glu Pro Ala Arg Ala Arg Gln Gln Thr Glu Gly Asp Gly

290 295 300

Ser Leu Arg Val Thr Val Glu Ala Thr Asp Ser Glu Asn Trp His Val

305 310 315 320

Gln Leu His Gln Leu Arg Gln Ser Phe Ala Ala Gly Gln Pro Tyr Thr

325 330 335

Leu Arg Leu Arg Leu Arg Ala Asp Arg Pro Leu Arg Val Arg Leu Ala

340 345 350

Ala Met Gln Ala His Pro Pro Trp Gln Ser Leu Trp Gln Thr Ala Val

355 360 365

Asp Val Asp Thr Arg Trp Arg Asp Tyr Arg Phe Thr Phe Ala Pro Val

370 375 380

Ala Gly Asp Gly Val Ala Arg Phe Thr Leu Gly Gly Leu Gly Glu Gln

385 390 395 400

Arg Ser Thr Leu Trp Leu Gly Met Ala Ser Leu Lys Thr Gly Gly Arg

405 410 415

Leu Gly Leu Leu Ala Gly Glu Ser Leu Glu Gly Ser Gly Val Asp Ile

420 425 430

Phe Ala Arg Gly Asp Glu Gly Ala Arg Ser Ala Gln Gly Gln Arg Asp

435 440 445

Trp Leu Gln Phe Leu Trp Asp Thr Glu Thr Glu Tyr Trp Asp Gly Met

450 455 460

Arg Asn Phe Leu Arg Gln Thr Val Gly Leu Arg Ser Leu Leu Ile Gly

465 470 475 480

Thr Gln Val Gly Tyr Ser Pro Ala Pro Ile Gln Ala Arg Met Asp Val

485 490 495

Val Asp Gly His Ala Tyr Trp Gln His Pro Arg Phe Pro Gly Arg Pro

500 505 510

Trp Asp Pro Ala Asp Trp Ser Val Ala Asn Thr Pro Met Ala Gly Ile

515 520 525

Asp Gly Gly Gly Thr Leu Ala Asp Leu Ala Leu Arg Arg Met Ala Gly

530 535 540

Lys Pro Phe Val Val Thr Glu Tyr Asn His Pro Ala Pro Gly Glu Phe

545 550 555 560

Val Ala Glu Gly Leu Pro Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp

565 570 575

Trp Asp Gly Val Phe Val Phe Asp Tyr Gly Ala Gly Asp His Asp Pro

580 585 590

Gly Phe Ile Ala Ser Tyr Phe Asp Ile Gln Ala Asp Pro Gly Lys Met

595 600 605

Ser Ala Leu Pro Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ala

610 615 620

Thr Pro Gly Ser Ala Gly Gly Ala Leu Pro Ser Pro Ala Ala Met Ile

625 630 635 640

Glu Ala Met Arg Ala Gly Asn Thr Met Pro Ala Ala Asp Gln Phe Gly

645 650 655

Thr Ala Arg Asn Glu Ala Leu Arg Arg Pro Val Ala Leu Gly Ser Thr

660 665 670

Pro Ala Gly Pro Arg Pro Leu Pro Val Arg Ala Ile Gly Gly Gln Leu

675 680 685

Val Trp Gly Glu Asp Gly Arg Lys Thr Val Val Ile Asp Thr Pro Arg

690 695 700

Ser Lys Gly Leu Val Gly Ala Gly Leu Gly Arg Asp Val Asp Ala Gly

705 710 715 720

Gly Val Gly Leu Arg Leu Leu Gln Ala Arg His Asn Ser Gly Val Leu

725 730 735

Leu Ala Thr Leu Met Asp Gly Arg Asp Phe Ser His Pro Gly Arg Val

740 745 750

Leu Leu Thr Ala Ile Gly Ser Glu Glu Asn Ser Gly Gln Arg Trp Leu

755 760 765

Asp Glu Ala His Thr Thr Leu Gly Arg Gln Trp Gly Gln Ala Pro Val

770 775 780

Trp Val Glu Gly Ile Ala Ala Arg Ile Val Leu Pro Val Ala Ala Ala

785 790 795 800

Arg Val Gly Ala Trp Ala Leu Asp Glu Arg Gly Gln Arg Arg Gln Ala

805 810 815

Leu Pro Val Ala Gly Asp His Ala His Ala Val Phe Glu Thr Ser Pro

820 825 830

Gly Tyr Arg Ala Leu Trp Tyr Glu Leu Glu Ile Arg

835 840

<210> 21

<211> 2550

<212> DNA

<213> 迪克亚杆菌属物种

<400> 21

atgatgcgaa tccgtagggt agtactggcg ctggcgttgt ctctgacctt ccccgctatc 60

gccggtgagc tgtttccctt tactttgccg ctggatgtcc gctccgacgg cagccttacc 120

gacctttcgt catggaacga caaaccggca ggcgcacgcg ggtttgtgac ggtcgacggc 180

agccacctga cagttggcgg caaacggctg cgattcctcg gcgttaatat cgtctttggt 240

tcgaccgcgc cgacacatgc cgacacagac gctatcgccc gccgcctggc acgcttcggc 300

atcaatctgg tgcgttttca tctgatggac gcccgccctg cgcccgacgg catcctgcag 360

cgcgatctgc gcacccttga cccagacacc ctcgaccgcg tcgattattt tatctcgacg 420

ctggcgcgag aaggcatcta cgccgatctc aacttgcacg tcggccgaca atatcccggc 480

atgggagaga gttgggcgga tgggcccaaa tactggaaag gcgtcgacct gttttatccg 540

ccgatgtttg tacagcagca ggagtatgcc cgcgccctgc tgacgcaccg caatccttac 600

accggtcatc gctatactga agaacccgcc gtggcgttcg tcgagatcaa taacgaagac 660

ggattgatcc gggaatggcg gtctggctcg ctcgacatga tgcccgcgcc gtttcgcact 720

gagctcgccc gccaatggcg tgtctggctc ggacatcgtt atgctggtga cgacgcgtta 780

cgcgcgggct ggggcgtgcg ggaagagcct tacggcgcgg aaatgctgtc agagcggatc 840

gggtcgaaaa gcagcgaccc aggctgggtg ctgcaaaccc ttggcggcgc caacgcgacg 900

ctcgccacaa cagattccgg actgatgctg tcgatgacga caccggggca gctcggctgg 960

catacgcagt tgcactacaa tcacctctcg ttccagaccc gccacgccta tacattgtcg 1020

ctccggttac gtgccgatca cccgctgacg ctgtccgtac aggcgatgca atcgcacgcc 1080

ccctggcaaa cgttgtggtc gcagaaaatc ccggtcggca ccgactggca ggatgtcacg 1140

gtgacattta tgccgcagca ggacgacgcg acggcacggc tcacactggg tggcctcggg 1200

ctggataccg gtcgtctgga tatcgcccat gcgcggcttc gtaccggcgg gttgctcgga 1260

ctacaacccg gcgaaagcct cacgcacggc acgctcgata tcattccgtt tgcctcccgg 1320

ttgaaccgaa ccgtcgcggc acagcgcgac tggctgagtt ttctgtggga caccgaagcg 1380

cagtattggc gaagcatgcg ggactttctg aaaggtgaac tgggcgtacg ctcgccagtc 1440

atcggaacgc aggtctccta cagcccggcg gccatccagc agacgctgga cgtggttgac 1500

ggccacgcct actggcagca cccgcgtttt ccgggcaaac cctgggatcg caacaactgg 1560

tttatcggca actcgccaat ggccggtatt cccggcggcg gcacgcttgc cgacctagca 1620

ttgcatcgtg tccccggcaa gccgtttatc gtcagcgagt acaaccatcc tgcgcccagc 1680

ctctggcaag gcgaggcgat gccgctggcc gccgcctatg gcgccctgca ggactgggat 1740

ggcatcgccg tttacaacta tggcgccagt aagcgtaact ggcaggccga ctttatcacc 1800

gactacttcg acagcgtcgc taacccggtc aagatgacca gtctggtggc tgccgccgcg 1860

ctgctgcggc gtgaggatgt gcgcgccgac aagccgcaac cacagccgat gccggatcgc 1920

accgtcttta tcgacgcgct gcgtcagggc ggccgcctgc cgggtgcgga cagcctgggc 1980

gcgccacgtg acgccgcgct ggcgggatgg gtcagcatcg ccacgccagc gggcgaaccg 2040

ccgtcatggc cggtacgtag ccgcaccggg caactgatct ggggtgtgga cggcatcggc 2100

ggcaaaaccg tggtggtcga tacgccgcgc agtaaagggc ttatcggcgc ccggctcggt 2160

caggtttatg acgcgcacgg cgtcgggctg gaagtgacgg cggcgcgcaa cgactgggga 2220

gtcctgctgg cgaccgtact ggacgggcag agtttcaccg cgccgagccg cattctgctg 2280

acgacgctgg ggcaggagga aaacaccggc cagcgctggc ttgatgccgc aaaaaccacc 2340

attggcagcc atttcggcac cggcccggtg ctggtcgaag gcatcggcgc ccgcatcacc 2400

ctgccggttg cgccgtcccg ggtcagcgcc tgggcgcttg acgcgcgcgg ccagcggcag 2460

acgccgatac cggtcggcgg cacgcaacat gccacactgg acgtcgatga gcgctatcgt 2520

actctgtggt atgaaatcga cattcgataa 2550

<210> 22

<211> 849

<212> PRT

<213> 迪克亚杆菌属物种

<400> 22

Met Met Arg Ile Arg Arg Val Val Leu Ala Leu Ala Leu Ser Leu Thr

1 5 10 15

Phe Pro Ala Ile Ala Gly Glu Leu Phe Pro Phe Thr Leu Pro Leu Asp

20 25 30

Val Arg Ser Asp Gly Ser Leu Thr Asp Leu Ser Ser Trp Asn Asp Lys

35 40 45

Pro Ala Gly Ala Arg Gly Phe Val Thr Val Asp Gly Ser His Leu Thr

50 55 60

Val Gly Gly Lys Arg Leu Arg Phe Leu Gly Val Asn Ile Val Phe Gly

65 70 75 80

Ser Thr Ala Pro Thr His Ala Asp Thr Asp Ala Ile Ala Arg Arg Leu

85 90 95

Ala Arg Phe Gly Ile Asn Leu Val Arg Phe His Leu Met Asp Ala Arg

100 105 110

Pro Ala Pro Asp Gly Ile Leu Gln Arg Asp Leu Arg Thr Leu Asp Pro

115 120 125

Asp Thr Leu Asp Arg Val Asp Tyr Phe Ile Ser Thr Leu Ala Arg Glu

130 135 140

Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Arg Gln Tyr Pro Gly

145 150 155 160

Met Gly Glu Ser Trp Ala Asp Gly Pro Lys Tyr Trp Lys Gly Val Asp

165 170 175

Leu Phe Tyr Pro Pro Met Phe Val Gln Gln Gln Glu Tyr Ala Arg Ala

180 185 190

Leu Leu Thr His Arg Asn Pro Tyr Thr Gly His Arg Tyr Thr Glu Glu

195 200 205

Pro Ala Val Ala Phe Val Glu Ile Asn Asn Glu Asp Gly Leu Ile Arg

210 215 220

Glu Trp Arg Ser Gly Ser Leu Asp Met Met Pro Ala Pro Phe Arg Thr

225 230 235 240

Glu Leu Ala Arg Gln Trp Arg Val Trp Leu Gly His Arg Tyr Ala Gly

245 250 255

Asp Asp Ala Leu Arg Ala Gly Trp Gly Val Arg Glu Glu Pro Tyr Gly

260 265 270

Ala Glu Met Leu Ser Glu Arg Ile Gly Ser Lys Ser Ser Asp Pro Gly

275 280 285

Trp Val Leu Gln Thr Leu Gly Gly Ala Asn Ala Thr Leu Ala Thr Thr

290 295 300

Asp Ser Gly Leu Met Leu Ser Met Thr Thr Pro Gly Gln Leu Gly Trp

305 310 315 320

His Thr Gln Leu His Tyr Asn His Leu Ser Phe Gln Thr Arg His Ala

325 330 335

Tyr Thr Leu Ser Leu Arg Leu Arg Ala Asp His Pro Leu Thr Leu Ser

340 345 350

Val Gln Ala Met Gln Ser His Ala Pro Trp Gln Thr Leu Trp Ser Gln

355 360 365

Lys Ile Pro Val Gly Thr Asp Trp Gln Asp Val Thr Val Thr Phe Met

370 375 380

Pro Gln Gln Asp Asp Ala Thr Ala Arg Leu Thr Leu Gly Gly Leu Gly

385 390 395 400

Leu Asp Thr Gly Arg Leu Asp Ile Ala His Ala Arg Leu Arg Thr Gly

405 410 415

Gly Leu Leu Gly Leu Gln Pro Gly Glu Ser Leu Thr His Gly Thr Leu

420 425 430

Asp Ile Ile Pro Phe Ala Ser Arg Leu Asn Arg Thr Val Ala Ala Gln

435 440 445

Arg Asp Trp Leu Ser Phe Leu Trp Asp Thr Glu Ala Gln Tyr Trp Arg

450 455 460

Ser Met Arg Asp Phe Leu Lys Gly Glu Leu Gly Val Arg Ser Pro Val

465 470 475 480

Ile Gly Thr Gln Val Ser Tyr Ser Pro Ala Ala Ile Gln Gln Thr Leu

485 490 495

Asp Val Val Asp Gly His Ala Tyr Trp Gln His Pro Arg Phe Pro Gly

500 505 510

Lys Pro Trp Asp Arg Asn Asn Trp Phe Ile Gly Asn Ser Pro Met Ala

515 520 525

Gly Ile Pro Gly Gly Gly Thr Leu Ala Asp Leu Ala Leu His Arg Val

530 535 540

Pro Gly Lys Pro Phe Ile Val Ser Glu Tyr Asn His Pro Ala Pro Ser

545 550 555 560

Leu Trp Gln Gly Glu Ala Met Pro Leu Ala Ala Ala Tyr Gly Ala Leu

565 570 575

Gln Asp Trp Asp Gly Ile Ala Val Tyr Asn Tyr Gly Ala Ser Lys Arg

580 585 590

Asn Trp Gln Ala Asp Phe Ile Thr Asp Tyr Phe Asp Ser Val Ala Asn

595 600 605

Pro Val Lys Met Thr Ser Leu Val Ala Ala Ala Ala Leu Leu Arg Arg

610 615 620

Glu Asp Val Arg Ala Asp Lys Pro Gln Pro Gln Pro Met Pro Asp Arg

625 630 635 640

Thr Val Phe Ile Asp Ala Leu Arg Gln Gly Gly Arg Leu Pro Gly Ala

645 650 655

Asp Ser Leu Gly Ala Pro Arg Asp Ala Ala Leu Ala Gly Trp Val Ser

660 665 670

Ile Ala Thr Pro Ala Gly Glu Pro Pro Ser Trp Pro Val Arg Ser Arg

675 680 685

Thr Gly Gln Leu Ile Trp Gly Val Asp Gly Ile Gly Gly Lys Thr Val

690 695 700

Val Val Asp Thr Pro Arg Ser Lys Gly Leu Ile Gly Ala Arg Leu Gly

705 710 715 720

Gln Val Tyr Asp Ala His Gly Val Gly Leu Glu Val Thr Ala Ala Arg

725 730 735

Asn Asp Trp Gly Val Leu Leu Ala Thr Val Leu Asp Gly Gln Ser Phe

740 745 750

Thr Ala Pro Ser Arg Ile Leu Leu Thr Thr Leu Gly Gln Glu Glu Asn

755 760 765

Thr Gly Gln Arg Trp Leu Asp Ala Ala Lys Thr Thr Ile Gly Ser His

770 775 780

Phe Gly Thr Gly Pro Val Leu Val Glu Gly Ile Gly Ala Arg Ile Thr

785 790 795 800

Leu Pro Val Ala Pro Ser Arg Val Ser Ala Trp Ala Leu Asp Ala Arg

805 810 815

Gly Gln Arg Gln Thr Pro Ile Pro Val Gly Gly Thr Gln His Ala Thr

820 825 830

Leu Asp Val Asp Glu Arg Tyr Arg Thr Leu Trp Tyr Glu Ile Asp Ile

835 840 845

Arg

<210> 23

<211> 2712

<212> DNA

<213> 闪烁杆菌属细菌

<400> 23

atgcggtggt ggatgttggt catcttggcg ttcatctctg gctttggggg ttggtggact 60

atgaggcaag ggttatcgca ggaaggcaaa caggatgcct tgcttttccc tttcgtttta 120

ccttgggacg atgcttctcc atcggtcacc aacatcagtc actggttgca caaacctgcg 180

ggcaagtttg ggcacatccg tatcggcgct gacggtcgcc tttacgctgg caagcagcga 240

attcgtttcc tgggcgtgaa cttgtgtttc ggggcatgtt tcccgcgcaa agaggactct 300

gaaaaaattg cggcaaggat ggcgaagttc ggcatcaaca ttgttcgctt ccaccacatg 360

gacatgcaag aatttcccaa tggcatccgc cgtcggggcg tcccccacac ccgcgacctt 420

gacccagaag cccttgacag acttgactac ctgattgccc aactgaaacg caacggcatc 480

tatgtcaact tgaacttgct cgtttctcgc cccttcaatg ctgccgacgg tttgcccaaa 540

gaaattgagc aactcggatg gaaggagcga cacatcgttg gcttcttcta cgagccatgt 600

cttgagttgc aaaaggaata tgctcgcaag ttgctgacgc accgcaatcc ttacacgggg 660

ctcacctatg ctgaagaccc tgtcgtcgct ttcgtggaaa tcaacaacga gaacggtctc 720

attcacgctt ggcttagtgg ctctattgac cggatgccaa aagtttttca ggatgagttg 780

caacggcagt ggcatgcttg gctgaaagcc cgatacggca caacggagaa gttgcgcaaa 840

gcgtggggtg tcaaggaaga gcccttgggc aatgaaatgc tgaggaacac gaactttgag 900

gcagggttgc aaaattgggt tttggagcga cacgcgggtg ctgaagcaac agcggaagtt 960

gtcgctgaac ccatccctga acttaaaggt cttcgcttcg tccgcattaa tgtcacaaaa 1020

ctgggacagg caggctggca tgtccaattc catcaaccga acttgaaagt tcaacctgat 1080

cgcccataca cactttcgtt ctgggcgcga gcggaacgac cttgcaccat ttcagtcgga 1140

atttcgcaag cccacgaacc ttggcagaac cttggcttca gtgccgaagt caaattgaca 1200

caggaatggc gtgaatatcg gttcaccttc attctcaaca ggggtgacga caacgctcgc 1260

gttatcttca gcaacttggg cgctcaaacg acaacttact ggttcgccgc cccctccctt 1320

cgccctggcg gaattgttgg cttggcagtc aacgagcgcc ttgaagatgg cactgtcccg 1380

attttccttc gcggtcgttt cggtgagcgc acacccgaag cacaacggga ctggatgcga 1440

tttttgtggg agacggaaga tcgctattgg caaacaatct accgctacct caaggacgag 1500

ttgaaagtca aggcattggt catcggcaca atcgtcggat gcagcacacc caacatgatg 1560

gcaaaacttg actgcgtgga cacacacgct tattggcaac atccgatgtt tccctcccga 1620

ccatgggacc ctgaggattg gattgtgcct aaccgaacga tggtcaacga acgaggcggg 1680

actttgcctg gcttagcatt gcgacgggtt ttgggcaaac cccattcttg caccgaatac 1740

aaccaccccg caccaaacac atacagcagc gaagccttcc ttttgctggc agcatatgca 1800

gccttgcagg attgggatgc catctatgcc ttcagttact cgcaccgacg agatggttgg 1860

gacttaaggc gcattcccaa cttctttgac attgaccaac atcccacgaa gatggttacc 1920

cttatccctg cagcagcgat gtttgttcgg ggcgatgtga aacctgccaa gcagcaagtg 1980

gttgtcaagt tgacgaaaga gcaagaagtt gacttgttgc ggcgcagttg ggcttggtta 2040

ctcgtccacg caggtcatgt cggagttcct aacgaagcag cactcgtcca tcgggttgca 2100

attgcgacag atgggaagcg agttccgcca actgctctca agcccgaaca agtgaaaatt 2160

gacggcaacc gatttgtgtc cgatactggc gaattgattt gggacttgac ggaaaaaggg 2220

cgcggggttg ttatcgttaa tgcccagaac agcaaagccg ttatcgggtt cgcaggtggc 2280

aagcggtttg agttgagcag cgtcgtgatt gaacctgggc aaactatgca agacggttgg 2340

tgcgccatca cactcaccgt catggacggc tccttgccaa ctcgcccctc gtcccgcgtc 2400

cctcgtcccg tccgtttgct catcacggca acaggctatg cggagaacac cgacatgggt 2460

tggaaggaag tgcctggtta cccacccaaa tcaagttgcg gtcgcaactg gggcaaacca 2520

ccttcgttgg tggaaggcat ctttgccagc atcaccttgc cgttacccgc caagcgagtg 2580

caagcgtggg ctttggacga acggggtcaa cggaaatccc aaatcccagt cactgccgac 2640

ccatcaggca acgccgtcat ccgcatcagt ccccaatggc aaacgctttg gtatgaagtt 2700

gaggcgcggt aa 2712

<210> 24

<211> 903

<212> PRT

<213> 闪烁杆菌属细菌

<400> 24

Met Arg Trp Trp Met Leu Val Ile Leu Ala Phe Ile Ser Gly Phe Gly

1 5 10 15

Gly Trp Trp Thr Met Arg Gln Gly Leu Ser Gln Glu Gly Lys Gln Asp

20 25 30

Ala Leu Leu Phe Pro Phe Val Leu Pro Trp Asp Asp Ala Ser Pro Ser

35 40 45

Val Thr Asn Ile Ser His Trp Leu His Lys Pro Ala Gly Lys Phe Gly

50 55 60

His Ile Arg Ile Gly Ala Asp Gly Arg Leu Tyr Ala Gly Lys Gln Arg

65 70 75 80

Ile Arg Phe Leu Gly Val Asn Leu Cys Phe Gly Ala Cys Phe Pro Arg

85 90 95

Lys Glu Asp Ser Glu Lys Ile Ala Ala Arg Met Ala Lys Phe Gly Ile

100 105 110

Asn Ile Val Arg Phe His His Met Asp Met Gln Glu Phe Pro Asn Gly

115 120 125

Ile Arg Arg Arg Gly Val Pro His Thr Arg Asp Leu Asp Pro Glu Ala

130 135 140

Leu Asp Arg Leu Asp Tyr Leu Ile Ala Gln Leu Lys Arg Asn Gly Ile

145 150 155 160

Tyr Val Asn Leu Asn Leu Leu Val Ser Arg Pro Phe Asn Ala Ala Asp

165 170 175

Gly Leu Pro Lys Glu Ile Glu Gln Leu Gly Trp Lys Glu Arg His Ile

180 185 190

Val Gly Phe Phe Tyr Glu Pro Cys Leu Glu Leu Gln Lys Glu Tyr Ala

195 200 205

Arg Lys Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr Tyr Ala

210 215 220

Glu Asp Pro Val Val Ala Phe Val Glu Ile Asn Asn Glu Asn Gly Leu

225 230 235 240

Ile His Ala Trp Leu Ser Gly Ser Ile Asp Arg Met Pro Lys Val Phe

245 250 255

Gln Asp Glu Leu Gln Arg Gln Trp His Ala Trp Leu Lys Ala Arg Tyr

260 265 270

Gly Thr Thr Glu Lys Leu Arg Lys Ala Trp Gly Val Lys Glu Glu Pro

275 280 285

Leu Gly Asn Glu Met Leu Arg Asn Thr Asn Phe Glu Ala Gly Leu Gln

290 295 300

Asn Trp Val Leu Glu Arg His Ala Gly Ala Glu Ala Thr Ala Glu Val

305 310 315 320

Val Ala Glu Pro Ile Pro Glu Leu Lys Gly Leu Arg Phe Val Arg Ile

325 330 335

Asn Val Thr Lys Leu Gly Gln Ala Gly Trp His Val Gln Phe His Gln

340 345 350

Pro Asn Leu Lys Val Gln Pro Asp Arg Pro Tyr Thr Leu Ser Phe Trp

355 360 365

Ala Arg Ala Glu Arg Pro Cys Thr Ile Ser Val Gly Ile Ser Gln Ala

370 375 380

His Glu Pro Trp Gln Asn Leu Gly Phe Ser Ala Glu Val Lys Leu Thr

385 390 395 400

Gln Glu Trp Arg Glu Tyr Arg Phe Thr Phe Ile Leu Asn Arg Gly Asp

405 410 415

Asp Asn Ala Arg Val Ile Phe Ser Asn Leu Gly Ala Gln Thr Thr Thr

420 425 430

Tyr Trp Phe Ala Ala Pro Ser Leu Arg Pro Gly Gly Ile Val Gly Leu

435 440 445

Ala Val Asn Glu Arg Leu Glu Asp Gly Thr Val Pro Ile Phe Leu Arg

450 455 460

Gly Arg Phe Gly Glu Arg Thr Pro Glu Ala Gln Arg Asp Trp Met Arg

465 470 475 480

Phe Leu Trp Glu Thr Glu Asp Arg Tyr Trp Gln Thr Ile Tyr Arg Tyr

485 490 495

Leu Lys Asp Glu Leu Lys Val Lys Ala Leu Val Ile Gly Thr Ile Val

500 505 510

Gly Cys Ser Thr Pro Asn Met Met Ala Lys Leu Asp Cys Val Asp Thr

515 520 525

His Ala Tyr Trp Gln His Pro Met Phe Pro Ser Arg Pro Trp Asp Pro

530 535 540

Glu Asp Trp Ile Val Pro Asn Arg Thr Met Val Asn Glu Arg Gly Gly

545 550 555 560

Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Leu Gly Lys Pro His Ser

565 570 575

Cys Thr Glu Tyr Asn His Pro Ala Pro Asn Thr Tyr Ser Ser Glu Ala

580 585 590

Phe Leu Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp Trp Asp Ala Ile

595 600 605

Tyr Ala Phe Ser Tyr Ser His Arg Arg Asp Gly Trp Asp Leu Arg Arg

610 615 620

Ile Pro Asn Phe Phe Asp Ile Asp Gln His Pro Thr Lys Met Val Thr

625 630 635 640

Leu Ile Pro Ala Ala Ala Met Phe Val Arg Gly Asp Val Lys Pro Ala

645 650 655

Lys Gln Gln Val Val Val Lys Leu Thr Lys Glu Gln Glu Val Asp Leu

660 665 670

Leu Arg Arg Ser Trp Ala Trp Leu Leu Val His Ala Gly His Val Gly

675 680 685

Val Pro Asn Glu Ala Ala Leu Val His Arg Val Ala Ile Ala Thr Asp

690 695 700

Gly Lys Arg Val Pro Pro Thr Ala Leu Lys Pro Glu Gln Val Lys Ile

705 710 715 720

Asp Gly Asn Arg Phe Val Ser Asp Thr Gly Glu Leu Ile Trp Asp Leu

725 730 735

Thr Glu Lys Gly Arg Gly Val Val Ile Val Asn Ala Gln Asn Ser Lys

740 745 750

Ala Val Ile Gly Phe Ala Gly Gly Lys Arg Phe Glu Leu Ser Ser Val

755 760 765

Val Ile Glu Pro Gly Gln Thr Met Gln Asp Gly Trp Cys Ala Ile Thr

770 775 780

Leu Thr Val Met Asp Gly Ser Leu Pro Thr Arg Pro Ser Ser Arg Val

785 790 795 800

Pro Arg Pro Val Arg Leu Leu Ile Thr Ala Thr Gly Tyr Ala Glu Asn

805 810 815

Thr Asp Met Gly Trp Lys Glu Val Pro Gly Tyr Pro Pro Lys Ser Ser

820 825 830

Cys Gly Arg Asn Trp Gly Lys Pro Pro Ser Leu Val Glu Gly Ile Phe

835 840 845

Ala Ser Ile Thr Leu Pro Leu Pro Ala Lys Arg Val Gln Ala Trp Ala

850 855 860

Leu Asp Glu Arg Gly Gln Arg Lys Ser Gln Ile Pro Val Thr Ala Asp

865 870 875 880

Pro Ser Gly Asn Ala Val Ile Arg Ile Ser Pro Gln Trp Gln Thr Leu

885 890 895

Trp Tyr Glu Val Glu Ala Arg

900

<210> 25

<211> 2685

<212> DNA

<213> Teredinibacter turnerae

<400> 25

atgtttttgt ttatctcaac gcactcacca cgcctgtgcc tgtaccgggc acttctcttt 60

ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gctttgcgca atcaccgata 120

aagtctttca cgcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggaacg 180

ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240

atcgattccg atgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300

attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgctta 360

gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420

ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480

ctcgattact ttattgccgc tctaaaattg cgtggaatct acagcaatat aaacctgctt 540

accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600

aaggcgcggc agatgctcgg cgcgatttcg catgcggttc gcaatctgga aaaagcctac 660

gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc tggcataccg gacagacccg 720

gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780

aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840

ttgactcgca agtataaaga tcagaatgca ctcgagcgcg cttggcaggt gattgataaa 900

cctctgggta acaatctgtt aaaaaatgcg aattttgtgg ccgggttaca ggggtggcat 960

ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc tggtttgcgt 1020

attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaatttacct 1080

gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140

aaaattacac cgctggtgat gcagcgtgcg gaaccctggc tggtggttga atcgtttcct 1200

gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260

caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320

gatctgcgct tgcagcccgg cgggaccgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380

cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440

tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500

gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560

tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620

cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680

tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740

gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800

gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttctta cgaccagggg 1860

gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920

gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980

cagggcaaac gctggttgaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040

ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100

catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160

gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220

cagggcaggg tgacaataaa cacggcgaaa tctgctggcg tagtgggctt tattgcagat 2280

caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340

agttggatga tcactgcaca agagggaagt ttgcaggatc ttgccccagg cgcatcgctg 2400

ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gttggaacga cgcgcataat 2460

tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ctttagtctc 2520

acgctgccag ttgcttccag gcgggtaaat gcctggtgtc tggatgagcg tgggcagcga 2580

ttgcaggcgt tgaaggtcga gcaaacagcc acgggcagtc gtatcgacgt ggatagcaaa 2640

gcgcgaacat tgtggtatga gatagccatc gcccccaaaa tctaa 2685

<210> 26

<211> 894

<212> PRT

<213> Teredinibacter turnerae

<400> 26

Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Cys Leu Tyr Arg

1 5 10 15

Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu

20 25 30

Glu Arg Phe Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu

35 40 45

Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Thr Gly Ile Thr Ala

50 55 60

Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr

65 70 75 80

Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu

85 90 95

Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp

100 105 110

Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val

115 120 125

Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp

130 135 140

Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys

145 150 155 160

Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn

165 170 175

Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro

180 185 190

Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala

195 200 205

Ile Ser His Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu

210 215 220

Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Thr Asp Pro

225 230 235 240

Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln

245 250 255

Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro

260 265 270

Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln

275 280 285

Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn

290 295 300

Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His

305 310 315 320

Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser

325 330 335

Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn

340 345 350

Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr

355 360 365

Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Lys Ile Thr Pro

370 375 380

Leu Val Met Gln Arg Ala Glu Pro Trp Leu Val Val Glu Ser Phe Pro

385 390 395 400

Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His

405 410 415

Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser

420 425 430

Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly

435 440 445

Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile

450 455 460

Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp

465 470 475 480

Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met

485 490 495

His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly

500 505 510

Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe

515 520 525

Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala

530 535 540

Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala

545 550 555 560

Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly

565 570 575

Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr

580 585 590

Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp

595 600 605

Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp

610 615 620

Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala

625 630 635 640

Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp

645 650 655

Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg

660 665 670

Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro

675 680 685

Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile

690 695 700

Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu

705 710 715 720

Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr

725 730 735

Ser Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala

740 745 750

Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu

755 760 765

Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile

770 775 780

Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu

785 790 795 800

Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn

805 810 815

Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg

820 825 830

Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg

835 840 845

Val Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu Gln Ala Leu

850 855 860

Lys Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys

865 870 875 880

Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile

885 890

<210> 27

<211> 2685

<212> DNA

<213> Teredinibacter turnerae

<400> 27

atgttttggt ttacctctgc gtactcgcga agcttgtgtc tgtaccgggc acttctgttt 60

ccggtgttgc tcttctgtgt tgatgctccg gcagcagagc gtctttcgca accaccaaca 120

aaatcggtaa atcacacagg gttagcaccg ttcgtgcttc ccttcgacga tgatggtacg 180

ggtattaccg cttttaataa cggatcgcac cagcgagggg aggggcttgc tccgctcact 240

atcgattccg ccggacattt ctccgtcgcc gggaataggt ttaggctttg gggcgtaaat 300

ataacggggg actccgcctt cccctcacac aaggatgcgg aaaaagttgc cggacgttta 360

gcaaaattcg gcgtgaacat tgttcggttt catcatttgg acaataactg gggtggtgcg 420

ggcctaattg attatcgacg gggagactcc cgtcatttga gtaaggaaaa tctcgataag 480

ctcgattatt ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540

actgcgcgcg aatttttacc tgctgacgga ttgcctgcat cgattactca aatcgattgg 600

aaggcgcggc aaatgctcgg cgcgatttct ccctcggtcc gcaatttgga aaaagcctac 660

gcgaaacaaa ttctgaagca tgtaaatccg tacacgcgcc tggcgtaccg ggtagatccg 720

gccatcgcat ttgttgaaat aaacaatgaa aacagcctgt ttcaacagtt ttttgacggc 780

aatatagacc gctggccgga agcgtttagt cagccactgg cgcaagagtg gaatgcttgg 840

ttggctcgca agtataaaga tcacgctgca ctcgagcgtg cctggcaggt gattgataaa 900

cctctgggca acaatctgtt aaaaaatgcg gattttgtgg cgggcttaca gggttggcat 960

ttagaccaga tcgacggcgc aaaggcgcag gccaatccgc tcgcatccgc tggtttgcgt 1020

atccaaatag ataccgtagg gcctgcgtta tggaacattc aactttccca aaacttacct 1080

gaactcaaag acggtgagat ttacacattg tcgtttgccg cacgctcgca gtcgcacagc 1140

agaattacac ctctgctgat gcagagtgtg gaaccctggc aggtggtcga atccttccct 1200

gtgaagctcg attctgaatg gcgggaattc aggtttcagt atgtgcatac tggatcagcg 1260

caaccgttgc gcttaacgtt gggtgaattg ggttcggtaa taggggcaat agatgttagg 1320

gatcttcgcc tgcagtctgg cggaactgtc ggtgaacttg ctaagaacca gactctcgaa 1380

cgccgttcta taggattaaa ccgtaacgat gaatcctatc tcgcgcagcg gcgggaagac 1440

tggtttgcat ttttgtacag ccttgagctg gcgtactggc aggatatgca cagctatttg 1500

gctgatgaac tcaaggttaa aaacaatatt tatgggacta tcgcgagctt gagtccgcct 1560

tcaattcagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttt 1620

cccgctggag cctgggatgc acagcagtgg agtgtcgata tgtcgtccat ggttaacgcc 1680

ttcccaaaca acacgttaag cgctctggcg cgccagcgcg tggccgggct gccttttgta 1740

gtctctgaat atcagcatgc tatgccaaat ccctattctg cagaaggccc gctgctggta 1800

gcggcctatg cgggtttgca ggattgggat ggcgtttatc tgttttcgta cgatcagggg 1860

gaactgggtt ggcaacagga atttatcgac ggattcttta aaactaattt gaacccagcg 1920

gcaatggtta attttgccgt cggcgggaat ctgtttcgac gtggagatgt gcagcctgcg 1980

cagggcaaac gctggttaaa tttttctcga tccggcgagc tcgcacaaat tacaaacgcc 2040

ggtgcatctt ggagtgtgag tccggcggac ttccctccgg aatggcgtgg ctacgctttt 2100

cacgagcaaa tgggcttgca gttgggtatg tcaacgacgg agtctaaacc gccggtgctt 2160

gatgttaaca aagtgactgc cgagacgggc gaactcagtt gggatacaac tagccaagcg 2220

cagggtaggg tgacaataaa cacagaaaaa tccgctggcg tagtgggctt tgttgcagat 2280

caacacttcc agctcggtgc gttggggttg accttgggcg atctacagat gggctgggcc 2340

agctggatgg tcactgcgca agagggtagt ttgcaggatc ttgcagcagg cgcttcgctg 2400

ttggcagttg cgaccgcaaa aattgaaaac agtaaaatgc gctggaacga cgctcataat 2460

tcgctcggcc gcaattgggg tgaagcgccg acgagggttg aagttgtgcc ttttagtctc 2520

tcgttgccaa ttgctgccag gcgggttagt gcctggtgtt tggatgagcg tggtcagcga 2580

atgcggtcgt tgaaggttgt gcaaacagcg acaggcagtc gtatcgatgt ggatagcaaa 2640

gcgcgaacat tatggtacga gatcgtcata accccgaaaa tataa 2685

<210> 28

<211> 894

<212> PRT

<213> Teredinibacter turnerae

<400> 28

Met Phe Trp Phe Thr Ser Ala Tyr Ser Arg Ser Leu Cys Leu Tyr Arg

1 5 10 15

Ala Leu Leu Phe Pro Val Leu Leu Phe Cys Val Asp Ala Pro Ala Ala

20 25 30

Glu Arg Leu Ser Gln Pro Pro Thr Lys Ser Val Asn His Thr Gly Leu

35 40 45

Ala Pro Phe Val Leu Pro Phe Asp Asp Asp Gly Thr Gly Ile Thr Ala

50 55 60

Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr

65 70 75 80

Ile Asp Ser Ala Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu

85 90 95

Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Lys Asp

100 105 110

Ala Glu Lys Val Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val

115 120 125

Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp

130 135 140

Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Glu Asn Leu Asp Lys

145 150 155 160

Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn

165 170 175

Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro

180 185 190

Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala

195 200 205

Ile Ser Pro Ser Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Gln Ile

210 215 220

Leu Lys His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Val Asp Pro

225 230 235 240

Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln

245 250 255

Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Glu Ala Phe Ser Gln Pro

260 265 270

Leu Ala Gln Glu Trp Asn Ala Trp Leu Ala Arg Lys Tyr Lys Asp His

275 280 285

Ala Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn

290 295 300

Asn Leu Leu Lys Asn Ala Asp Phe Val Ala Gly Leu Gln Gly Trp His

305 310 315 320

Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Asn Pro Leu Ala Ser

325 330 335

Ala Gly Leu Arg Ile Gln Ile Asp Thr Val Gly Pro Ala Leu Trp Asn

340 345 350

Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr

355 360 365

Thr Leu Ser Phe Ala Ala Arg Ser Gln Ser His Ser Arg Ile Thr Pro

370 375 380

Leu Leu Met Gln Ser Val Glu Pro Trp Gln Val Val Glu Ser Phe Pro

385 390 395 400

Val Lys Leu Asp Ser Glu Trp Arg Glu Phe Arg Phe Gln Tyr Val His

405 410 415

Thr Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser

420 425 430

Val Ile Gly Ala Ile Asp Val Arg Asp Leu Arg Leu Gln Ser Gly Gly

435 440 445

Thr Val Gly Glu Leu Ala Lys Asn Gln Thr Leu Glu Arg Arg Ser Ile

450 455 460

Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp

465 470 475 480

Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Ala Tyr Trp Gln Asp Met

485 490 495

His Ser Tyr Leu Ala Asp Glu Leu Lys Val Lys Asn Asn Ile Tyr Gly

500 505 510

Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe

515 520 525

Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala

530 535 540

Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala

545 550 555 560

Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly

565 570 575

Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr

580 585 590

Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp

595 600 605

Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp

610 615 620

Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala

625 630 635 640

Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp

645 650 655

Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Gly

660 665 670

Glu Leu Ala Gln Ile Thr Asn Ala Gly Ala Ser Trp Ser Val Ser Pro

675 680 685

Ala Asp Phe Pro Pro Glu Trp Arg Gly Tyr Ala Phe His Glu Gln Met

690 695 700

Gly Leu Gln Leu Gly Met Ser Thr Thr Glu Ser Lys Pro Pro Val Leu

705 710 715 720

Asp Val Asn Lys Val Thr Ala Glu Thr Gly Glu Leu Ser Trp Asp Thr

725 730 735

Thr Ser Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Glu Lys Ser Ala

740 745 750

Gly Val Val Gly Phe Val Ala Asp Gln His Phe Gln Leu Gly Ala Leu

755 760 765

Gly Leu Thr Leu Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Val

770 775 780

Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Ala Gly Ala Ser Leu

785 790 795 800

Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn

805 810 815

Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg

820 825 830

Val Glu Val Val Pro Phe Ser Leu Ser Leu Pro Ile Ala Ala Arg Arg

835 840 845

Val Ser Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Met Arg Ser Leu

850 855 860

Lys Val Val Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys

865 870 875 880

Ala Arg Thr Leu Trp Tyr Glu Ile Val Ile Thr Pro Lys Ile

885 890

<210> 29

<211> 2868

<212> DNA

<213> Diplosphaera colitermitum

<400> 29

atgtctcccc agattgcctc tttcgcacgt cgctgccgcc tcgtccacac actatctggt 60

gcactgcttg ccatcgcatt tgcgtccggc ccgctgacgg cgatcatcgc caacgctggc 120

gcatctgaac tcacggcggc cacggccaac caactcccct tcgccaacgg cttccccttt 180

cacatccccc ccaccggcac ccaaccgggc accgcgccct acgacctcgc gatcccgccg 240

tccgccaaca caaaaatcga cagccccatc agcattcgcg gcgaccaatt catcgttcgc 300

catttgacat caaacaccag ccccgacacc ggcgaaccca tccgcttctg gggcaccaac 360

ctttgctttt ccggcgtatt ccccgaacac gacatcgctg accgcatggc cgcgcgcatg 420

gccacactcg gcatcaacat cgtccgcctt caccacttcg accaacgccg tttccccggc 480

ggcatctggc atcgcgacgc ccccggcgcc tccaaatctc ccaacgaaga cgacatcgcc 540

caccaaacct tcgacccaga atcccttgac cgcctcgact acctcatcgc cgccctcaaa 600

aaacgcggca tctacaccaa cctaaacctc aaagtctccc gcatattcag tcccgaccac 660

gacggccccg acttcccgaa acccgatcct gccaaaaacg aaatcctgcc caaaaaaggc 720

aaaggctttg accaatttta cacccccgcc atcgccgcgc aaaaagacta cgcccgccgc 780

ctcctcaccc atcgcaaccc ctacaccggc ctcacctaca ccgaagaccc cgccgtcgcg 840

atggtggaga tcaacaacga aaacggcatc ctctgggcct ggaactaccg aatccttgac 900

cgcattccct cccgtttcat tgacgaactc gccgcccgct ggaacacctg gcttcgtaac 960

caatattcca ctaccgacgc actccgcgcc gcatggaatc cggcgagtgg cgcgggcgtc 1020

ccacccgcaa ccggaaccgt agcctcccgg tccgttccct ccaccggtgg caacctcttg 1080

gaaaacatcc cccccgccct cttcaccgcc aaaaaagccc gcgccaccct cgccccgctc 1140

accgccgccg ccgacgccga cgattccacc ccggcctccc gtcgcctcac cgttgccgaa 1200

gtccctgctg ccaccgcttg gaatgtccgc tgcaactggc ccctcccgac cgcgcttccc 1260

gccgacgcca cctacaccgc cacccttcgc ctccgcgcaa accaacccca caaaatcaaa 1320

ctccgcctcc gctccccgtc cgacaacaag gacctcgcgc ccgtccgcac cctcaacctc 1380

gccaccgagt ggaaaaacca cagcaccacc tttgccatcc cgccgggtga cgccgccgtc 1440

gccgcccaac tcaccctcga agcgggcatc cccggcctcg tcctcgacat cgactccgct 1500

tcccttcaac cgctcaccag caaaaacctc ctcggcctcc cagcgggcca aggtctcgtc 1560

tcccaaagtg gcgcgggcgg gacgcccgcg ccacgccccg tcgaatgggt attccgccgc 1620

gatctcccct cccgcacacc cgccgtcgtc accgacgtca tgcgcttcct ccgcgacacc 1680

gaaatcgcct actggcgcga aatgcacgct ttcttacgca acgacctccg cgtcgccgca 1740

cccataacca ccaccgccgt tggctacacc acgccgcaaa tcgccgccga aaccgccgac 1800

ttcatcgaca cccaccgcta ctggggatca ccccgctttc ccgcctttga ccggacaaaa 1860

ccctggaccg tgcaacaaaa acccatggtc tcccaccccg cccagtccac catcgaacgc 1920

atgtccgccc gacgtgtatt cggaaaacca ttcaccatca ccgaatacaa ccacccgccc 1980

tccaccgacc accacgccga ggccttcccc ctcgtcggcg tctggggcgc cgcgcaaggc 2040

tgggacggcc tcttccagtt cgcctactcc cacagccgcg cttgggaagc tgacatcatg 2100

accggcttct tcgacaccga gcccaacccc gcgcacaccg tcgccgccct cgccgcctcc 2160

gacatcttcc gtcaccgccg catcaccccc tttgcctcca caaaaaccgg ctacgtcacc 2220

ctagaccgcc aactcgaacg ccagaacaac tacgccttcc ctcgcgaaat cgaggccgac 2280

gccatctacg gaggactccc gcccgacgcc tggcttacca accgcgtcgg cctcgcgcca 2340

agtgacgcgg gcgtcccgcc cgcaaccctt gcccctccgc cctccgtctc ccaaagcctc 2400

gtctgggacg ccgccaaccc cgccaccgcc cacgtccgtt acacgggcga cggcgttgct 2460

ggcctcatcg gattcgtttc cggccagacc ctcgatctcg gatggctccg tatcacaccc 2520

ggcactacat cactcaacgg cttctcaatt gtcatgctca ataccgttga ccgccaagcc 2580

ctcggagccc ccggacgcta cctgctcact gtggccgtcc gagcctccaa cctcggcatg 2640

ggctggaacg ctgaccgcac cggcttcggc aaaaaatggg gcactggtcc cacccatgcc 2700

gaaaccgccc cgatcgcgct cgatttcgcc tctgccaccg gcgtccgggt gtatccgctc 2760

aatcccgacg gaacacgtcg cccggaactc ccgccggtct ccctcccggg tcgcttcgaa 2820

gccactcctg ccagcaaaac tctctggtac gaaatcatcc tcccgtaa 2868

<210> 30

<211> 955

<212> PRT

<213> Diplosphaera colitermitum

<400> 30

Met Ser Pro Gln Ile Ala Ser Phe Ala Arg Arg Cys Arg Leu Val His

1 5 10 15

Thr Leu Ser Gly Ala Leu Leu Ala Ile Ala Phe Ala Ser Gly Pro Leu

20 25 30

Thr Ala Ile Ile Ala Asn Ala Gly Ala Ser Glu Leu Thr Ala Ala Thr

35 40 45

Ala Asn Gln Leu Pro Phe Ala Asn Gly Phe Pro Phe His Ile Pro Pro

50 55 60

Thr Gly Thr Gln Pro Gly Thr Ala Pro Tyr Asp Leu Ala Ile Pro Pro

65 70 75 80

Ser Ala Asn Thr Lys Ile Asp Ser Pro Ile Ser Ile Arg Gly Asp Gln

85 90 95

Phe Ile Val Arg His Leu Thr Ser Asn Thr Ser Pro Asp Thr Gly Glu

100 105 110

Pro Ile Arg Phe Trp Gly Thr Asn Leu Cys Phe Ser Gly Val Phe Pro

115 120 125

Glu His Asp Ile Ala Asp Arg Met Ala Ala Arg Met Ala Thr Leu Gly

130 135 140

Ile Asn Ile Val Arg Leu His His Phe Asp Gln Arg Arg Phe Pro Gly

145 150 155 160

Gly Ile Trp His Arg Asp Ala Pro Gly Ala Ser Lys Ser Pro Asn Glu

165 170 175

Asp Asp Ile Ala His Gln Thr Phe Asp Pro Glu Ser Leu Asp Arg Leu

180 185 190

Asp Tyr Leu Ile Ala Ala Leu Lys Lys Arg Gly Ile Tyr Thr Asn Leu

195 200 205

Asn Leu Lys Val Ser Arg Ile Phe Ser Pro Asp His Asp Gly Pro Asp

210 215 220

Phe Pro Lys Pro Asp Pro Ala Lys Asn Glu Ile Leu Pro Lys Lys Gly

225 230 235 240

Lys Gly Phe Asp Gln Phe Tyr Thr Pro Ala Ile Ala Ala Gln Lys Asp

245 250 255

Tyr Ala Arg Arg Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr

260 265 270

Tyr Thr Glu Asp Pro Ala Val Ala Met Val Glu Ile Asn Asn Glu Asn

275 280 285

Gly Ile Leu Trp Ala Trp Asn Tyr Arg Ile Leu Asp Arg Ile Pro Ser

290 295 300

Arg Phe Ile Asp Glu Leu Ala Ala Arg Trp Asn Thr Trp Leu Arg Asn

305 310 315 320

Gln Tyr Ser Thr Thr Asp Ala Leu Arg Ala Ala Trp Asn Pro Ala Ser

325 330 335

Gly Ala Gly Val Pro Pro Ala Thr Gly Thr Val Ala Ser Arg Ser Val

340 345 350

Pro Ser Thr Gly Gly Asn Leu Leu Glu Asn Ile Pro Pro Ala Leu Phe

355 360 365

Thr Ala Lys Lys Ala Arg Ala Thr Leu Ala Pro Leu Thr Ala Ala Ala

370 375 380

Asp Ala Asp Asp Ser Thr Pro Ala Ser Arg Arg Leu Thr Val Ala Glu

385 390 395 400

Val Pro Ala Ala Thr Ala Trp Asn Val Arg Cys Asn Trp Pro Leu Pro

405 410 415

Thr Ala Leu Pro Ala Asp Ala Thr Tyr Thr Ala Thr Leu Arg Leu Arg

420 425 430

Ala Asn Gln Pro His Lys Ile Lys Leu Arg Leu Arg Ser Pro Ser Asp

435 440 445

Asn Lys Asp Leu Ala Pro Val Arg Thr Leu Asn Leu Ala Thr Glu Trp

450 455 460

Lys Asn His Ser Thr Thr Phe Ala Ile Pro Pro Gly Asp Ala Ala Val

465 470 475 480

Ala Ala Gln Leu Thr Leu Glu Ala Gly Ile Pro Gly Leu Val Leu Asp

485 490 495

Ile Asp Ser Ala Ser Leu Gln Pro Leu Thr Ser Lys Asn Leu Leu Gly

500 505 510

Leu Pro Ala Gly Gln Gly Leu Val Ser Gln Ser Gly Ala Gly Gly Thr

515 520 525

Pro Ala Pro Arg Pro Val Glu Trp Val Phe Arg Arg Asp Leu Pro Ser

530 535 540

Arg Thr Pro Ala Val Val Thr Asp Val Met Arg Phe Leu Arg Asp Thr

545 550 555 560

Glu Ile Ala Tyr Trp Arg Glu Met His Ala Phe Leu Arg Asn Asp Leu

565 570 575

Arg Val Ala Ala Pro Ile Thr Thr Thr Ala Val Gly Tyr Thr Thr Pro

580 585 590

Gln Ile Ala Ala Glu Thr Ala Asp Phe Ile Asp Thr His Arg Tyr Trp

595 600 605

Gly Ser Pro Arg Phe Pro Ala Phe Asp Arg Thr Lys Pro Trp Thr Val

610 615 620

Gln Gln Lys Pro Met Val Ser His Pro Ala Gln Ser Thr Ile Glu Arg

625 630 635 640

Met Ser Ala Arg Arg Val Phe Gly Lys Pro Phe Thr Ile Thr Glu Tyr

645 650 655

Asn His Pro Pro Ser Thr Asp His His Ala Glu Ala Phe Pro Leu Val

660 665 670

Gly Val Trp Gly Ala Ala Gln Gly Trp Asp Gly Leu Phe Gln Phe Ala

675 680 685

Tyr Ser His Ser Arg Ala Trp Glu Ala Asp Ile Met Thr Gly Phe Phe

690 695 700

Asp Thr Glu Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser

705 710 715 720

Asp Ile Phe Arg His Arg Arg Ile Thr Pro Phe Ala Ser Thr Lys Thr

725 730 735

Gly Tyr Val Thr Leu Asp Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala

740 745 750

Phe Pro Arg Glu Ile Glu Ala Asp Ala Ile Tyr Gly Gly Leu Pro Pro

755 760 765

Asp Ala Trp Leu Thr Asn Arg Val Gly Leu Ala Pro Ser Asp Ala Gly

770 775 780

Val Pro Pro Ala Thr Leu Ala Pro Pro Pro Ser Val Ser Gln Ser Leu

785 790 795 800

Val Trp Asp Ala Ala Asn Pro Ala Thr Ala His Val Arg Tyr Thr Gly

805 810 815

Asp Gly Val Ala Gly Leu Ile Gly Phe Val Ser Gly Gln Thr Leu Asp

820 825 830

Leu Gly Trp Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asn Gly Phe

835 840 845

Ser Ile Val Met Leu Asn Thr Val Asp Arg Gln Ala Leu Gly Ala Pro

850 855 860

Gly Arg Tyr Leu Leu Thr Val Ala Val Arg Ala Ser Asn Leu Gly Met

865 870 875 880

Gly Trp Asn Ala Asp Arg Thr Gly Phe Gly Lys Lys Trp Gly Thr Gly

885 890 895

Pro Thr His Ala Glu Thr Ala Pro Ile Ala Leu Asp Phe Ala Ser Ala

900 905 910

Thr Gly Val Arg Val Tyr Pro Leu Asn Pro Asp Gly Thr Arg Arg Pro

915 920 925

Glu Leu Pro Pro Val Ser Leu Pro Gly Arg Phe Glu Ala Thr Pro Ala

930 935 940

Ser Lys Thr Leu Trp Tyr Glu Ile Ile Leu Pro

945 950 955

<210> 31

<211> 2685

<212> DNA

<213> Teredinibacter turnerae

<400> 31

atgttttggt ttacctatgc gtactcgcga agcttgtgtc tgtaccgggc actcctgttt 60

ccgttgttgc tcttctgtgt tgatgctccg gcagcagagc gtctttcgca atcaccgaca 120

aaatcggtaa atcacacagg gttagcaccg ttcgtgcttc ccttcgacga tgatggtacg 180

ggtattaccg cttttaataa cgggtcgcac cagcgagggg agaggcttgc tccgctcact 240

atcgattccg ccggacattt ctccgtcgcc gggaataggt ttaggctttg gggcgtaaat 300

ataacagggg attccgcctt cccctcacac aaggatgcgg aaaaagttgc cggacgttta 360

gcaaaatttg gcgtgaacat tgttcggttt catcatttgg acaataactg gggtggtgcg 420

ggcctaattg attatcgacg gggagactcc cgtcatttga gtaaggaaaa tctcgataag 480

ctcgattatt ttattgccgc tttaaaatcg cgtggaatct acagcaatat aaacctgctt 540

accgcgcgcg aatttttacc tgctgacgga ttgcctgcat cgattactca aatcgattgg 600

aaggcgcggc aaatgctcgg cgcgatttct cccgcggtcc gcaatttgga aaaagcctac 660

gcgaaacaaa ttctgcaaca tgtaaatccg tacacgcgct tggcgtatcg ggtagatccg 720

gccatcgctt ttgttgaaat aaacaatgaa aacagcctgt ttcaacagtt ttttgacggc 780

aatatagacc gctggccgga agcgtttagt cagccactgg cgcaagagtg gaatgcttgg 840

ttggctcgca agtataaaga tcacgctgca ctcgagcgtg cctggcaggt gattgataaa 900

cctctgggca acaatctgtt aaaaaatgcg gattttgtgg cgggcttaca gggttggcat 960

ttagaccaga tcgacggcgc aaaggcgcag gccaatccgc tcgcatccgc tggtttgcgt 1020

atccaaataa ataccgtagg gcctgcgtta tggaacattc aactttctca aaacttacct 1080

gaactcaaag acggtgagat ttacacattg tcgtttgccg cacgctcgca gtcgcacagc 1140

agaattacac ctctgctgat gcagagtgtg gcaccctggc aggtggtcga atctttccct 1200

gtgaagctcg attccgaatg gcaggaattc aggtttcagt atgtgcatac tggatcagcg 1260

caaccgttgc gcctaacgtt gggtgaattg ggttcggtaa taggggcaat agatgttagg 1320

gatcttcgcc tgcagtctgg cggaactgtt ggtgaacttg ctaagaacca gactctcgaa 1380

cgccgttcta taggattaaa ccgtaacgat gaatcctatc tcgcgcagcg gcgggaagac 1440

tggtttgcat ttttgtacag ccttgagctg gcgtactggc aggatatgca cagctatttg 1500

gctgatgaac tcaaggttaa aaacaatatt tatgggacta tcgcgagctt gagtccgcct 1560

tcaatacagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttt 1620

cccgctggag cctgggatgc acagcagtgg agtgtcgata tgtcgtccat ggttaacgcc 1680

ttcccaaaca acacgttaag cgctctggcg cgccagcgcg tggccgggct gccttttgta 1740

gtctctgaat atcagcatgc tatgccaaat ccctattctg cagaaggccc gctgctggta 1800

gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttcgta cgatcagggg 1860

gaactgggtt ggcaacagga atttatcgat ggattcttta aaaccaattt gaacccagcg 1920

gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggagatgt gcagcctgcg 1980

catggcaaac gctggttaaa tttttcgcga tccggcgagc tcgcacgaat tacaaacgcc 2040

ggtgcatctt ggagtgtgag tccggcggac ttccctccgg aatggcgtgg ctacgctttt 2100

cacgagcaaa tgggcttgca gttggatatg tcagggaggg agtctaaacc gccggtgctt 2160

gatgttaaca aagtgactgc cgagacgggc gaactcagtt gggatacaac tatccaagcg 2220

cagggtaggg tgacaataaa cacagcgaaa tccgctggcg tagtgggctt tgttgcagat 2280

caacacttcc agctcggtgc gttggggttg accttgggcg atctacagat gggttgggcc 2340

agttggatgg tcactgcgca agagggtagt ttgcaggatc ttgcagcagg cgcttcgctg 2400

ttggcagttg cgaccgcaaa aattgaaaac agtaaaatgc gttggaacga cgctcataat 2460

tcgctcggcc gcaattgggg ggaagcgccg acgagagttg aagttgtgcc ttttagtctc 2520

tcgttgccaa ttgctgccag gcgggttagt gcctggtgtt tggatgagcg tggtcagcga 2580

atgcagtcgc tgagggttgt gcaaacagcg acaggcagtc gtatcgatgt ggatagcaaa 2640

gcgcgaacat tatggtacga gatcgtcata accccgaaaa tataa 2685

<210> 32

<211> 894

<212> PRT

<213> Teredinibacter turnerae

<400> 32

Met Phe Trp Phe Thr Tyr Ala Tyr Ser Arg Ser Leu Cys Leu Tyr Arg

1 5 10 15

Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Pro Ala Ala

20 25 30

Glu Arg Leu Ser Gln Ser Pro Thr Lys Ser Val Asn His Thr Gly Leu

35 40 45

Ala Pro Phe Val Leu Pro Phe Asp Asp Asp Gly Thr Gly Ile Thr Ala

50 55 60

Phe Asn Asn Gly Ser His Gln Arg Gly Glu Arg Leu Ala Pro Leu Thr

65 70 75 80

Ile Asp Ser Ala Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu

85 90 95

Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Lys Asp

100 105 110

Ala Glu Lys Val Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val

115 120 125

Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp

130 135 140

Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Glu Asn Leu Asp Lys

145 150 155 160

Leu Asp Tyr Phe Ile Ala Ala Leu Lys Ser Arg Gly Ile Tyr Ser Asn

165 170 175

Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro

180 185 190

Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala

195 200 205

Ile Ser Pro Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Gln Ile

210 215 220

Leu Gln His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Val Asp Pro

225 230 235 240

Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln

245 250 255

Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Glu Ala Phe Ser Gln Pro

260 265 270

Leu Ala Gln Glu Trp Asn Ala Trp Leu Ala Arg Lys Tyr Lys Asp His

275 280 285

Ala Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn

290 295 300

Asn Leu Leu Lys Asn Ala Asp Phe Val Ala Gly Leu Gln Gly Trp His

305 310 315 320

Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Asn Pro Leu Ala Ser

325 330 335

Ala Gly Leu Arg Ile Gln Ile Asn Thr Val Gly Pro Ala Leu Trp Asn

340 345 350

Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr

355 360 365

Thr Leu Ser Phe Ala Ala Arg Ser Gln Ser His Ser Arg Ile Thr Pro

370 375 380

Leu Leu Met Gln Ser Val Ala Pro Trp Gln Val Val Glu Ser Phe Pro

385 390 395 400

Val Lys Leu Asp Ser Glu Trp Gln Glu Phe Arg Phe Gln Tyr Val His

405 410 415

Thr Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser

420 425 430

Val Ile Gly Ala Ile Asp Val Arg Asp Leu Arg Leu Gln Ser Gly Gly

435 440 445

Thr Val Gly Glu Leu Ala Lys Asn Gln Thr Leu Glu Arg Arg Ser Ile

450 455 460

Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp

465 470 475 480

Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Ala Tyr Trp Gln Asp Met

485 490 495

His Ser Tyr Leu Ala Asp Glu Leu Lys Val Lys Asn Asn Ile Tyr Gly

500 505 510

Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe

515 520 525

Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala

530 535 540

Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala

545 550 555 560

Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly

565 570 575

Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr

580 585 590

Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp

595 600 605

Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp

610 615 620

Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala

625 630 635 640

Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp

645 650 655

Val Gln Pro Ala His Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Gly

660 665 670

Glu Leu Ala Arg Ile Thr Asn Ala Gly Ala Ser Trp Ser Val Ser Pro

675 680 685

Ala Asp Phe Pro Pro Glu Trp Arg Gly Tyr Ala Phe His Glu Gln Met

690 695 700

Gly Leu Gln Leu Asp Met Ser Gly Arg Glu Ser Lys Pro Pro Val Leu

705 710 715 720

Asp Val Asn Lys Val Thr Ala Glu Thr Gly Glu Leu Ser Trp Asp Thr

725 730 735

Thr Ile Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala

740 745 750

Gly Val Val Gly Phe Val Ala Asp Gln His Phe Gln Leu Gly Ala Leu

755 760 765

Gly Leu Thr Leu Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Val

770 775 780

Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Ala Gly Ala Ser Leu

785 790 795 800

Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn

805 810 815

Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg

820 825 830

Val Glu Val Val Pro Phe Ser Leu Ser Leu Pro Ile Ala Ala Arg Arg

835 840 845

Val Ser Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Met Gln Ser Leu

850 855 860

Arg Val Val Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys

865 870 875 880

Ala Arg Thr Leu Trp Tyr Glu Ile Val Ile Thr Pro Lys Ile

885 890

<210> 33

<211> 2682

<212> DNA

<213> Teredinibacter turnerae

<400> 33

atgtttttgt ttatctcaac gcactcacca agcctgtgcc tgtaccgggc acttctcttt 60

ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcaca atcaccgata 120

aagtctttca cgcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180

ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccgctcact 240

atcgattccg acgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300

attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgttta 360

gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420

ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480

ctcgattact ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540

accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600

aaggcgcggc agatgctcgg cgcgatttcg cctgcggttc gcaatctgga aaaagcctac 660

gcgaaaaaaa ttctgcatca tgtgaacccc tacacgcgcc tggcataccg ggcagacccg 720

gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780

aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840

ttgactcgaa agtataaaga tcagaatgca ctcgagcgcg cctggcaggt gattgataaa 900

cctctgggta acaatctgtt aaaaaatgcg aattttgtgg ccgggttaca ggggtggcat 960

ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020

attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080

gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140

caaattacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200

gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260

caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320

gatctgcgct tgcagcccgg cgggaccgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380

cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440

tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500

gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560

tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620

cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680

tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740

gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800

gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttctta cgaccagggg 1860

gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920

gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980

cagggcaaac gctggttaaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040

ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100

catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160

gataacaagg taactgcaga tacaggagcg ctcacctggg atacgtctgt ccaagcgcag 2220

ggcagggtga caataaacac ggcgaaatct gctggcgtag tgggctttat tgcagatcaa 2280

ggcttccagc tcggtgcgct cgaattgaga gtgggcgatt tgcagatggg ttgggccagt 2340

tggatgatca ctgcacaaga gggaagtttg caggatcttg ccccaggcgc atcgctgttg 2400

gcggttgcga cggcaaaaat tgagaacagt aaaatgcgtt ggaacgacgc gcataattcg 2460

cttggccgca attggggtga agcgccgacg agggttgagg ttgtgccctt tagtctcacg 2520

ctgccagttg cttccaggcg ggtaaatgcc tggtgtctgg atgagcgtgg gcagcgattg 2580

cacgcgttga aggtcgagca aacagccacg ggcagtcgta tcgacgtgga tagcaaagcg 2640

cgaacattgt ggtatgagat agccatcgcc cccaaaatct aa 2682

<210> 34

<211> 893

<212> PRT

<213> Teredinibacter turnerae

<400> 34

Met Phe Leu Phe Ile Ser Thr His Ser Pro Ser Leu Cys Leu Tyr Arg

1 5 10 15

Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu

20 25 30

Glu Arg Leu Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu

35 40 45

Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala

50 55 60

Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr

65 70 75 80

Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu

85 90 95

Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp

100 105 110

Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val

115 120 125

Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp

130 135 140

Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys

145 150 155 160

Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn

165 170 175

Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro

180 185 190

Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala

195 200 205

Ile Ser Pro Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Ile

210 215 220

Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Ala Asp Pro

225 230 235 240

Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln

245 250 255

Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro

260 265 270

Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln

275 280 285

Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn

290 295 300

Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His

305 310 315 320

Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser

325 330 335

Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn

340 345 350

Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr

355 360 365

Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Ile Thr Pro

370 375 380

Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro

385 390 395 400

Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His

405 410 415

Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser

420 425 430

Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly

435 440 445

Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile

450 455 460

Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp

465 470 475 480

Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met

485 490 495

His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly

500 505 510

Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe

515 520 525

Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala

530 535 540

Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala

545 550 555 560

Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly

565 570 575

Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr

580 585 590

Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp

595 600 605

Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp

610 615 620

Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala

625 630 635 640

Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp

645 650 655

Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg

660 665 670

Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro

675 680 685

Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile

690 695 700

Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu

705 710 715 720

Asp Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr Ser

725 730 735

Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala Gly

740 745 750

Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu Glu

755 760 765

Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile Thr

770 775 780

Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu Leu

785 790 795 800

Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn Asp

805 810 815

Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg Val

820 825 830

Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg Val

835 840 845

Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu Lys

850 855 860

Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys Ala

865 870 875 880

Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile

885 890

<210> 35

<211> 2685

<212> DNA

<213> Teredinibacter turnerae

<400> 35

atgtttttgt ttatctcaac gcactcacca cgcctgcgcc tgtaccgggc acttctcttt 60

ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcgca atcaccgata 120

aagtctttca ctcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180

ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240

atcgattccg atgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300

attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgttta 360

gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420

ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480

ctcgattact ttattgccgc tctaaaattg cgtggaatct acagcaatat aaacctgctt 540

accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600

aaggcgcggc agatgctcgg cgcgatttcg cctgcgattc gcaatctgga aaaagcctac 660

gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc tggcataccg gacagacccg 720

gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780

aatatagatc gctggccaaa ggagtttaaa cggcaactgg cgcaagagtg gaatgcttgg 840

ttgactcgca agtataaaga tcacaatgca ctcgagcgcg cctggcaggt gattgataaa 900

cctctgggta acaatctgtt aaaaaatgcg aactttgtgg ccgggttaca gggttggcat 960

ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020

attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080

gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140

caatttacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200

gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260

caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattatg 1320

gatctgcgct tgcagcccgg cgggagcgtc ggtgaacttg ccgctaacca aacgcttgaa 1380

cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcggaaagat 1440

tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgttatctg 1500

gctgaggaac tcaaggttaa aagcaatatt tatgggacta tcgcgagctt gagtccgcct 1560

tcaattcagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttc 1620

cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680

tttccaaaca atacgttgag cgcgctggcg cgccaacgag ttgccggcct gccttttgtt 1740

gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800

gcggcctatg cgggtttaca ggattgggac ggcgtttatc tgttttctta cgaccagggt 1860

gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920

gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980

cagggcaaac gctggttaaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040

ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100

catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160

gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220

cagggcaggg tgaaaataaa cacggcgaaa tccgctggcg tagtgggctt tattgcagat 2280

caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340

agttggatga tcactgcaca agagggaagt ttgcaggatc tcgcccaagg cgcatcgctg 2400

ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gctggaacgg cgcgcataat 2460

tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ttttagtctc 2520

acgctgccaa ttgcttccag gcgggtaaat gcttggtctc tggatgagcg tgggcagcga 2580

ttgcacgcgt tgaaggtcga gcaaatagcc acgggcagtc gtatcgacgt ggatagcaaa 2640

gcgcgaacat tgtggtatga gatagccatc gcccccaaaa tctaa 2685

<210> 36

<211> 894

<212> PRT

<213> Teredinibacter turnerae

<400> 36

Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Arg Leu Tyr Arg

1 5 10 15

Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu

20 25 30

Glu Arg Leu Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu

35 40 45

Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala

50 55 60

Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr

65 70 75 80

Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu

85 90 95

Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp

100 105 110

Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val

115 120 125

Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp

130 135 140

Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys

145 150 155 160

Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn

165 170 175

Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro

180 185 190

Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala

195 200 205

Ile Ser Pro Ala Ile Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu

210 215 220

Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Thr Asp Pro

225 230 235 240

Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln

245 250 255

Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Gln

260 265 270

Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp His

275 280 285

Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn

290 295 300

Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His

305 310 315 320

Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser

325 330 335

Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn

340 345 350

Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr

355 360 365

Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Phe Thr Pro

370 375 380

Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro

385 390 395 400

Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His

405 410 415

Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser

420 425 430

Val Ile Gly Ala Ile Asp Ile Met Asp Leu Arg Leu Gln Pro Gly Gly

435 440 445

Ser Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile

450 455 460

Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Lys Asp

465 470 475 480

Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met

485 490 495

His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly

500 505 510

Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe

515 520 525

Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala

530 535 540

Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala

545 550 555 560

Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly

565 570 575

Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr

580 585 590

Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp

595 600 605

Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp

610 615 620

Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala

625 630 635 640

Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp

645 650 655

Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg

660 665 670

Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro

675 680 685

Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile

690 695 700

Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu

705 710 715 720

Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr

725 730 735

Ser Val Gln Ala Gln Gly Arg Val Lys Ile Asn Thr Ala Lys Ser Ala

740 745 750

Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu

755 760 765

Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile

770 775 780

Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Gln Gly Ala Ser Leu

785 790 795 800

Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn

805 810 815

Gly Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg

820 825 830

Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Ile Ala Ser Arg Arg

835 840 845

Val Asn Ala Trp Ser Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu

850 855 860

Lys Val Glu Gln Ile Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys

865 870 875 880

Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile

885 890

<210> 37

<211> 2685

<212> DNA

<213> Teredinibacter turnerae

<400> 37

atgtttttgt ttatctcaac gcactcacca cgcctgcgcc tgtaccgggc acttctcttt 60

ctgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcgga atcaccgata 120

aagtctttca ctcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180

ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240

atcgattccg acgggcattt ctccgtcgcc gggaataggt ttaggctttg gggcgtgaac 300

attacgggtg actcagcttt tccatcacac gaagacgccg aaaaaattgc cgggcgttta 360

gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420

ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggataa tctcgataag 480

ctcgattact ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540

accgcgcggg aatttttacc tgctgatgaa ttacccgcat cgattactca gattgactgg 600

aaggcgcggc agatgcttgg cgcgatttcg cctacggttc gcaatctgga aaaagcctac 660

gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc ttgcataccg ggcagacccg 720

gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780

aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840

ttgactcgca agtataaaga tcagaatgca ctcgagcgcg cctggcaggt gattgataaa 900

cctctgggta acaatctgtt aacaaatgcg aattttgtgg ccgggttaca ggggtggcac 960

ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020

attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080

gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140

caaattacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200

gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260

caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320

gatctgcgtt tgcagcccgg cgggactgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380

cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440

tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500

gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560

tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620

cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680

tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740

gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800

gcggcctatg cgggtttgca ggattgggac ggtgtttatc tgttttctta cgaccagggg 1860

gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920

gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980

cagggcaaac gctggttaaa tttttcgcca tcccgcgagc tcgcacaaat tgcaagcgcc 2040

ggtgcatcct ggagcgtgag tccggcgaac ttcccggcgg actggcgtgg ctacgcattt 2100

catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160

gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220

cagggcaggg tgacaataaa cacggcgaaa tctgctggcg tagtgggctt tattgcagat 2280

caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340

agttggatga tcactgcaca agagggaagt ttgcaggatc ttgccccagg cgcatcgctg 2400

ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gttggaacga cgcgcataat 2460

tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ctttagtctc 2520

acgctgccag ttgcttccag gcgggtaaat gcctggtgtc tggatgagcg tgggcagcga 2580

ttgcacgcgt tgaaggtcga gcaaacagcc acgggcagtc gtatcgacgt ggatagcaaa 2640

gcgcgaacat tgtggtatga gatagcgatc gcccccaaaa tctaa 2685

<210> 38

<211> 894

<212> PRT

<213> Teredinibacter turnerae

<400> 38

Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Arg Leu Tyr Arg

1 5 10 15

Ala Leu Leu Phe Leu Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu

20 25 30

Glu Arg Leu Ala Glu Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu

35 40 45

Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala

50 55 60

Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr

65 70 75 80

Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu

85 90 95

Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp

100 105 110

Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val

115 120 125

Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp

130 135 140

Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys

145 150 155 160

Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn

165 170 175

Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Glu Leu Pro

180 185 190

Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala

195 200 205

Ile Ser Pro Thr Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu

210 215 220

Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Ala Asp Pro

225 230 235 240

Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln

245 250 255

Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro

260 265 270

Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln

275 280 285

Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn

290 295 300

Asn Leu Leu Thr Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His

305 310 315 320

Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser

325 330 335

Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn

340 345 350

Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr

355 360 365

Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Ile Thr Pro

370 375 380

Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro

385 390 395 400

Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His

405 410 415

Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser

420 425 430

Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly

435 440 445

Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile

450 455 460

Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp

465 470 475 480

Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met

485 490 495

His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly

500 505 510

Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe

515 520 525

Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala

530 535 540

Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala

545 550 555 560

Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly

565 570 575

Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr

580 585 590

Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp

595 600 605

Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp

610 615 620

Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala

625 630 635 640

Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp

645 650 655

Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Pro Ser Arg

660 665 670

Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro

675 680 685

Ala Asn Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile

690 695 700

Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu

705 710 715 720

Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr

725 730 735

Ser Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala

740 745 750

Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu

755 760 765

Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile

770 775 780

Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu

785 790 795 800

Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn

805 810 815

Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg

820 825 830

Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg

835 840 845

Val Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu

850 855 860

Lys Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys

865 870 875 880

Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile

885 890

<210> 39

<211> 2604

<212> DNA

<213> 牛肠宏基因组

<400> 39

atgatacgga attgtttttt gccggctgcg gcactaatga tcggttgcgc atttggggcg 60

gacgacgcca tgttcccctt cgtaccgtcg tacgacgcgc cgatgaacgt ggttaacatg 120

agccatctgc tggacgcgcc cgccggcagc catgggcgca tccgtgttaa agacggacac 180

ttcgtgaacg accagggccg ggtcagactg cacgcgacga atcttacggg accggcgaac 240

tttccgtcgc acgaagaggc ggagcgcctt gcggcgcgtc tggcccgttt cggcatcaac 300

tgcgtccgac tgcactattt cgacagttcc tacggcacgt tcatgcttcc ggccgagcag 360

ggtatcttta cggataaaac cggagaactc cgacgtctcg atcccaagca gcgcgaccgg 420

caggactatc tgatcgccca gttcaagaaa cgcggcattt atgtggatat caacctgcac 480

gtcgcccgta ccctggacgc aagcgacggt ttcgagccgg gaaccccatg ggccaacaag 540

ggcgtggacc agtttgaccc gcgggtgatc gcggcagaaa aagcgtatgc ccgcgaattg 600

ctttcgcacg tcaatcccta taccggactc agttacctga aagaccccgt tgtcgccatc 660

gtggaactca acaacgagga tgcgctgtgg aatcaatacc ttaggggcgg gattgaccag 720

cttggaaaac cgtacgcgaa agaattccaa cgccaatgga acgattggct gcgtaaaaaa 780

tacggcaacg acgaacgaat gcgcgcggct tggcgggtaa agacgcagcc gctgggcgac 840

gaaatgattc aggagggttc gtttgaagag aacgtggtgc cggacggatc gcggtggatt 900

ctcgaccttg agcgtacgaa agcgtctgcc gcttcccaaa acggctcgct ccgcatcacg 960

gtcgaaaaga agtcctccga ccgttttttc cccaagctct accgccgcgt atccgtaaaa 1020

aagaatgtcc catacacggt gtcgttccga atccgccaag cggagggaga gcctggcgaa 1080

gtgggtttcg ccgtggccga ccgcggcaag ggctgggaat cgctgggcat ccacaccgtc 1140

cttaagccta ccaaaaactg gacgaaacgg aagttcacgt tttatgccgc aaaggattgc 1200

cagcaagcgg aaatccagtt cacgcgcttc gaggttggcg cttacgagat tgacgacctt 1260

tcgttccgaa ccggcaacga accggaaaat ctttccaccc tttccgccga aaagggcgag 1320

gtggcaatcg tgaagacgaa agactccgta gtgccggaga tgaaacgcga cttctaccgg 1380

tttgtaatgg atacggaaca cgcctattgg acgggtatgc gcgattatct gcaaaaagag 1440

ctcggactgg aagcaccagt ctccgccacc cagctcgact attcgccgcc gcatctgcag 1500

gcggagatgg acttcgtgga caaccacgcc tactggtgcc acccgagcgt gcggaaagac 1560

tggtcgatcc gcaacaaggc gatggtaaac gcgcgcggcg ggtgcattct cggcctcgcg 1620

gggcaacgtg tggcgggcaa accctacacg gtaagcgagt acaaccaccc ctacccgatt 1680

tactacggcg cggaggggca acctatgcta cgcgcctacg gggcgttgca gggatgggac 1740

ggcgtattcg aatattccta caacaaccgg cagaacgccg agccggacca caacgagtat 1800

ttcttcagca tggcggcacg gaccgacgtg ctggcgcatt tcccggcatg cgcggcgatg 1860

tatctgcggg gcgatgtcaa agagagcgca acgcgtatcg tcgcgaatct tccgcttgag 1920

gaatatttcg aacggttggt gaaagccaac aaggtaagcc aaggcatcac cacggcaacc 1980

gacgggaaac tgtccgccga actgggattg gttcacagcg tggccgtgga tgtgacgggg 2040

caaaccccgc gcacaacgga taatattccg ccgcccggca agataatcgc tagcgacacg 2100

ggggaaatcg tttggaacaa cgatatcgac ggcgcgggcg tttggacggt ggacacgcca 2160

aacacgaaaa tcttctccgg tttcccgaag gggcgcgtgt tcaatctaag cggagtaaaa 2220

ctggcggttg gagagactaa actcggttgg gcgacggtgt cgctgacctc gcacgacgcg 2280

accgggtttg gcggggacgg aaagcccgcg cgtattctgc ttacggcgac cggactttct 2340

cacaacggcg gagcaaagtt cgtcgcaaag ggaaaagagg cgatttttgc ttccgagtgg 2400

ggcaacggta aaacggtgaa cgaaggtatt cccgcgacag tcaccctacc cgcgccgacg 2460

gcaaagacca gctgctgggc acttgacgaa cgcggtgaac ggaaagcgaa agtacccgtg 2520

acggccgacg ccgacggtca tgccgtcatc gcgatcggcc caacctggca aacggtgtgg 2580

tacgaaatca acgttgaggg atga 2604

<210> 40

<211> 867

<212> PRT

<213> 牛肠宏基因组

<400> 40

Met Ile Arg Asn Cys Phe Leu Pro Ala Ala Ala Leu Met Ile Gly Cys

1 5 10 15

Ala Phe Gly Ala Asp Asp Ala Met Phe Pro Phe Val Pro Ser Tyr Asp

20 25 30

Ala Pro Met Asn Val Val Asn Met Ser His Leu Leu Asp Ala Pro Ala

35 40 45

Gly Ser His Gly Arg Ile Arg Val Lys Asp Gly His Phe Val Asn Asp

50 55 60

Gln Gly Arg Val Arg Leu His Ala Thr Asn Leu Thr Gly Pro Ala Asn

65 70 75 80

Phe Pro Ser His Glu Glu Ala Glu Arg Leu Ala Ala Arg Leu Ala Arg

85 90 95

Phe Gly Ile Asn Cys Val Arg Leu His Tyr Phe Asp Ser Ser Tyr Gly

100 105 110

Thr Phe Met Leu Pro Ala Glu Gln Gly Ile Phe Thr Asp Lys Thr Gly

115 120 125

Glu Leu Arg Arg Leu Asp Pro Lys Gln Arg Asp Arg Gln Asp Tyr Leu

130 135 140

Ile Ala Gln Phe Lys Lys Arg Gly Ile Tyr Val Asp Ile Asn Leu His

145 150 155 160

Val Ala Arg Thr Leu Asp Ala Ser Asp Gly Phe Glu Pro Gly Thr Pro

165 170 175

Trp Ala Asn Lys Gly Val Asp Gln Phe Asp Pro Arg Val Ile Ala Ala

180 185 190

Glu Lys Ala Tyr Ala Arg Glu Leu Leu Ser His Val Asn Pro Tyr Thr

195 200 205

Gly Leu Ser Tyr Leu Lys Asp Pro Val Val Ala Ile Val Glu Leu Asn

210 215 220

Asn Glu Asp Ala Leu Trp Asn Gln Tyr Leu Arg Gly Gly Ile Asp Gln

225 230 235 240

Leu Gly Lys Pro Tyr Ala Lys Glu Phe Gln Arg Gln Trp Asn Asp Trp

245 250 255

Leu Arg Lys Lys Tyr Gly Asn Asp Glu Arg Met Arg Ala Ala Trp Arg

260 265 270

Val Lys Thr Gln Pro Leu Gly Asp Glu Met Ile Gln Glu Gly Ser Phe

275 280 285

Glu Glu Asn Val Val Pro Asp Gly Ser Arg Trp Ile Leu Asp Leu Glu

290 295 300

Arg Thr Lys Ala Ser Ala Ala Ser Gln Asn Gly Ser Leu Arg Ile Thr

305 310 315 320

Val Glu Lys Lys Ser Ser Asp Arg Phe Phe Pro Lys Leu Tyr Arg Arg

325 330 335

Val Ser Val Lys Lys Asn Val Pro Tyr Thr Val Ser Phe Arg Ile Arg

340 345 350

Gln Ala Glu Gly Glu Pro Gly Glu Val Gly Phe Ala Val Ala Asp Arg

355 360 365

Gly Lys Gly Trp Glu Ser Leu Gly Ile His Thr Val Leu Lys Pro Thr

370 375 380

Lys Asn Trp Thr Lys Arg Lys Phe Thr Phe Tyr Ala Ala Lys Asp Cys

385 390 395 400

Gln Gln Ala Glu Ile Gln Phe Thr Arg Phe Glu Val Gly Ala Tyr Glu

405 410 415

Ile Asp Asp Leu Ser Phe Arg Thr Gly Asn Glu Pro Glu Asn Leu Ser

420 425 430

Thr Leu Ser Ala Glu Lys Gly Glu Val Ala Ile Val Lys Thr Lys Asp

435 440 445

Ser Val Val Pro Glu Met Lys Arg Asp Phe Tyr Arg Phe Val Met Asp

450 455 460

Thr Glu His Ala Tyr Trp Thr Gly Met Arg Asp Tyr Leu Gln Lys Glu

465 470 475 480

Leu Gly Leu Glu Ala Pro Val Ser Ala Thr Gln Leu Asp Tyr Ser Pro

485 490 495

Pro His Leu Gln Ala Glu Met Asp Phe Val Asp Asn His Ala Tyr Trp

500 505 510

Cys His Pro Ser Val Arg Lys Asp Trp Ser Ile Arg Asn Lys Ala Met

515 520 525

Val Asn Ala Arg Gly Gly Cys Ile Leu Gly Leu Ala Gly Gln Arg Val

530 535 540

Ala Gly Lys Pro Tyr Thr Val Ser Glu Tyr Asn His Pro Tyr Pro Ile

545 550 555 560

Tyr Tyr Gly Ala Glu Gly Gln Pro Met Leu Arg Ala Tyr Gly Ala Leu

565 570 575

Gln Gly Trp Asp Gly Val Phe Glu Tyr Ser Tyr Asn Asn Arg Gln Asn

580 585 590

Ala Glu Pro Asp His Asn Glu Tyr Phe Phe Ser Met Ala Ala Arg Thr

595 600 605

Asp Val Leu Ala His Phe Pro Ala Cys Ala Ala Met Tyr Leu Arg Gly

610 615 620

Asp Val Lys Glu Ser Ala Thr Arg Ile Val Ala Asn Leu Pro Leu Glu

625 630 635 640

Glu Tyr Phe Glu Arg Leu Val Lys Ala Asn Lys Val Ser Gln Gly Ile

645 650 655

Thr Thr Ala Thr Asp Gly Lys Leu Ser Ala Glu Leu Gly Leu Val His

660 665 670

Ser Val Ala Val Asp Val Thr Gly Gln Thr Pro Arg Thr Thr Asp Asn

675 680 685

Ile Pro Pro Pro Gly Lys Ile Ile Ala Ser Asp Thr Gly Glu Ile Val

690 695 700

Trp Asn Asn Asp Ile Asp Gly Ala Gly Val Trp Thr Val Asp Thr Pro

705 710 715 720

Asn Thr Lys Ile Phe Ser Gly Phe Pro Lys Gly Arg Val Phe Asn Leu

725 730 735

Ser Gly Val Lys Leu Ala Val Gly Glu Thr Lys Leu Gly Trp Ala Thr

740 745 750

Val Ser Leu Thr Ser His Asp Ala Thr Gly Phe Gly Gly Asp Gly Lys

755 760 765

Pro Ala Arg Ile Leu Leu Thr Ala Thr Gly Leu Ser His Asn Gly Gly

770 775 780

Ala Lys Phe Val Ala Lys Gly Lys Glu Ala Ile Phe Ala Ser Glu Trp

785 790 795 800

Gly Asn Gly Lys Thr Val Asn Glu Gly Ile Pro Ala Thr Val Thr Leu

805 810 815

Pro Ala Pro Thr Ala Lys Thr Ser Cys Trp Ala Leu Asp Glu Arg Gly

820 825 830

Glu Arg Lys Ala Lys Val Pro Val Thr Ala Asp Ala Asp Gly His Ala

835 840 845

Val Ile Ala Ile Gly Pro Thr Trp Gln Thr Val Trp Tyr Glu Ile Asn

850 855 860

Val Glu Gly

865

<210> 41

<211> 2622

<212> DNA

<213> 浮霉状菌属

<220>

<221> CDS

<222> (1)..(2619)

<220>

<221> 信号肽

<222> (1)..(81)

<220>

<221> 成熟肽

<222> (82)..(2619)

<220>

<221> PF00150

<222> (277)..(687)

<220>

<221> PF02018

<222> (850)..(1239)

<400> 41

atg agg cga aac gtt gcg ttc gat tgc att ctg atc ctg cta ctt ggg 48

Met Arg Arg Asn Val Ala Phe Asp Cys Ile Leu Ile Leu Leu Leu Gly

-25 -20 -15

cta ctg tgc ttc gga gca aca ccc tct cgg gga gaa gaa acg gca act 96

Leu Leu Cys Phe Gly Ala Thr Pro Ser Arg Gly Glu Glu Thr Ala Thr

-10 -5 -1 1 5

cca ggc aag ctc ttt ccg ttt gtc ctg agc tac gaa cca acg gac agc 144

Pro Gly Lys Leu Phe Pro Phe Val Leu Ser Tyr Glu Pro Thr Asp Ser

10 15 20

atc aca aac atc tca gaa tgg ctt gac cgt ccc gct ggg aag cac ggg 192

Ile Thr Asn Ile Ser Glu Trp Leu Asp Arg Pro Ala Gly Lys His Gly

25 30 35

ttt att cgg gcg gaa aat ggg cac ttt gtg aca gat gcc ggg cgg atc 240

Phe Ile Arg Ala Glu Asn Gly His Phe Val Thr Asp Ala Gly Arg Ile

40 45 50

cgg ctg tgg gcc act aac ctc tgt ttt gaa gcc tgc ttc cca acc aag 288

Arg Leu Trp Ala Thr Asn Leu Cys Phe Glu Ala Cys Phe Pro Thr Lys

55 60 65

gaa gag gca gaa cgc ctt gcc agg cgt ctc gcc agc ctg ggg atc aat 336

Glu Glu Ala Glu Arg Leu Ala Arg Arg Leu Ala Ser Leu Gly Ile Asn

70 75 80 85

tgt gtg cga atg cat cac atg gac aat cgg cac atc tgg ggt aaa agc 384

Cys Val Arg Met His His Met Asp Asn Arg His Ile Trp Gly Lys Ser

90 95 100

ccc aat aag ctg acg att gat ccc gaa atg ctg gat aag ctg gat tac 432

Pro Asn Lys Leu Thr Ile Asp Pro Glu Met Leu Asp Lys Leu Asp Tyr

105 110 115

ctg att tat caa ttg aaa ttg cac ggg atc tat acc aac ctc aat ctg 480

Leu Ile Tyr Gln Leu Lys Leu His Gly Ile Tyr Thr Asn Leu Asn Leu

120 125 130

cat gtg tcc cgg gag ttt ggc ccg gcc gaa ggc ttt ccc gcg gtg gag 528

His Val Ser Arg Glu Phe Gly Pro Ala Glu Gly Phe Pro Ala Val Glu

135 140 145

ggc ctc ccc aac tac gat aaa ggg atc gac aac ttt gaa ccc cgg atg 576

Gly Leu Pro Asn Tyr Asp Lys Gly Ile Asp Asn Phe Glu Pro Arg Met

150 155 160 165

atc gag tac cag aaa aaa tat gcc cgc gat ttg ctc acg cac gtc aat 624

Ile Glu Tyr Gln Lys Lys Tyr Ala Arg Asp Leu Leu Thr His Val Asn

170 175 180

ccc tac acc ggc acg gcg tac atc aac gaa ccg gcc att gcg atg gtc 672

Pro Tyr Thr Gly Thr Ala Tyr Ile Asn Glu Pro Ala Ile Ala Met Val

185 190 195

gaa atc aat aac gaa aat gca gcg ttt gac gag tac cgc aag gga gcg 720

Glu Ile Asn Asn Glu Asn Ala Ala Phe Asp Glu Tyr Arg Lys Gly Ala

200 205 210

ttt gat cat ttg ccc gag ccg tac gcc agc caa ctc cgc aag ctg tgg 768

Phe Asp His Leu Pro Glu Pro Tyr Ala Ser Gln Leu Arg Lys Leu Trp

215 220 225

aat gcc tgg ctg aaa aag aaa tac ggc agt gac gac gcg ctt cgc aaa 816

Asn Ala Trp Leu Lys Lys Lys Tyr Gly Ser Asp Asp Ala Leu Arg Lys

230 235 240 245

gcg tgg aat gcc cag cgt caa ccc ctg ggc gag gaa atc ctg aaa aat 864

Ala Trp Asn Ala Gln Arg Gln Pro Leu Gly Glu Glu Ile Leu Lys Asn

250 255 260

cgt gac ttt tcc ggc cag tgg gaa aag gtg tgg aac ctc cag cgt gac 912

Arg Asp Phe Ser Gly Gln Trp Glu Lys Val Trp Asn Leu Gln Arg Asp

265 270 275

aat ctc tcg gag gtc gtc gcc gag gtc att ccg aat ggc ttt cag ggc 960

Asn Leu Ser Glu Val Val Ala Glu Val Ile Pro Asn Gly Phe Gln Gly

280 285 290

aaa ccc gcc ttg cgt ttg cgc gtc atc cgc aac gga caa gaa acc tgg 1008

Lys Pro Ala Leu Arg Leu Arg Val Ile Arg Asn Gly Gln Glu Thr Trp

295 300 305

atc ccc cag tta agc cag ggc ggt ttt tca gtt cag aaa ggt cag gtg 1056

Ile Pro Gln Leu Ser Gln Gly Gly Phe Ser Val Gln Lys Gly Gln Val

310 315 320 325

tac act ctc cga ttc tgg ctg aaa gcg gac aaa ccg ggc cgg atc gac 1104

Tyr Thr Leu Arg Phe Trp Leu Lys Ala Asp Lys Pro Gly Arg Ile Asp

330 335 340

gtg aac tgc atg atg aac cac gat ccc tgg cag cgt ctc ggc ctt tcc 1152

Val Asn Cys Met Met Asn His Asp Pro Trp Gln Arg Leu Gly Leu Ser

345 350 355

gcg gat gtt caa acc tcg gcc gag tgg aag gaa tat cgc ctc agc ttt 1200

Ala Asp Val Gln Thr Ser Ala Glu Trp Lys Glu Tyr Arg Leu Ser Phe

360 365 370

gtg gcg gat cgc gat gat cca aat gcc agg atc acg ttc agc caa ctc 1248

Val Ala Asp Arg Asp Asp Pro Asn Ala Arg Ile Thr Phe Ser Gln Leu

375 380 385

cgt ccc ggg acg tac gaa ctg gca gac gtg tca ctc cgg ccg ggt ggg 1296

Arg Pro Gly Thr Tyr Glu Leu Ala Asp Val Ser Leu Arg Pro Gly Gly

390 395 400 405

gtc atc ggc ctg gaa gag ggc caa tcc ctc gcc gat cag acg gtt ccc 1344

Val Ile Gly Leu Glu Glu Gly Gln Ser Leu Ala Asp Gln Thr Val Pro

410 415 420

att gtt cct gct cgc gga ccg caa atg acg gcc gcc gcc cgg gcc gac 1392

Ile Val Pro Ala Arg Gly Pro Gln Met Thr Ala Ala Ala Arg Ala Asp

425 430 435

ttc gca gat ttt ttg tgg gag ctc gaa cgc gac tac tgg tgg gga atg 1440

Phe Ala Asp Phe Leu Trp Glu Leu Glu Arg Asp Tyr Trp Trp Gly Met

440 445 450

tac cga ttt ctg aag gag gaa ctc aag ctg aag ccg ctg gtc gcg gga 1488

Tyr Arg Phe Leu Lys Glu Glu Leu Lys Leu Lys Pro Leu Val Ala Gly

455 460 465

acg caa ctc tcc tac agt cca gtt cac att caa gct ggg ctg gac tac 1536

Thr Gln Leu Ser Tyr Ser Pro Val His Ile Gln Ala Gly Leu Asp Tyr

470 475 480 485

atc gac tcg cat gcc tac tgg cag cat ccc gtt ttc ccc ggc agg cca 1584

Ile Asp Ser His Ala Tyr Trp Gln His Pro Val Phe Pro Gly Arg Pro

490 495 500

tgg gat ccg gaa aac tgg tat gtg cgt agt ctg gcc ctc gtg aat cag 1632

Trp Asp Pro Glu Asn Trp Tyr Val Arg Ser Leu Ala Leu Val Asn Gln

505 510 515

ccg gga ggc aca ctt tcc gga ctc gcc agt cgg cgt gtc gaa ggt ttg 1680

Pro Gly Gly Thr Leu Ser Gly Leu Ala Ser Arg Arg Val Glu Gly Leu

520 525 530

ccg ttc acc gtg agc gaa tac aac cac ccg gct ccc aac gaa tac gcc 1728

Pro Phe Thr Val Ser Glu Tyr Asn His Pro Ala Pro Asn Glu Tyr Ala

535 540 545

gcc gaa gga ttt ccg atg atc gcg gct ttt ggg gct ttt cag gat tgg 1776

Ala Glu Gly Phe Pro Met Ile Ala Ala Phe Gly Ala Phe Gln Asp Trp

550 555 560 565

gat gga atc ttc agc ttc act tac agc cac agt cga gat tac gag ccg 1824

Asp Gly Ile Phe Ser Phe Thr Tyr Ser His Ser Arg Asp Tyr Glu Pro

570 575 580

cga aaa atc acg ggt ttc ttc gac atc aaa agc gag gtg acc aaa ctc 1872

Arg Lys Ile Thr Gly Phe Phe Asp Ile Lys Ser Glu Val Thr Lys Leu

585 590 595

gtt cac atg ccc gcc tgc gtc gcc atg ttc tac cgg ggt gat gtg caa 1920

Val His Met Pro Ala Cys Val Ala Met Phe Tyr Arg Gly Asp Val Gln

600 605 610

ccc gcc acc cag gct gtg gtc gtg ggc atg acc cgt gaa aag gaa caa 1968

Pro Ala Thr Gln Ala Val Val Val Gly Met Thr Arg Glu Lys Glu Gln

615 620 625

tcc atc ctc cga gaa aca ctc aat ccc tgg gcg ctg acc gcc gac cgt 2016

Ser Ile Leu Arg Glu Thr Leu Asn Pro Trp Ala Leu Thr Ala Asp Arg

630 635 640 645

ttg ggt att ccc gcc aac ctg agc ttg ctc cat cgg gtg gcc atg gca 2064

Leu Gly Ile Pro Ala Asn Leu Ser Leu Leu His Arg Val Ala Met Ala

650 655 660

ctg aaa gaa ccc agc gat agt gtg cca cca ccc acg ctg tcc gcg gag 2112

Leu Lys Glu Pro Ser Asp Ser Val Pro Pro Pro Thr Leu Ser Ala Glu

665 670 675

cag aag gtt ttc ctg tcc gat acg caa caa atc tgc tgg gat gtc tct 2160

Gln Lys Val Phe Leu Ser Asp Thr Gln Gln Ile Cys Trp Asp Val Ser

680 685 690

cag ccc ggc gcc ggg gtg ttc ctg gtc aac tcg ccg aaa acg aaa ctc 2208

Gln Pro Gly Ala Gly Val Phe Leu Val Asn Ser Pro Lys Thr Lys Leu

695 700 705

gtg acc ggt ttc ccc gcc gga aga act ttc aat ctg aat gga atc cag 2256

Val Thr Gly Phe Pro Ala Gly Arg Thr Phe Asn Leu Asn Gly Ile Gln

710 715 720 725

att cag att gga gaa acg gag ctg ggt tgg gcg acc gtt tcg ctc acc 2304

Ile Gln Ile Gly Glu Thr Glu Leu Gly Trp Ala Thr Val Ser Leu Thr

730 735 740

gtt atc aaa ggg gac gga ttt gat cgg cct ggc cga atc ctc ctc gct 2352

Val Ile Lys Gly Asp Gly Phe Asp Arg Pro Gly Arg Ile Leu Leu Ala

745 750 755

gct acg gga aag gcc caa aat aca ggc tgg gac ttc cgt aaa gag ggc 2400

Ala Thr Gly Lys Ala Gln Asn Thr Gly Trp Asp Phe Arg Lys Glu Gly

760 765 770

gat cgg gtg acc gtg gga cgc cgc tgg ggc gac gag ccg atc ctc tgc 2448

Asp Arg Val Thr Val Gly Arg Arg Trp Gly Asp Glu Pro Ile Leu Cys

775 780 785

gaa gga gtg ccg gct cgc atc gtg ctg ccg gtt tcg tcc agc cgc gtg 2496

Glu Gly Val Pro Ala Arg Ile Val Leu Pro Val Ser Ser Ser Arg Val

790 795 800 805

aaa gtc tat gcc ctc gac gag gcg gga cgc cgc agg gac gcg gtg acg 2544

Lys Val Tyr Ala Leu Asp Glu Ala Gly Arg Arg Arg Asp Ala Val Thr

810 815 820

gtt tct ggt ggc gat cag gcc gtt gtc gaa ata ggg ccc caa ttc agg 2592

Val Ser Gly Gly Asp Gln Ala Val Val Glu Ile Gly Pro Gln Phe Arg

825 830 835

acg ctg tgg tac gaa atc gaa atc caa tga 2622

Thr Leu Trp Tyr Glu Ile Glu Ile Gln

840 845

<210> 42

<211> 873

<212> PRT

<213> 浮霉状菌属

<400> 42

Met Arg Arg Asn Val Ala Phe Asp Cys Ile Leu Ile Leu Leu Leu Gly

-25 -20 -15

Leu Leu Cys Phe Gly Ala Thr Pro Ser Arg Gly Glu Glu Thr Ala Thr

-10 -5 -1 1 5

Pro Gly Lys Leu Phe Pro Phe Val Leu Ser Tyr Glu Pro Thr Asp Ser

10 15 20

Ile Thr Asn Ile Ser Glu Trp Leu Asp Arg Pro Ala Gly Lys His Gly

25 30 35

Phe Ile Arg Ala Glu Asn Gly His Phe Val Thr Asp Ala Gly Arg Ile

40 45 50

Arg Leu Trp Ala Thr Asn Leu Cys Phe Glu Ala Cys Phe Pro Thr Lys

55 60 65

Glu Glu Ala Glu Arg Leu Ala Arg Arg Leu Ala Ser Leu Gly Ile Asn

70 75 80 85

Cys Val Arg Met His His Met Asp Asn Arg His Ile Trp Gly Lys Ser

90 95 100

Pro Asn Lys Leu Thr Ile Asp Pro Glu Met Leu Asp Lys Leu Asp Tyr

105 110 115

Leu Ile Tyr Gln Leu Lys Leu His Gly Ile Tyr Thr Asn Leu Asn Leu

120 125 130

His Val Ser Arg Glu Phe Gly Pro Ala Glu Gly Phe Pro Ala Val Glu

135 140 145

Gly Leu Pro Asn Tyr Asp Lys Gly Ile Asp Asn Phe Glu Pro Arg Met

150 155 160 165

Ile Glu Tyr Gln Lys Lys Tyr Ala Arg Asp Leu Leu Thr His Val Asn

170 175 180

Pro Tyr Thr Gly Thr Ala Tyr Ile Asn Glu Pro Ala Ile Ala Met Val

185 190 195

Glu Ile Asn Asn Glu Asn Ala Ala Phe Asp Glu Tyr Arg Lys Gly Ala

200 205 210

Phe Asp His Leu Pro Glu Pro Tyr Ala Ser Gln Leu Arg Lys Leu Trp

215 220 225

Asn Ala Trp Leu Lys Lys Lys Tyr Gly Ser Asp Asp Ala Leu Arg Lys

230 235 240 245

Ala Trp Asn Ala Gln Arg Gln Pro Leu Gly Glu Glu Ile Leu Lys Asn

250 255 260

Arg Asp Phe Ser Gly Gln Trp Glu Lys Val Trp Asn Leu Gln Arg Asp

265 270 275

Asn Leu Ser Glu Val Val Ala Glu Val Ile Pro Asn Gly Phe Gln Gly

280 285 290

Lys Pro Ala Leu Arg Leu Arg Val Ile Arg Asn Gly Gln Glu Thr Trp

295 300 305

Ile Pro Gln Leu Ser Gln Gly Gly Phe Ser Val Gln Lys Gly Gln Val

310 315 320 325

Tyr Thr Leu Arg Phe Trp Leu Lys Ala Asp Lys Pro Gly Arg Ile Asp

330 335 340

Val Asn Cys Met Met Asn His Asp Pro Trp Gln Arg Leu Gly Leu Ser

345 350 355

Ala Asp Val Gln Thr Ser Ala Glu Trp Lys Glu Tyr Arg Leu Ser Phe

360 365 370

Val Ala Asp Arg Asp Asp Pro Asn Ala Arg Ile Thr Phe Ser Gln Leu

375 380 385

Arg Pro Gly Thr Tyr Glu Leu Ala Asp Val Ser Leu Arg Pro Gly Gly

390 395 400 405

Val Ile Gly Leu Glu Glu Gly Gln Ser Leu Ala Asp Gln Thr Val Pro

410 415 420

Ile Val Pro Ala Arg Gly Pro Gln Met Thr Ala Ala Ala Arg Ala Asp

425 430 435

Phe Ala Asp Phe Leu Trp Glu Leu Glu Arg Asp Tyr Trp Trp Gly Met

440 445 450

Tyr Arg Phe Leu Lys Glu Glu Leu Lys Leu Lys Pro Leu Val Ala Gly

455 460 465

Thr Gln Leu Ser Tyr Ser Pro Val His Ile Gln Ala Gly Leu Asp Tyr

470 475 480 485

Ile Asp Ser His Ala Tyr Trp Gln His Pro Val Phe Pro Gly Arg Pro

490 495 500

Trp Asp Pro Glu Asn Trp Tyr Val Arg Ser Leu Ala Leu Val Asn Gln

505 510 515

Pro Gly Gly Thr Leu Ser Gly Leu Ala Ser Arg Arg Val Glu Gly Leu

520 525 530

Pro Phe Thr Val Ser Glu Tyr Asn His Pro Ala Pro Asn Glu Tyr Ala

535 540 545

Ala Glu Gly Phe Pro Met Ile Ala Ala Phe Gly Ala Phe Gln Asp Trp

550 555 560 565

Asp Gly Ile Phe Ser Phe Thr Tyr Ser His Ser Arg Asp Tyr Glu Pro

570 575 580

Arg Lys Ile Thr Gly Phe Phe Asp Ile Lys Ser Glu Val Thr Lys Leu

585 590 595

Val His Met Pro Ala Cys Val Ala Met Phe Tyr Arg Gly Asp Val Gln

600 605 610

Pro Ala Thr Gln Ala Val Val Val Gly Met Thr Arg Glu Lys Glu Gln

615 620 625

Ser Ile Leu Arg Glu Thr Leu Asn Pro Trp Ala Leu Thr Ala Asp Arg

630 635 640 645

Leu Gly Ile Pro Ala Asn Leu Ser Leu Leu His Arg Val Ala Met Ala

650 655 660

Leu Lys Glu Pro Ser Asp Ser Val Pro Pro Pro Thr Leu Ser Ala Glu

665 670 675

Gln Lys Val Phe Leu Ser Asp Thr Gln Gln Ile Cys Trp Asp Val Ser

680 685 690

Gln Pro Gly Ala Gly Val Phe Leu Val Asn Ser Pro Lys Thr Lys Leu

695 700 705

Val Thr Gly Phe Pro Ala Gly Arg Thr Phe Asn Leu Asn Gly Ile Gln

710 715 720 725

Ile Gln Ile Gly Glu Thr Glu Leu Gly Trp Ala Thr Val Ser Leu Thr

730 735 740

Val Ile Lys Gly Asp Gly Phe Asp Arg Pro Gly Arg Ile Leu Leu Ala

745 750 755

Ala Thr Gly Lys Ala Gln Asn Thr Gly Trp Asp Phe Arg Lys Glu Gly

760 765 770

Asp Arg Val Thr Val Gly Arg Arg Trp Gly Asp Glu Pro Ile Leu Cys

775 780 785

Glu Gly Val Pro Ala Arg Ile Val Leu Pro Val Ser Ser Ser Arg Val

790 795 800 805

Lys Val Tyr Ala Leu Asp Glu Ala Gly Arg Arg Arg Asp Ala Val Thr

810 815 820

Val Ser Gly Gly Asp Gln Ala Val Val Glu Ile Gly Pro Gln Phe Arg

825 830 835

Thr Leu Trp Tyr Glu Ile Glu Ile Gln

840 845

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1