甘露聚糖酶、纤维素酶和果胶酶缺陷型的表达β‑半乳糖苷酶和/或转半乳糖基化活性的重组宿主细胞的制作方法

文档序号:11445974阅读:280来源:国知局
甘露聚糖酶、纤维素酶和果胶酶缺陷型的表达β‑半乳糖苷酶和/或转半乳糖基化活性的重组宿主细胞的制造方法与工艺
本发明涉及一种其中不希望的酶失活的宿主细胞,并且涉及该宿主细胞在酶组合物的制备中的用途,该酶组合物用于制造具有降低的不想要的特性的食品。
背景技术
:普遍使用酶改进食品的化学性质。另外,在牛乳和其他动物衍生底物的加工中,酶的使用显著增加了最终产品的价值。半乳寡糖(gos)是在人和动物中不易消化的碳水化合物,其包括通过糖苷键连接的两个或更多个(通常多达九个)半乳糖分子。gos还可以包括一个或多个葡萄糖分子。gos的有益作用之一是它们作为益生元化合物通过选择性地刺激有益的结肠微生物(如细菌)以向消费者给出生理益处的能力。已经形成的健康作用导致对作为各种类型食物的食物成分的gos的兴趣日益增加。酶β-半乳糖苷酶(ec3.2.1.23)通常将乳糖水解成单糖d-葡萄糖和d-半乳糖。在β-半乳糖苷酶的正常酶反应中,酶水解乳糖并瞬时结合半乳糖单糖在半乳糖-酶复合物中,该复合物将半乳糖转移到水的羟基基团上,导致d-半乳糖和d-葡萄糖的释放。然而,在高乳糖浓度下,在称为转半乳糖基化的过程中,一些β-半乳糖苷酶能够将半乳糖转移到d-半乳糖或d-葡萄糖的羟基中,由此产生半乳寡糖。同样,在高乳糖浓度下,一些β-半乳糖苷酶能够将半乳糖转移到乳糖或更高级寡糖的羟基基团上。双歧杆菌是奶业中最常用类型的细菌培养物之一,用于发酵各种奶产品。另外,摄入含双歧杆菌的产品具有促进健康的作用。这种作用不仅通过降低肠内容物的ph值而且通过双歧杆菌在个体中重新填充肠道菌群的能力来实现,这些个体的肠道菌群受到例如抗生素的摄入的干扰。双歧杆菌还具有战胜潜在有害肠道微生物的潜力。已知半乳寡糖可增强双歧杆菌的生长。这种作用可能通过双歧杆菌利用半乳寡糖作为碳源的独特能力来实现。还考虑了半乳寡糖的膳食补充剂具有许多长期的疾病保护作用。例如,已经显示出半乳寡糖摄入对大鼠结肠直肠癌发展具有高度保护作用。因此,有兴趣开发用于生产在工业中使用以改进膳食补充剂和奶产品的半乳寡糖的廉价且有效的方法。已经将来自两歧双歧杆菌dsm20215的具有约580个氨基酸的截短的细胞外乳糖酶(bif3-d3)描述为在包含溶解在水中的乳糖的溶液中的转糖半乳糖酶(乔根森等人,(2001),应用微生物学和生物技术(appl.microbiol.biotechnol.),57:647-652)。wo01/90317还描述了作为转半乳糖基化酶的截短变体(olga347),并且在wo2012/010597中,显示olga347将半乳糖部分转移到d-岩藻糖、n-乙酰基-半乳糖胺和木糖。在wo2009/071539中,与bif3-d3相比,不同的截短片段被描述为在乳中测试时导致gos的高效水解和非常低的产量。wo2013/182686描述了一种多肽,该多肽具有反式半乳糖基化与水解活性的有用比率,并且因此即使在低乳糖水平如乳基产品中与乳糖一起孵育时也是gos的有效生产者。然而,仍然需要提供改进的方法,用于在奶产品中现场从乳糖生产处于gos形式的膳食纤维。本发明解决了这一需要。技术实现要素:酶的副活性通常用于描述不想要的酶,其活性对方法或产物产生负面影响。它们主要存在于作为例如生产宿主的副产物的酶产物中,并且可能阻碍这些酶的商业应用。奶应用对少量的纤维素酶、果胶酶、淀粉酶和甘露聚糖酶特别敏感,因为许多奶产品用水状胶体例如cmc、guar、淀粉和果胶进行配制/稳定(参见表1)。表1酶可降解的水状胶体/稳定剂纤维素酶cmc甘露聚糖酶guar、lbg果胶酶(果胶酸裂解酶)果胶淀粉酶淀粉我们现在已经能够开发包含β-半乳糖苷酶活性,任选地具有转半乳糖基化活性的产物或由其产生的gos,其中纤维素、甘露聚糖酶、果胶酶和淀粉酶的水平得以降低。作为增稠剂、凝胶剂和稳定剂,水状胶体对许多食品和饮料产品作出了重要贡献。本发明允许提供这样的食品和饮料产品,其中不仅保留由水状胶体的使用产生的所期望的特性,而且其中另外地,食品和饮料产品能够保持处于gos形式的膳食纤维。水状胶体或树胶是不同类的长链聚合物,其特征在于当分散在水中时其形成粘性分散体和/或凝胶的特性。这些材料首先在树木或灌木丛的渗出物、植物或海藻的提取物、种子或谷物的粉状物质、发酵过程中的粘液和许多其他天然产物中发现。大量羟基基团的出现明显增加了它们结合水分子的亲和力,使它们成为亲水性化合物。此外,它们产生一种分散体,该分散体是在真溶液和悬浮液之间的中间体,并表现出胶体的特性。考虑到这两种特性,它们被适当地称为‘亲水胶体’或‘水状胶体’。水状胶体在食品中具有广泛的功能特性,这些功能特性包括:增稠、胶凝、乳化、稳定、涂层等。当以如下水平使用时,水状胶体对食品特性具有深远的影响,这些水平范围从在加热处理奶产品中角叉菜胶的百万分之几至胶冻质糖食中的阿拉伯树胶、淀粉或明胶的高水平。水状胶体在食品中充分利用的主要原因是它们能够改变食品系统的流变学。这包括食品系统的两个基本特性,即流动行为(粘度)和机械固体特性(质感)。食品系统的质感和/或粘度的改变有助于改变其感官特性,因此将水状胶体用作重要的食品添加剂来执行特定目的。很显然,若干种水状胶体属于世界上许多国家中允许的食品添加剂类别。各种食物配制品如汤、肉汁、沙拉酱、调味汁和浇头使用水状胶体作为添加剂以达到优选的粘度和口感。它们也被用于许多食品像冰淇淋、果酱、果冻、凝胶甜点、蛋糕和糖果中,以产生所期望的质感。除了功能属性之外,未来的接受以及可能的积极的认可可能来自于认识到纤维对身体的自然功能和健康有许多生理益处。由于其水结合特性,水状胶体对食品的质感和口感有重大影响-通常为质感创新创造机会。这些产品中的若干种还与蛋白质相互作用,是用于蛋白质稳定和保护的有用特性。本发明提供了基于使用水状胶体的溶液,其中不仅保留使用水状胶体上述所期望的特性,而且其中另外地,食品和饮料产品能够包含处于gos形式的膳食纤维。在所培养的产品中,水状胶体提供细腻的质感和光泽的外观。水状胶体可以在降低的乳固体配制品中优化成本,并且在整个保质期中保持质感。水状胶体还改进所培养的产品的本体,尤其是处于较高消耗温度下。本发明提供了基于使用水状胶体的溶液,其中不仅保留使用水状胶体上述所期望的特性,而且其中另外地,食品和饮料产品能够包含处于gos形式的膳食纤维。在奶产品和低ph蛋白饮料中,水状胶体可以稳定乳和大豆蛋白质,防止沉降和乳清脱落,并可以实现各种质感。此外,更多的水状胶体可以用减少的乳固体、糖和/或脂肪替代配制品中的质感,并且从而给食品制造提供更好的低脂肪产品。本发明提供了基于使用水状胶体的溶液,其中不仅保留使用水状胶体上述所期望的特性,而且其中另外地,食品和饮料产品能够包含处于gos形式的膳食纤维。本发明通过提供包含具有转半乳糖基化活性的多肽的酶组合物来解决这些问题,但是该酶组合物没有或基本上没有归因于以下酶的活性:纤维素、甘露聚糖酶、果胶酶和任选地淀粉酶。根据本发明的第1方面,提供一种能够表达具有β-半乳糖苷酶活性的多肽的宿主细胞,并且将该所述宿主细胞修饰为纤维素酶、甘露聚糖酶和果胶酶缺陷型。在一个优选的实施例中,本发明中使用的具有β-半乳糖苷酶活性的多肽具有转半乳糖基化活性。根据本发明的第2方面,提供一种能够表达具有转半乳糖基化活性的多肽的宿主细胞,并且将该所述宿主细胞修饰为纤维素酶、甘露聚糖酶和果胶酶缺陷型。优选地,该宿主细胞还被修饰为淀粉酶缺陷型。在一个实施例中,通过常规诱变技术修饰该宿主细胞。在另一个实施例中,通过常规遗传操作技术修饰该宿主细胞。根据本发明的第3方面,提供一种能够表达具有β-半乳糖苷酶活性的多肽的宿主细胞,并且其中具有纤维素酶、甘露聚糖酶和果胶酶活性的多肽基本上是无活性的。根据本发明的第4方面,提供一种能够表达具有转半乳糖基化活性的多肽的宿主细胞,并且其中具有纤维素酶、甘露聚糖酶和果胶酶活性的多肽基本上是无活性的。另外,优选地,在宿主细胞中,具有淀粉酶活性的多肽基本上是无活性的。在第三和第四方面的一个实施例中,关于酶活性,该基本上无活性的纤维素酶、甘露聚糖酶和果胶酶多肽以及任选地该淀粉酶多肽在功能上是无活性的。在一个实施例中,通过常规诱变技术使得该具有纤维素酶、甘露聚糖酶和果胶酶活性的多肽以及任选地该具有淀粉酶活性的多肽基本上无活性。在另一个实施例中,通过常规遗传操作技术使得该具有纤维素酶、甘露聚糖酶和果胶酶活性的多肽以及任选地该具有淀粉酶活性的多肽基本上无活性。可以使用的常规诱变技术是化学或物理诱变。可以使用的常规遗传操作技术是一步基因破坏法、标志物插入、定点诱变、缺失、rna干扰或反义rna。优选地,该宿主细胞是一种细菌。该宿主细胞可以是乳酸菌。优选地,该宿主细胞是枯草芽孢杆菌。优选地,本发明中使用的具有转半乳糖基化活性的多肽选自由以下各项组成的组:a.包含与seqidno:1具有至少90%序列同一性的氨基酸序列的多肽,其中所述多肽由至多980个氨基酸残基组成,b.包含与seqidno:2具有至少97%序列同一性的氨基酸序列的多肽,其中所述多肽由至多975个氨基酸残基组成,c.包含与seqidno:3具有至少96.5%序列同一性的氨基酸序列的多肽,其中所述多肽由至多1300个氨基酸残基组成,d.由多核苷酸编码的多肽,该多核苷酸在至少低严格条件下与以下各项杂交:i)包含在seqidno:9、10、11、12或13中的编码seqidno:1、2、3、4或5的多肽的核酸序列;或ii)i)的互补链,e.由包含如下各项的多核苷酸编码的多肽:与编码seqidno:1、2、3、4或5的多肽的核苷酸序列具有至少70%同一性的核苷酸序列,或包含在seqidno:9、10、11、12或13中的编码成熟多肽的核苷酸序列,和f.包括seqidno:1、2、3、4或5的一个或多个氨基酸残基的缺失、插入和/或保守取代的多肽。在一个实施例中,该宿主细胞包含一种表达载体,该表达载体包含编码具有β-半乳糖苷酶活性的多肽的核酸。在一个实施例中,用编码具有β-半乳糖苷酶活性的多肽的核酸转化该宿主细胞。在一个实施例中,该宿主细胞包含一种表达载体,该表达载体包含编码具有转半乳糖基化活性的多肽的核酸。在一个实施例中,用编码具有转半乳糖基化活性的多肽的核酸转化该宿主细胞。根据本发明的第5方面,提供了一种用于提供多肽组合物的方法,该多肽组合物包含具有β-半乳糖苷酶活性并且具有降低量的所不希望的纤维素、甘露聚糖酶和果胶酶酶副活性的多肽,该方法包括:提供能够表达该具有β-半乳糖苷酶活性的多肽、具有纤维素酶活性的多肽、具有甘露聚糖酶活性的多肽和具有果胶酶活性的多肽的宿主细胞;并且使所述纤维素、甘露聚糖酶和果胶酶失活。根据本发明的第6方面,提供了一种用于提供多肽组合物的方法,该多肽组合物包含具有转半乳糖基化活性并且具有降低量的所不希望的纤维素、甘露聚糖酶和果胶酶酶副活性的多肽,该方法包括:提供能够表达该具有转半乳糖基化活性的多肽、具有纤维素酶活性的多肽、具有甘露聚糖酶活性的多肽和具有果胶酶活性的多肽的宿主细胞;并且使所述纤维素、甘露聚糖酶和果胶酶失活。优选地,该方法还包括使具有淀粉酶活性的多肽失活。在本方法的一个实施例中,通过常规诱变技术使得该具有纤维素酶、甘露聚糖酶和果胶酶活性的多肽以及任选地该具有淀粉酶活性的多肽基本上无活性。在本方法的另一个实施例中,通过遗传操作使得该具有纤维素酶、甘露聚糖酶和果胶酶活性的多肽以及任选地该具有淀粉酶活性的多肽基本上无活性。优选地,在该方法中,该宿主细胞是一种细菌。在该方法的一个实施例中,该宿主细胞是乳酸菌。优选地,在该方法中,该宿主细胞是枯草芽孢杆菌。优选地,在该方法中,具有转半乳糖基化活性的多肽选自由以下各项组成的组:a.包含与seqidno:1具有至少90%序列同一性的氨基酸序列的多肽,其中所述多肽由至多980个氨基酸残基组成,b.包含与seqidno:2具有至少97%序列同一性的氨基酸序列的多肽,其中所述多肽由至多975个氨基酸残基组成,c.包含与seqidno:3具有至少96.5%序列同一性的氨基酸序列的多肽,其中所述多肽由至多1300个氨基酸残基组成,d.由多核苷酸编码的多肽,该多核苷酸在至少低严格条件下与以下各项杂交:i)包含在seqidno:9、10、11、12或13中的编码seqidno:1、2、3、4或5的多肽的核酸序列;或ii)i)的互补链,e.由包含如下各项的多核苷酸编码的多肽:与编码seqidno:1、2、3、4或5的多肽的核苷酸序列具有至少70%同一性的核苷酸序列,或包含在seqidno:9、10、11、12或13中的编码成熟多肽的核苷酸序列,和f.包括seqidno:1、2、3、4或5的一个或多个氨基酸残基的缺失、插入和/或保守取代的多肽。在本方法的一个实施例中,该宿主细胞包含一种表达载体,该表达载体包含编码具有β-半乳糖苷酶活性的多肽的核酸。在本方法的另一个实施例中,用编码具有β-半乳糖苷酶活性的多肽的核酸转化该宿主细胞。在本方法的一个实施例中,该宿主细胞包含一种表达载体,该表达载体包含编码具有转半乳糖基化活性的多肽的核酸。在本方法的另一个实施例中,用编码具有转半乳糖基化活性的多肽的核酸转化该宿主细胞。根据本发明的第7方面,提供了生产具有β-半乳糖苷酶活性的多肽的方法,该方法包括在培养基中,在适合表达具有β-半乳糖苷酶活性的多肽的条件下培养本发明的宿主细胞,并且任选地从该培养基或该宿主细胞回收具有β-半乳糖苷酶活性的多肽。根据本发明的第8方面,提供了生产具有转半乳糖基化活性的多肽的方法,该方法包括在培养基中,在适合表达具有转半乳糖基化活性的多肽的条件下培养本发明的宿主细胞,并且任选地从该培养基或该宿主细胞回收具有转半乳糖基化活性的多肽。根据本发明的第9方面,提供了使用本发明宿主细胞或本发明方法产生的具有β-半乳糖苷酶活性的多肽。优选地,根据本发明的具有β-半乳糖苷酶活性的多肽没有或基本上没有纤维素、甘露聚糖酶和果胶酶活性,以及任选地淀粉酶活性。在一个实施例中,根据本发明的具有β-半乳糖苷酶活性的多肽没有或基本上没有纤维素、甘露聚糖酶和果胶酶活性,这样使得以粘度相对降低表示的粘度降低是至少0.85或至少0.9、或更少,该粘度降低由与没有添加酶或水的水状胶体溶液相比添加具有β-半乳糖苷酶活性的多肽的含水状胶体溶液的粘度计算得出。根据本发明的第10方面,提供了包括使用本发明宿主细胞或本发明方法产生的具有β-半乳糖苷酶活性的多肽的多肽组合物。根据本发明的第11方面,提供了使用本发明宿主细胞或本发明方法产生的具有转半乳糖基化活性的多肽。优选地,根据本发明的具有转半乳糖基化活性的多肽没有或基本上没有纤维素、甘露聚糖酶和果胶酶活性,以及任选地淀粉酶活性。在一个实施例中,根据本发明的具有转半乳糖基化活性的多肽没有或基本上没有纤维素、甘露聚糖酶和果胶酶活性,这样使得以粘度相对降低表示的粘度降低是至少0.85或至少0.9、或更少,该粘度降低由与没有添加酶或水的水状胶体溶液相比添加具有转半乳糖基化活性的多肽的含水状胶体溶液的粘度计算得出。根据本发明的第12方面,提供了包括使用本发明宿主细胞或本发明方法产生的具有转半乳糖基化活性的多肽的多肽组合物。优选地,本发明的多肽组合物没有或基本上没有纤维素、甘露聚糖酶和果胶酶活性,以及任选地淀粉酶活性。在一个实施例中,多肽组合物没有或基本上没有纤维素、甘露聚糖酶和果胶酶活性,这样使得以粘度相对降低表示的粘度降低是至少0.85或至少0.9、或更少,该粘度降低由与没有添加酶或水的水状胶体溶液相比添加本发明的多肽组合物的含水状胶体溶液的粘度计算得出。根据本发明的第13方面,提供了包括本发明具有β-半乳糖苷酶活性的多肽或本发明的多肽组合物的奶产品。根据本发明的第14方面,提供了生产奶产品的方法,该方法包括向含有乳糖的奶产品中添加本发明具有β-半乳糖苷酶活性的多肽或本发明的多肽组合物。根据本发明的第15方面,提供了生产包含gos的奶产品的方法,该方法包括向含有乳糖的奶产品中添加本发明具有β-半乳糖苷酶活性的多肽或本发明的多肽组合物。根据本发明的第16方面,提供了根据本发明的具有转半乳糖基化活性的多肽或根据本发明的多肽组合物用于制备奶产品的用途。根据本发明的第17方面,提供了根据本发明的具有转半乳糖基化活性的多肽或根据本发明的多肽组合物用于制备包含gos的奶产品的用途。根据本发明的第18方面,提供了包含本发明的具有转半乳糖基化活性的多肽或本发明的多肽组合物的奶产品。根据本发明的第19方面,提供了生产奶产品的方法,该方法包括向含有乳糖的奶产品中添加本发明的具有转半乳糖基化活性的多肽或本发明的多肽组合物。根据本发明的第20方面,提供了生产包含gos的奶产品的方法,该方法包括向含有乳糖的奶产品中添加本发明的具有转半乳糖基化活性的多肽或本发明的多肽组合物。根据本发明的第21方面,提供了根据本发明的具有转半乳糖基化活性的多肽或根据本发明的多肽组合物用于制备奶产品的用途。根据本发明的第22方面,提供了根据本发明的具有转半乳糖基化活性的多肽或根据本发明的多肽组合物用于制备包含gos的奶产品的用途。在一个实施例中,本发明的用途是防止奶产品的粘度和/或质感降低,该用途是与具有β-半乳糖苷酶和/或转半乳糖基化活性的、由表达纤维素酶、甘露聚糖酶和果胶酶的宿主细胞制备的多肽的用途相比而言的。本发明具体可用于在包含乳糖的组合物如奶产品中现场生产gos膳食纤维。序列表seqidno:1(在此又称为(bif_917))是seqidno:22的887个氨基酸的截短的片段。seqidno:2(在此又称为(bif_995))是seqidno:22的965个氨基酸的截短的片段。seqidno:3(在此又称为(bif_1068))是seqidno:22的1038个氨基酸的截短的片段。seqidno:4(在此又称为(bif_1172))是seqidno:22的1142个氨基酸的截短的片段。seqidno:5(在此又称为(bif_1241))是seqidno:22的1211个氨基酸的截短的片段。seqidno:6(在此又称为(bif_1326))是seqidno:22的1296个氨基酸的截短的片段。seqidno:7是两歧双歧杆菌糖苷水解酶催化核心seqidno:8是编码来自两歧双歧杆菌dsm20215的胞外乳糖酶的核苷酸序列seqidno:9是编码bif_917的核苷酸序列seqidno:10是编码bif_995的核苷酸序列seqidno:11是编码bif1068的核苷酸序列seqidno:12是编码bif_1172的核苷酸序列seqidno:13是编码bif_1241的核苷酸序列seqidno:14是编码bif_1326的核苷酸序列seqidno:15是用于生成上述bif变体的正向引物seqidno:16是bif917的反向引物seqidno:17是bif995的反向引物seqidno:18是bif1068的反向引物seqidno:19是bif1241的反向引物seqidno:20是bif1326的反向引物seqidno:21是bif1478的反向引物seqidno:22是来自两歧双歧杆菌dsm20215的胞外乳糖酶。seqidno:23是来自两歧双歧杆菌dsm20215的胞外乳糖酶的信号序列。发明详细披露定义根据此详细描述,适用下列简称和定义。应当注意,如在此所用,单数形式“一种(a)”、“一种(an)”以及“该”包括复数个指示物,除非上下文中另外明确指明。因而,例如,提及“一个/种多肽”时包括多个/种此类多肽,并且提及“所述/该配制品”时包括提及一个或多个配制品和本领域技术已知的其等效物,等等。除非另外定义,否则在此使用的所有技术和科学术语具有与本领域普通技术人员通常所理解的相同的含义。下文中提供了下述术语。除其他事项之外,“转半乳糖基酶”意指能够将半乳糖转移到d-半乳糖或d-葡萄糖的羟基基团的酶,由此产生半乳寡糖。在一方面,通过酶在乳糖上的反应来鉴定转半乳糖基酶,其中产生的半乳糖的量小于在任何给定时间产生的葡萄糖的量。在上下文中,术语“转半乳糖基化活性”意指将半乳糖部分转移至除水以外的分子。活性可以测定为[葡萄糖]-反应期间的任何给定时间产生的[半乳糖],或通过直接定量在反应期间的任何给定时间产生的gos来测量。该测量可以以若干种方式进行,如通过实例中所示的hplc方法进行。当比较转半乳糖基化活性的测量值时,它们已经在给定的初始乳糖浓度下进行,例如像,3%、4%、5%、6%、7%、8%、9%或10%(w/w)。在上下文中,术语“β-半乳糖苷酶活性”意指酶将β-半乳糖苷例如像乳糖水解成单糖、葡萄糖和半乳糖的能力。在计算转半乳糖基化活性:β-半乳糖苷酶活性的情况下,β-半乳糖苷酶活性被测量为在反应期间的任何给定时间产生[半乳糖]。该测量可以以若干种方式进行,如通过实例中所示的hplc方法进行。在上下文中,使用邻硝基苯酚-β-d-吡喃半乳糖苷(onpg),如下计算术语“转半乳糖基化活性的比率”:将比率计算为具有存在的受体的abs420除以没有存在的受体的abs420之间的比率乘以100。指数100的或以下的变体是纯水解变体,而上述水平描绘了相对的转半乳糖基化活性。转半乳糖基化活性的比率=(abs420+纤维二糖/abs420-纤维二糖)*100%,其中abs420+纤维二糖是使用以下描述的方法3在420nm处读取的吸光度,在反应中包括纤维二糖,并且abs420-纤维二糖是使用以下描述的方法3在420nm处读取的吸光度,而在反应中没有纤维二糖。以上方程仅适用于吸光度在0.5和1.0之间的稀释。在一方面,在15min反应、30min反应、60min反应、90min反应、120min反应或180min反应后测量本发明涉及的任何酶的活性。因此,在一方面,作为实例,在添加酶后15分钟,如添加酶后30分钟,如添加酶后60分钟,如添加酶后90分钟,如添加酶后120分钟或如添加酶后180分钟,测量相对转半乳糖基化活性。在上下文中,术语“转半乳糖基化活性:β-半乳糖苷酶活性的比率”意指([葡萄糖]-[半乳糖]/[半乳糖])。在上下文中,术语[葡萄糖]意指如通过hplc测量的以重量%计的葡萄糖浓度。在上下文中,术语[半乳糖]意指如通过hplc测量的以重量%计的半乳糖浓度。在上下文中,术语“已经将乳糖转半乳糖基化”意指半乳糖分子已经共价连接至乳糖分子,例如像共价连接至乳糖分子中的任何游离羟基基团,或者如通过内部转半乳糖基化产生,例如形成异乳糖。在上下文中,在“乳基测定”(酸奶应用模拟物)中测试了在半乳寡糖(gos)生产中在此披露的多肽的性能评估。使用由98,60%(w/v)新鲜巴氏杀菌低脂乳(爱氏晨曦迷你乳(arla))和1.4%(w/v)nutrilacyq-5075乳清成分(爱氏晨曦)组成的酸奶混合物在96孔mtp板中进行体积为100μl的分批实验。为了完全使nutrilacyq-5075与水化合,将混合物搅拌20h,并且然后添加20mm磷酸钠(ph6.5),以确保ph为6.5。将这种酸奶基简单地使用或与各种补充剂如另外的乳糖、海藻糖、麦芽糖、木糖或盐一起使用。将90μl酸奶与10μl纯化的酶或粗制酵素混合,用胶带密封并在43℃下孵育3小时。通过100μl10%na2co3终止反应。将样品储存于-20℃下。通过hplc定量半乳寡糖(gos)、乳糖、葡萄糖和半乳糖。在dionexics3000上进行样品分析。ic参数如下:流动相:150mmnaoh,流速:等度,0,25ml/min,柱:carbopacpa1,柱温:rt,注射体积:10μl,检测器:pad,积分:手动,样品制备:在milli-q水中稀释100倍(0,1ml样品+9,9ml水),并通过0.45ìm针筒式滤器过滤,定量:标准品的峰面积的百分比中的峰面积。将gos糖浆(vivanalgos,菲仕兰坎皮纳公司(frieslandcampina))用作gos定量的标准品。转半乳糖基化活性可以通过如wo2013/182686中所述的hplc定量或酶测定来测量。在上下文中,术语“将该多肽喷雾干燥”意指已经通过将溶液或悬浮液中的多肽在合适的温度下喷雾干燥并且持续适当的时间除去水而获得多肽。在上下文中,术语“该多肽在溶液中”涉及可溶于溶剂而不会沉淀出溶液的多肽。用于该目的的溶剂包括多肽可以存在的任何环境,如水性缓冲液或盐溶液、发酵液或表达宿主的细胞质。在上下文中,术语“稳定剂”意指用于稳定多肽的任何稳定剂,例如,多元醇,例如像甘油或丙二醇、糖或糖醇,乳酸,硼酸或硼酸衍生物(例如芳族硼酸酯)。在一方面,稳定剂不是多元醇,或该多元醇以0.1wt%或更低水平存在。术语“分离的”意指多肽至少基本上不含与该序列在自然界中天然缔合或者在自然界中存在的至少一种其他组分,和/或基本上不含纤维素、甘露聚糖、果胶酶或淀粉酶。在一方面,如在此所用“分离的多肽”是指如通过sds-page确定的是至少30%纯、至少40%纯、至少60%纯、至少80%纯、至少90%纯、和至少95%纯的多肽。因此,术语“基本上不含纤维素酶”在此意指按重量计包含至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的纤维素酶的制剂。因此,在此术语“基本上不含”可以被看作与术语“分离的多肽”和“分离形式的多肽”同义。因此,术语“基本上不含甘露聚糖酶”在此意指按重量计包含至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的甘露聚糖酶的制剂。因此,在此术语“基本上不含”可以被看作与术语“分离的多肽”和“分离形式的多肽”同义。因此,术语“基本上不含果胶酶”在此意指按重量计包含至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的果胶酶的制剂。因此,在此术语“基本上不含”可以被看作与术语“分离的多肽”和“分离形式的多肽”同义。因此,术语“基本上不含淀粉酶”在此意指按重量计包含至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的淀粉酶的制剂。因此,在此术语“基本上不含”可以被看作与术语“分离的多肽”和“分离形式的多肽”同义。术语“基本上纯的多肽”在此意指包含按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然缔合的其他多肽材料的多肽制剂。因此,优选的是该基本上纯的多肽是按制剂中存在的所有的多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯的。在此披露的多肽优选为基本上纯的形式。特别地,优选的是这些多肽是“基本上纯的形式”,即多肽制剂基本上不含与其天然缔合的其他多肽材料。例如,这可以通过熟知的重组方法或通过经典的纯化方法制备多肽来完成。在此,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。术语“纯化”或“纯”意指给定的组分以高水平状态存在-例如,至少约51%纯如至少51%纯,或至少约75%如至少75%纯,或至少约80%如至少80%纯,或至少约90%如至少90%纯,或至少约95%如至少95%纯,或至少约98%如至少98%纯。希望的是,该组分是组合物中存在的主要活性组分。关于本发明的术语“微生物”包括任何“微生物”,该任何“微生物”可以包括根据本发明所述的核苷酸序列或编码具有如在此定义的特定特性的多肽的核苷酸序列和/或由其获得的产物。在上下文中,“微生物”可以包括能够发酵乳基质的任何细菌或真菌。关于本发明的术语“宿主细胞”包括任何细胞,该任何细胞包括编码具有如在此定义的特定特性的多肽的核苷酸序列或如上所述的并用于生产具有如在此定义的特定特性的多肽的表达载体。在一方面,生产是重组生产。在本发明的上下文中,术语“乳”应理解为从任何哺乳动物如牛、绵羊、山羊、水牛或骆驼获得的乳状分泌物。在上下文中,术语“乳基底物”意指任何生的和/或加工的乳材料或衍生自乳成分的材料。有用的乳基底物包括但不限于包括乳糖的任何乳或乳样产品的溶液/悬浮液,如全脂或低脂乳、脱脂乳、酪乳、复原乳粉、炼乳、奶粉溶液、uht乳、乳清、乳清渗透物、酸乳清或奶油。优选地,乳基底物是乳或脱脂乳粉的水溶液。乳基底物可以比生乳更浓。在一个实施例中,乳基底物的蛋白质与乳糖的比率为至少0.2,优选至少0.3,至少0.4,至少0.5,至少0.6,或最优选至少0.7。可以根据本领域已知的方法对乳基底物进行均化和/或巴氏杀菌。如在此所用“均质化”意指强烈混合以获得可溶性悬浮液或乳液。可以进行该均质化以便将乳脂分解成更小的尺寸,这样使得乳脂不再与该乳分离。这可以通过在高压下使该乳通过小孔来实现。如在此所用“巴氏杀菌”意指减少或消除活生物体如微生物在乳基底物中的存在。优选地,通过将规定温度保持规定的时间来实现巴氏杀菌。指定的温度通常通过加热来实现。可以选择温度和持续时间以便杀灭或使某些细菌,如有害细菌失活,和/或使该乳中的酶失活。可以遵循快速冷却步骤。本发明上下文中的“食品”或“食物组合物”可以是适合于动物或人类消费的任何可食用食品或饲料产品。在本发明的上下文中的“奶产品”可以是主要成分之一是乳基的任何食品。优选地,主要成分是乳基的。更优选地,主要成分是已经用具有转半乳糖基化活性的酶处理过的乳基底物。在上下文中,“主要成分之一”意指具有干物质的成分,该干物质占奶产品总干物质的20%以上,优选30%以上或40%以上,而“主要成分”意指具有干物质的成分,该干物质占奶产品总干物质的50%以上,优选60%以上或70%以上。在上下文中,“发酵的奶产品”应被理解为任何奶产品,其中任何类型的发酵形成生产过程的一部分。发酵的奶产品的实例是产品像酸奶、酪乳、鲜奶油、奶渣和清爽干酪。发酵的奶产品的另一个实例是奶酪。发酵的奶产品可以通过本领域已知的任何方法来生产。术语“发酵”意指通过微生物如起子培养物的作用将碳水化合物转化为醇或酸。在一方面,发酵包括将乳糖转化为乳酸。在上下文中,“微生物”可以包括能够发酵乳基质的任何细菌或真菌。在上下文中,术语“pfam结构域”意指基于多重序列比对和隐马尔可夫基序的存在,被鉴定为pfam-a或pfam-b的蛋白质序列内的区域(“pfam蛋白家族数据库(thepfamproteinfamiliesdatabase)”:r.d.芬恩(finn),j.米斯特里(mistry),j.塔特(tate),p.柯吉尔(coggill),a.赫格尔(heger),j.e.普林顿(pollington),o.l.加文(gavin),p.古恩赛卡伦(gunesekaran),g.赛利克(ceric),k.福斯隆德(forslund),l.霍尔姆(holm),e.l.松哈默(sonnhammer),s.r.艾迪(eddy),a.贝特曼(bateman),核酸研究(nucleicacidsresearch)(2010),数据库专辑38:d211-222)。作为pfam结构域的实例,可以提及glyco_hydro2n(pf02837)、glyco_hydro(pf00703)、glyco_hydro2c(pf02836)和细菌ig样结构域(组4)(pf07532)。如在此所用,术语“表达”是指基于基因的核酸序列产生多肽的过程。此过程包括转录和翻译。如在此所用,“转化的细胞”包括已经通过使用重组dna技术转化的细胞,包括细菌和真菌细胞。转化通常通过将一个或多个核苷酸序列插入细胞而发生。所插入的核苷酸序列可以是异源核苷酸序列,即,对于待转化的细胞不是天然的序列,如融合蛋白。如在此所用,“可操作地连接”意指所描述的组分处于允许它们以其预期方式起作用的关系。例如,将可操作地连接到编码序列的调控序列以如下这样方式连接:在与控制序列相容的条件下实现编码序列的表达。如在此所用,“载体”是指设计用于将核酸引入一种或多种细胞类型的多核苷酸序列。载体包括克隆载体、表达载体、穿梭载体、质粒、噬菌体颗粒、盒等。如在此所用,术语“表达”是指基于基因的核酸序列产生多肽的过程。此过程包括转录和翻译。表达可能涉及使用宿主生物来产生多肽。宿主生物体,又简称为宿主,可以包括原核生物和真核生物,并且在一些实施例中可以包括细菌和真菌物种。如在此所用,“表达载体”是指包含dna编码序列(例如,基因序列)的dna构建体,其可操作地连接到能够影响编码序列在宿主中表达的一种或多种合适的控制序列。这样的控制序列包括影响转录的启动子,控制这种转录的任选的操纵子序列,编码合适的mrna核糖体结合位点的序列,以及控制转录和翻译终止的序列。载体可以是质粒、噬菌体颗粒,或简单地是潜在的基因组插入物。一旦转化入合适的宿主中,载体可以独立于宿主基因组复制和起作用,或者在某些情况下可以整合入基因组本身。质粒是最常用的表达载体形式。然而,该描述旨在包括发挥等效功能并且本领域已知或将成为已知的其他形式的表达载体。“启动子”是指参与结合rna聚合酶以启动基因转录的调控序列。启动子可以是诱导型启动子或组成型启动子。可以使用的诱导型启动子的非限制性实例是里氏木霉cbh1,其是诱导型启动子。术语“可操作地连接”是指并置,其中元件处于使得它们在功能上相关的布置。例如,如果启动子控制编码序列的转录,则启动子可操作地连接到编码序列。“在转录控制下”是本领域中众所周知的术语,该术语表明多核苷酸序列的转录取决于其与有助于启动或促进转录的元件可操作地连接。“在翻译控制下”是本领域中众所周知的术语,其表示在mrna形成后发生的调节过程。“基因”是指参与产生多肽并且包括编码区之前和之后的区域以及个体编码区段(外显子)之间的间插序列(内含子)的dna区段。如在此所用,术语“宿主细胞”是指用于产生多肽的重组表达载体可以转染入其中以表达该多肽的细胞或细胞系。宿主细胞包括单个宿主细胞的后代,并且由于天然的、意外的或故意的突变,后代可能不一定(在形态学或总基因组dna补体方面)与原始亲本细胞完全同一。宿主细胞包括用表达载体体内转染或转化的细胞。术语“重组”当用于提及一种细胞、核酸、蛋白或载体时是指该细胞、核酸、蛋白或载体已经通过导入异源核酸或蛋白或者改变天然的核酸或蛋白进行修饰,或者表明该细胞衍生自经这样修饰的细胞。因此,例如,这些重组细胞表达在细胞的天然形式(非重组)中未发现的基因或表达以其他方式异常表达的、低表达的或根本不表达的天然基因。“信号序列”(又称为“前序列”、“信号肽”、“前导序列”或“前导肽”)是指与蛋白质的n端部分结合的氨基酸序列,该氨基酸序列促进了成熟形式的蛋白质从细胞的分泌(例如,seqidno:5)。信号序列将多肽靶向分泌途径,并且一旦其在内质网膜中被转位就从新生多肽切割。成熟形式的细胞外蛋白质(例如seqidno:1)缺乏在分泌过程中被切除的信号序列。术语“选择性标志物”或“可选择的标志物”是指能够在宿主细胞中表达的基因,其允许容易地选择包含引入的核酸或载体的那些宿主。可选择的标志物的实例包括但不限于在宿主细胞上赋予代谢优势,如营养优势的抗微生物物质(例如,潮霉素、博来霉素或氯霉素)和/或基因。术语“培养”是指在液体或固体培养基中在生长适合生长条件下使微生物细胞群生长。术语“培养基”是指在该过程中使用的介质在将核酸序列插入细胞的上下文中,术语“引入的”包括“转染”、“转化”或“转导”,并且是指将核酸序列并入真核或原核细胞中,其中可以将核酸序列并入细胞的基因组(例如,染色体、质粒、质体或线粒体dna)中,转化成自主复制子或进行瞬时表达。如在此所用,术语“转化的”,“稳定转化的”和“转基因的”是指具有整合到其基因组中的或作为通过多代维持的附加型质粒的非天然(例如,异源的)核酸序列的细胞。如在此所用,术语“修改”和“改变”可互换使用并且意指变化或变更。在修饰或改变多肽的上下文中,这些术语可以意指直接或通过改变编码核酸来改变氨基酸序列,或如将酶糖基化来改变多肽的结构。除非另有说明,本发明的实践将使用在本领域技术范围内的分子生物学(包括重组技术)、微生物学、细胞生物学和生物化学的常规技术。这些技术在文献中得到充分解释,这些文献例如,分子克隆:实验室手册(molecularcloning:alaboratorymanual),第二版(萨姆布鲁克(sambrook)等人,1989,分子克隆:实验室手册);寡核苷酸合成(oligonucleotidesynthesis)(m.j.盖特(gait)编辑,1984;分子生物学现代方法(currentprotocolsinmolecularbiology)(f.m.奥苏贝尔(ausubel)等人编辑,1994);pcr:聚合酶链式反应(pcr:thepolymerasechainreaction)(穆利斯(mullis)等人编辑,1994);和基因转移和表达:实验室手册(genetransferandexpression:alaboratorymanual)(克里格勒(kriegler),1990)。除非在此另外定义,否则在此所用的所有技术与科学术语均具有与本发明所属领域的普通技术人员通常理解的相同含义。辛格尔顿(singleton)等人,“微生物与分子生物学杂志(dictionaryofmicrobiologyandmolecularbiology)”,第二版,约翰威利父子出版公司(johnwileyandsons),纽约(1994)和黑尔(hale)与马卡姆(markham),哈珀柯林斯生物学词典(theharpercollinsdictionaryofbiology),哈珀永久出版社(harperperennial),纽约(1991)向技术人员提供本发明中使用的许多术语的通用词典。与在此所述那些类似或等效的任何方法和材料可用于本发明的实践或测试。除非另有说明,分别地,核酸以5'至3'取向从左向右书写;氨基酸序列以氨基至羧基取向从左向右书写。在此提供的数字范围包括定义范围的数字。在酶产物中,少量不需要的酶活性主要来源于生产宿主,并且称为酶副活性。本发明涉及减少不需要的酶副活性。乳制品应用中的酶活性应优选在适用于应用的ph和温度下进行测量。在乳中,ph值从6.4至6.8不等,酸奶:ph约4,婴儿配方奶ph5.9-7.3,马苏里拉奶酪ph5.2-5.5,以及蛋黄酱ph4。最佳地,可以通过每个预期应用中的应用测试来确定不希望的活性的水平。纤维素酶在一方面,本发明涉及不含或基本上不含纤维素酶活性的组合物。在另一方面,本发明提供了一种新颖的细菌,其中使编码纤维素酶的基因失活。这样的组合物包含具有转半乳糖基化活性的多肽。根据本发明的宿主细胞能够表达具有转半乳糖基化活性的多肽。这种转半乳糖基化活性应以如下这样水平存在:gos能够在产品中由乳糖生产,即优选多肽存在于组合物中,或者宿主细胞能够以如下这种水平表达它:gos形式的膳食纤维可以由添加有组合物或宿主细胞的奶产品中存在的乳糖产生。纤维素酶是水解纤维素(β-1,4-葡聚糖或β-d-糖苷键)的酶,其导致葡萄糖、纤维二糖、纤维寡糖等的形成。纤维素酶传统上分为三大类:内切葡聚糖酶(ec3.2.1.4)(“eg”)、外切葡聚糖酶或纤维二糖水解酶(ec3.2.1.91)(“cbh”)和β-葡糖苷酶([β]-d-葡萄糖苷葡糖水解酶;ec3.2.1.21)(“bg”)。根据一个实施例,失活的纤维素酶基因是bglc内切葡聚糖酶。甘露聚糖酶甘露聚糖酶是一种酶,其分解称为甘露聚糖的化合物。这些多糖由单糖甘露糖构成,并且在自然界中广泛发现。在许多植物(并且,例如,在其种子中),甘露聚糖用作碳水化合物储备。在一方面,酶选自由以下各项组成的组:甘露聚糖酶,特别是内切β-甘露聚糖酶、酯酶、外切甘露聚糖酶、半乳聚糖酶。根据一个实施例,失活的甘露聚糖酶基因是gmug甘露聚糖酶。果胶酶果胶酶是分解果胶(植物细胞壁中发现的多糖)的酶。通常被称为果胶酶,它们包括果胶降解酶、果胶糖酶(pectozyme)和多聚半乳糖醛酸酶。研究最多并最广泛使用的商业果胶酶之一是多聚半乳糖醛酸酶。根据一个实施例,失活的果胶酶基因是pel果胶酸裂解酶。淀粉酶淀粉酶是一种催化淀粉水解成糖的酶。淀粉酶存在于人类和一些其他哺乳动物的唾液中,其中它开始消化的化学过程。胰腺和唾液腺产生淀粉酶(α淀粉酶)来将膳食淀粉水解成二糖和三糖,这些二糖和三糖通过其他酶转化成葡萄糖,为身体提供能量。植物和一些细菌也产生淀粉酶。特定的淀粉酶蛋白由不同的希腊字母指定。所有淀粉酶都是糖苷水解酶,并且作用于α-1,4-糖苷键。本发明优选另外涉及(ec3.2.1.1)(cas#9014-71-5)(替代名称:1,4-α-d-葡聚糖葡聚糖水解酶;糖原酶)的失活。根据一个实施例,失活的淀粉酶基因是amyeα-淀粉酶。在一方面,在此所用的术语“淀粉酶”是指淀粉酶,如[α]-淀粉酶(ec3.2.1.1)、[β]-淀粉酶(ec3.2.1.2)和[γ]-淀粉酶(ec3.2.1.3。)。同一性程度两个氨基酸序列之间或两个核苷酸序列之间的关联性由参数“同一性”描述。在一个实施例中,通过以下方式来确定查询序列与参考序列之间的序列同一性程度:1)通过使用默认评分矩阵和默认空位罚分的任何合适的比对程序来比对两种序列,2)鉴别精确匹配的数量,其中精确匹配是比对程序已经在比对的给定位置处鉴别出两个比对序列中的同一的氨基酸或核苷酸,以及3)将精确匹配的数目除以参考序列的长度。在一个实施例中,通过以下方式来确定查询序列与参考序列之间的序列同一性程度:1)通过使用默认评分矩阵和默认空位罚分的任何合适的比对程序来比对两种序列,2)鉴别精确匹配的数量,其中精确匹配是其中比对程序已经在比对的给定位置处鉴别出两个比对序列中的同一的氨基酸或核苷酸,以及3)将精确匹配的数目除以两个序列中最长的长度。在另一个实施例中,通过以下方式来确定查询序列与参考序列之间的序列同一性程度:1)通过使用默认评分矩阵和默认空位罚分的任何合适的比对程序来比对两种序列,2)鉴别精确匹配的数量,其中精确匹配是其中比对程序已经在比对的给定位置处鉴别出两个比对序列中的同一的氨基酸或核苷酸,以及3)将精确匹配数目除以“比对长度”,其中该比对长度是包括序列的空位和突出部分的整个比对的长度。序列同一性比较可以通过眼睛,或更通常地借助于容易获得的序列比较程序进行。这些商业可得的计算机程序使用复杂的比较算法来比对两个或更多个序列,其最好地反映出可能导致两个或更多个序列之间的一个或多个差异的进化事件。因此,这些算法使用评分系统进行操作,评分系统奖励同一或相似氨基酸的比对,并惩罚空位的插入,空位延伸和不相似氨基酸的比对。比较算法的评分系统包括:i)每当插入空位时指定罚分(空位罚分),ii)每当现有的空位用额外的位置扩大时指定罚分(延伸罚分),iii)当比对同一的氨基酸时指定高分,以及iv)当比对非同一的氨基酸时指定可变分数。大多数比对程序允许修改空位罚分。然而,当使用这种序列比较软件时优选使用默认值。对于非同一的氨基酸的比对给出的得分是根据评分矩阵(也称作取代矩阵)指定的。在所述取代矩阵中提供的得分所反映的事实是:进化过程中一个氨基酸被另一个所取代的可能性是变化的并且其取决于将被取代的氨基酸的物理/化学性质。例如,与被疏水性氨基酸取代相比,极性氨基酸被另一极性氨基酸取代的可能性更高。因此,评分矩阵将为同一的氨基酸指定最高分数,为非同一但相似的氨基酸指定较低分数,并且为非同一的不相似氨基酸指定甚至更低分数。最常用的评分矩阵是pam矩阵(戴霍夫(dayhoff)等人,(1978),琼斯(jones)等人,(1992))、blosum矩阵(亨尼科夫(henikoff)和亨尼科夫(1992))和贡内特(gonnet)矩阵(贡内特等人,(1992))。用于进行这种比对的合适的计算机程序包括但不限于vectornti(英杰公司(invitrogencorp.))和clustalv,clustalw和clustalw2程序(希金斯(higgins)dg和夏普(sharp)pm(1988),希金斯等人(1992),汤普森(thompson)等人(1994),拉金(larkin)等人(2007))。可从位于www.expasy.org的expasy蛋白质组服务器(proteomicsserver)获得不同比对工具的选择。可以执行序列比对的软件的另一个实例是blast(基本局部比对搜索工具(basiclocalalignmentsearchtool)),该blast可从美国国家生物技术信息中心的网页获得,该网页目前可以在http://www.ncbi.nlm.nih.gov/找到,并且该blast首先在阿尔丘尔等人(1990)分子生物学杂志(j.mol.biol.)215;403-410中进行了描述。在本发明的一个优选实施例中,该比对程序正在执行全局比对程序,其优化了全长序列的比对。在另一个优选实施例中,全局比对程序是基于尼德尔曼-翁施(needleman-wunsch)算法(尼德尔曼,索尔(saul)b.;和翁施,克里斯蒂安(christian)d.(1970),“适用于搜索两种蛋白质氨基酸序列相似性的一般方法(ageneralmethodapplicabletothesearchforsimilaritiesintheaminoacidsequenceoftwoproteins)”,分子生物学杂志(journalofmolecularbiology)48(3):443-53)。使用尼德尔曼-翁施算法执行全局比对的当前程序的实例是embossneedle和embossstretcher程序,两者均可以在http://www.ebi.ac.uk/tools/psa/上获得。embossneedle使用德尔曼-翁施比对算法执行最佳全局序列比对,以沿其整个长度找到两个序列的最佳比对(包括空位)。embossstretcher使用德尔曼-翁施算法的修改版,该修改版允许更大序列进行全局比对。在一个实施例中,通过全局比对程序对序列进行比对,并且通过鉴别由程序鉴别的精确匹配数目除以“比对长度”来计算序列同一性,其中比对长度是包括序列的空位和突出部分的整个比对的长度。在另一个实施例中,全局比对程序使用德尔曼-翁施算法,并且通过鉴别由程序鉴别的精确匹配数目除以“比对长度”来计算序列同一性,其中比对长度是包括序列的空位和突出部分的整个比对的长度。在又另一个实施例中,全局比对程序选自由以下各项组成的组:embossneedle和embossstretcher,并且通过鉴别由程序鉴别的精确匹配数目除以“比对长度”来计算序列同一性,其中比对长度是包括序列的空位和突出部分的整个比对的长度。一旦软件生成了比对,就可以计算出相似度%和序列同一性%。该软件通常进行这种计算作为序列比较的一部分,并产生数值结果。在一个实施例中,优选使用clustalw软件来执行序列比对。优选地,使用以下成对比对的参数进行采用clustalw的比对:取代矩阵:gonnet250空位开放罚分:20空位延伸罚分:0.2空位终止罚分:无例如,clustalw2可以在互联网上由欧洲生物信息学研究所在embl-ebi网页www.ebi.ac.uk的工具-序列分析-clustalw2下获得。目前,clustalw2工具的确切地址是www.ebi.ac.uk/tools/clustalw2。在另一个实施例中,优选使用vectornti(英杰公司)中的程序alignx进行序列比对。在一个实施例中,exp10可以与默认设置一起使用:空位开放罚分:10空位延伸罚分:0.05空位分离罚分范围:8在另一个实施例中,通过使用分数矩阵:blosum62mt2和vectornti成对比对设置来确定一个氨基酸序列与,或相对于,另一个氨基酸序列的比对在一个实施例中,通过使用字大小为3并且blosum62作为具有转半乳糖基化活性的取代矩阵的blast来确定一个氨基酸序列与,或相对于,另一个氨基酸序列的同一性的百分比。多肽在一方面,在此披露的本发明使用等于或高于3%w/w初始乳糖浓度浓度的具有如下转半乳糖基化活性:β-半乳糖苷酶活性的比率的多肽:至少0.5、至少1、至少2、至少2.5、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、或至少12。在一方面,在此披露的本发明使用多肽,其中糖苷水解酶催化核心具有seqidno:7的氨基酸序列。在一方面,在此披露的本发明使用包含glyco_hydro2n(pf02837)、glyco_hydro(pf00703)和/或glyco_hydro2c(pf02836)结构域的多肽。在一方面,在此披露了包含细菌ig样结构域(组4)(pf07532)的多肽。在一方面,在此披露了具有选自下组的转半乳糖基化活性的多肽,该组由以下各项组成:g.包含与seqidno:1具有至少90%序列同一性的氨基酸序列的多肽,其中所述多肽由至多980个氨基酸残基组成,h.包含与seqidno:2具有至少97%序列同一性的氨基酸序列的多肽,其中所述多肽由至多975个氨基酸残基组成,i.包含与seqidno:3具有至少96.5%序列同一性的氨基酸序列的多肽,其中所述多肽由至多1300个氨基酸残基组成,j.由多核苷酸编码的多肽,该多核苷酸在至少低严格条件下与以下各项杂交:i)包含在seqidno:9、10、11、12或13中的编码seqidno:1、2、3、4或5的多肽的核酸序列;或ii)i)的互补链,k.由包含如下各项的多核苷酸编码的多肽:与编码seqidno:1、2、3、4或5的多肽的核苷酸序列具有至少70%同一性的核苷酸序列,或包含在seqidno:9、10、11、12或13中的编码成熟多肽的核苷酸序列,和l.包括seqidno:1、2、3、4或5的一个或多个氨基酸残基的缺失、插入和/或保守取代的多肽。在另一方面,在此披露的本发明使用具有选自下组的转半乳糖基化活性的多肽,该组由以下各项组成:a.包含与seqidno:3具有至少96.5%序列同一性的氨基酸序列的多肽,其中所述多肽由至多1300个氨基酸残基组成,b.包含与seqidno:1具有至少90%序列同一性的氨基酸序列的多肽,其中所述多肽由至多980个氨基酸残基组成,c.由多核苷酸编码的多肽,该多核苷酸在至少低严格条件下与以下各项杂交:i)包含在seqidno:9、10、11、12或13中的编码seqidno:1、2、3、4或5的多肽的核酸序列;或ii)i)的互补链,d.由包含如下各项的多核苷酸编码的多肽:与编码seqidno:1、2、3、4或5的多肽的核苷酸序列具有至少70%同一性的核苷酸序列,或包含在seqidno:9、10、11、12或13中的编码成熟多肽的核苷酸序列,和e.包括seqidno:1、2、3、4或5的一个或多个氨基酸残基的缺失、插入和/或保守取代的多肽。在一方面,在此披露的本发明使用多肽,其中氨基酸序列与seqidno:1、2、3、4或5的成熟氨基酸序列具有至少68%、70%、72%、74%、76%、78%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性。在一方面,在此披露的本发明使用与seqidno:1的成熟氨基酸序列具有90%序列同一性的多肽。在一方面,在此披露的本发明使用与seqidno:2的成熟氨基酸序列具有90%序列同一性的多肽。在一方面,在此披露的本发明使用与seqidno:3的成熟氨基酸序列具有96.5%序列同一性的多肽。在一方面,在此披露的本发明使用与seqidno:4的成熟氨基酸序列具有96.5%序列同一性的多肽。在一方面,在此披露的本发明使用与seqidno:5的成熟氨基酸序列具有96.5%序列同一性的多肽。在一方面,在此披露的本发明使用包括seqidno:1、2、3、4或5的氨基酸序列的或由其组成的多肽。在一方面,在此披露的本发明使用衍生自两歧双歧杆菌的多肽。在一方面,在此披露的本发明使用ph最佳值为6.5-7.5的多肽。在一方面,在此披露的本发明使用温度最佳值为30-60如42-60摄氏度的多肽。可以将对碳水化合物具有活性的多肽使用基于其底物特异性的iubmb分类系统或cazy指定分类为当前125个糖苷水解酶家族之一。在cazy数据库中,指定是基于序列和结构信息,结合底物和产品的立体化学知识而进行的。在此披露了多肽的用途,当在包括编码所述多肽的核酸序列的合适的宿主菌株(例如,枯草芽孢杆菌)中是表达产物时,该多肽是表现出转半乳糖基化活性的所述核酸序列的唯一多肽表达产物。这可以通过使用本领域技术人员已知的以下技术来评估。使待评估的样品经受sds-page,并使用适合于蛋白质定量的染料例如像伯乐标准(bio-radcriterion)系统进行可视化。然后使用适当的光密度扫描仪(例如像伯乐标准系统)扫描凝胶,并确保所得图像处于动态范围内。对与衍生自seqidno:8的任何变体/片段相对应的条带进行定量,并且如下计算多肽的百分比:所讨论的多肽的百分比=所讨论的多肽/(表现出转半乳糖基化活性的所有多肽的总和)*100。组合物中衍生自seqidno:8的多肽变体/片段的总数可以通过本领域技术人员已知的方法使用多克隆抗体通过蛋白质印迹检测衍生自seqidno:8的片段来确定。在此披露的多肽包括酶内包含的至少两个分离的功能结构域。首先,如下所述,多肽应包含糖苷水解酶催化核。催化核心应属于相关糖苷水解酶家族的gh-a族。gh-a族的特征在于通过保留机制切割糖苷键,并具有基于tim桶折叠的催化结构域(维伦加(wierenga),2001,欧洲生化学会联合会快报(febsletters),492(3),第193-8页)。催化结构域包含作为质子供体和亲核体的两个谷氨酸残基,这两个谷氨酸残基源于桶结构域的链4和7(詹金斯(jenkins),1995,欧洲生化学会联合会快报,362(3),第281-5页)。tim桶的总体结构是由8个β链和8个α-螺旋组成的(β/α)8折叠。在一方面,在此披露的糖苷水解酶催化核心属于糖苷水解酶家族gh-2和-35之一,这些糖苷水解酶家族gh-2和-35都是属于gh-a族的tim-桶酶。在另一方面,糖苷水解酶催化核心属于家族gh-2或gh-35。在另一方面,糖苷水解酶催化核心属于家族gh-2。一个共同特点是这些酶是所谓的保留酶,使得底物的立体化学在产品中是保守的(亨利萨特(henrissat),1997,结构生物学当前观点(curropinstructbiol),7(5),637-44)。在一方面,在此披露的多肽对具有β(1→4)构象的碳水化合物键具有活性。这有效地将该酶归入β-半乳糖苷酶的iubmbec3.2.1.23类。该活性可以但不限于通过利用合成底物如对硝基苯酚-β-d-吡喃半乳糖苷(pnpg)、邻硝基苯酚-β-d-吡喃半乳糖苷(onpg)或具有显色糖苷配基的β-d-吡喃半乳糖苷(xgal)来确定。作为确定酶是否属于β-半乳糖苷酶的ec3.2.1.23类的替代方法是与底物如乳糖一起孵育,并通过方法如酶测定、hplc、tlc或本领域技术人员已知的其他方法测量葡萄糖的释放。为了预测多肽的功能实体,可以应用若干个可用的公共储存库,例如像pfam(核酸研究(nucl.acidsres.)(2010)38(增刊1):d211-d222.doi:10.1093/nar/gkp985)和interpro(核酸研究(2009)37(增刊1):d211-d215.doi:10.1093/nar/gkn785)。应当指出,当进行这种分析时,应该在从公共储存库数据库中获得的多肽的全长序列上进行分析。在另一方面,提供了包含选自以下的一种或多种pfam结构域的多肽:glyco_hydro2n(pf02837)、glyco_hydro(pf00703)、glyco_hydro2c(pf02836)和细菌ig样结构域(组4)(pf07532)。在又另一方面,提供包含pfam结构域glyco_hydro2n(pf02837)、glyco_hydro(pf00703)、glyco_hydro2c(pf02836)和细菌ig样结构域(组4)(pf07532)的多肽。在又另一方面,使用包含构成多肽催化结构域的glyco_hydro2n(pf02837)、glyco_hydro(pf00703)和glyco_hydro2c(pf02836)结构域的多肽。在另一方面,使用如在此披露的并具有如下转半乳糖基化活性:β-半乳糖苷酶活性比率的多肽,如在100ppm浓度下,在乳基测定中,在37℃和5w/w%乳糖下,在15、30或180如180分钟反应后所测量的,该比率为至少1、至少2.5、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、或至少12。在另一方面,该多肽衍生自两歧双歧杆菌。在一方面,在此所披露的一种或多种多肽具有转半乳糖基化活性,这样使得如在100ppm的浓度下,在乳基测定中,在37℃和5w/w%乳糖下,在15、30或180如180分钟反应后所测量的,超过20%、超过30%、超过40%、高达50%的初始乳糖发生了转半乳糖基化。在另一方面,在此披露的一种或多种多肽具有β-半乳糖苷酶活性,这样使得如在100ppm的浓度下,在乳基测定中,在37℃和5w/w%乳糖下,在15、30或180如180分钟反应后所测量的,小于80%、小于70%、小于60%、小于50%、小于40%、小于30%、小于20%的乳糖已被水解。在一方面,按照方法4中规定的,在对应于2.13lau的100ppm的浓度下测量β-半乳糖苷酶活性和/或转半乳糖基化活性。通常,酶的活性单位可以根据wo2003/186286中披露为方法4的测定来测量,并在以下实例部分4中重现。在另一方面,在此披露的一种或多种多肽具有以下特征中的一个或多个:a)如在100ppm浓度下,在乳基测定中,在37℃和5w/w%乳糖下,在15、30或180如180分钟反应后所测量的,为至少1、至少2.5、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、或至少12的转半乳糖基化活性:β-半乳糖苷酶活性比率,和/或b)具有转半乳糖基化活性,这样使得如在100ppm的浓度下,在乳基测定中,在37℃和5w/w%乳糖下,在15、30或180如180分钟反应后所测量的,超过20%、超过30%、超过40%、以及高达50%的初始乳糖已经发生了转半乳糖基化。在一方面,提供了包含与seqidno:3具有至少96.5%序列同一性的氨基酸序列的多肽,其中所述多肽由至多1300个氨基酸残基组成。在另一方面,提供了包含与seqidno:1具有至少90%序列同一性的氨基酸序列的多肽,如其中所述序列同一性是至少95%,例如像至少96%、至少97%、至少98%、至少99%或至少100%序列同一性,并且其中所述多肽由至多980个氨基酸残基组成。在另一方面,提供了包含与seqidno:1具有至少90%序列同一性的氨基酸序列的多肽,其中所述多肽由至多980个氨基酸残基组成。在又另一方面,提供了一种多肽,其中所述多肽与seqidno:1具有至少90%序列同一性,如其中所述多肽与seqidno:1具有至少90%,例如像至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性。在另一方面,提供了与seqidno:2具有至少96,5%序列同一性的多肽,如其中所述多肽与seqidno:2具有至少97%,例如像至少98%或至少99%序列同一性。在一方面,提供了在此披露的多肽,这些多肽由至多975个氨基酸残基,例如像,至多970个氨基酸残基、如至多950个氨基酸残基、如至多940个氨基酸残基、至多930个氨基酸残基、至多920个氨基酸残基、至多910个氨基酸残基、至多900个氨基酸残基、至多895个氨基酸残基或至多890个氨基酸残基组成。在一方面,提供了由887或965个氨基酸残基组成的特定的多肽。在一方面,提供了一种多肽,该多肽包含与seqidno:2具有至少97%序列同一性的氨基酸序列,如其中所述序列同一性为至少98%,例如像至少99%或至少100%序列同一性,其中所述多肽由至多975个氨基酸残基,例如像,至多970个或至少965个氨基酸残基组成。在一方面,使用包含与seqidno:2具有至少97%序列同一性的氨基酸序列的多肽,其中所述多肽由至多975个氨基酸残基组成。在另一优选的方面,提供了包括seqidno:1、2、3、4或5的多肽。在又一优选方面,使用由seqidno:1、2、3、4或5的氨基酸序列组成的多肽,特别是由seqidno:1或2的氨基酸序列组成的多肽。在另一方面,使用包含与seqidno:3具有至少96.5%序列同一性的氨基酸序列的多肽,如其中所述序列同一性是至少97%,例如像至少98%、至少99或至少100%序列同一性,其中所述多肽由至多1300个氨基酸残基组成。在另一方面,提供一种多肽,其中所述多肽与seqidno:5具有至少98.5%,如至少99%或至少99.5%序列同一性。在一方面,这样的多肽由至多1290个氨基酸残基,例如像,至多1280、至多1270、至多1260、至多1250、至多1240、至多1230、至多1220或至多1215个氨基酸残基组成。在一优选方面,使用由1211个氨基酸残基组成的多肽。在另一方面,提供一种多肽,其中所述多肽与seqidno:4具有至少96%,如至少97%,例如像至少98%或至少99%序列同一性。在一方面,使用一种多肽,该多肽由至多1210个氨基酸残基,例如像至多1200、至多1190、至多1180、至多1170、至多1160、至多1150或至多1145个氨基酸残基,如1142个氨基酸残基组成。在另一方面,提供一种多肽,其中所述多肽与seqidno:3具有至少96.5%,如至少97%,例如像至少98%或至少99%序列同一性。在一方面,提供了一种多肽,该多肽由至多1130个氨基酸残基,例如像至多1120、至多1110、至多1100、至多1090、至多1080、至多1070、至多1060、至多1050、至多1055或至多1040个氨基酸残基组成。在一优选方面,使用由1038个氨基酸残基组成的多肽。在另一方面,在此披露的多肽具有高于100%,如高于150%,175%或200%的转半乳糖基化活性比率。蛋白质通常由一个或多个功能区域(通常称为结构域)组成。不同结构域在不同蛋白质的不同组合中的存在产生了在自然界中发现的蛋白质的多样性谱。描述结构域的一种方式是借助于pfam数据库,该pfam数据库是如以下描述的蛋白质结构域家族的大集合:“pfam蛋白家族数据库”:r.d.芬恩,j.米斯特里,j.塔特,p.柯吉尔,a.赫格尔,j.e.普林顿,o.l.加文,p.古恩赛卡伦,g.赛利克,k.福斯隆德,l.霍尔姆,e.l.松哈默,s.r.艾迪,a.贝特曼,核酸研究(2010),数据库专辑38:d211-222。每个家族由多个序列比对和隐马尔可夫模型(hmm)表示。在此提供的一种或多种多肽优选包含pfam结构域glyco_hydro2n(pf02837)、glyco_hydro(pf00703)、glyco_hydro2c(pf02836)和细菌ig样结构域(组4)(pf07532)中的一种或多种。在一方面,在此提供的一种或多种多肽包含glyco_hydro2n(pf02837)、glyco_hydro(pf00703)、glyco_hydro2c(pf02836)和细菌ig样结构域(组4)(pf07532)。在一方面,在此使用的多肽在4-9,如5-8、如5.5-7.5、如6.5-7.5的ph范围内具有有益的转半乳糖基化活性。本发明涵盖与在此定义的一种或多种氨基酸序列或与具有如在此定义的具体特性的多肽具有一定程度的序列同一性或序列同源性的多肽的用途。具体地而言,本发明涵盖与以下定义的seqidno:1、2、3、4或5中任一个或其同系物具有一定程度的序列同一性的肽的用途。同源氨基酸序列和/或核苷酸序列应提供和/或编码一种多肽,与seqidno:1、2、3、4或5的多肽相比,该多肽保留了功能性转半乳糖基化活性和/或增强了转半乳糖基化活性。在上下文中,同源序列被认为包括一种氨基酸序列,该氨基酸序列可以与主题序列具有至少66%、70%、75%、78%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性。通常,同系物将包括与主题氨基酸序列相同的活性位点等。尽管同源性也可以根据相似性(即具有相似化学特性/功能的氨基酸残基)来考虑,但在本发明的上下文中,优选的是根据序列同一性来表示同源性。因此,本发明还涵盖如在此定义的蛋白质或多肽的任何氨基酸序列的变体、同系物和衍生物的用途,特别是以下定义的seqidno:1、2、3、4或5的那些。这些序列,特别是以下定义的seqidno:1、2、3、4或5的变体、同系物和衍生物,还可以具有氨基酸残基的缺失、插入或取代,这产生沉默变化并且形成功能上等效的物质。可以基于残基的极性、电荷、溶解度、疏水性、亲水性和/或两亲性性质的相似性进行有意的氨基酸取代,只要保留底物的次要结合活性即可。例如,带负电荷的氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;并且具有不带电极性头部基团(该基团具有类似的亲水性值)的氨基酸包括亮氨酸、异亮氨酸、缬氨酸、甘氨酸、丙氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。本发明还涵盖了可能出现的保守取代(取代和置换在此均用于意指现有氨基酸残基与替代残基的交换),即对等取代,如碱性对碱性、酸性对酸性、极性对极性等。也可以发生非保守取代,即从一类残基到另一类残基或者可替代地涉及包括非天然氨基酸如鸟氨酸(在下文中称为z)、二氨基丁酸鸟氨酸(在下文中称为b)、正亮氨酸鸟氨酸(在下文中称为o)、吡啶基丙氨酸、噻吩丙氨酸、萘基丙氨酸以及苯基甘氨酸。可以进行的保守取代是例如在如下组内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、脂肪族氨基酸(丙氨酸、缬氨酸、亮氨酸、异亮氨酸)、极性氨基酸(谷氨酰胺、天冬酰胺、丝氨酸、苏氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、羟基氨基酸(丝氨酸、苏氨酸)、大氨基酸(苯丙氨酸和色氨酸)和小氨基酸(甘氨酸、丙氨酸)。在一方面,本发明中使用的多肽序列处于纯化形式。在一方面,用于本发明的多肽或蛋白质处于分离形式。在一方面,本发明的多肽是重组生产的。变体多肽包含与seqidno:1或2具有一定百分比,例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的多肽。变体多肽包含与seqidno:3、4或5具有一定百分比,例如至少96%、97%、98%或99%序列同一性的多肽。在一方面,在此使用的多肽包括与由编码转半乳糖基酶的核苷酸序列编码的、包含在两歧双歧杆菌dsm20215中、在此示为seqidno:22的成熟多肽的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性的氨基酸序列。根据seqidno:1、2、3、4或5讨论的与序列同一性和功能有关的所有考虑和限制比照适用于这些多肽和核苷酸的序列同一性和官能度。在一方面,主题氨基酸序列是seqidno:1、2、3、4或5,并且主题核苷酸序列优选地是seqidno:9、10、11、12或13。在一方面,多肽是从seqidno:1、2、3、4或5的多肽的氨基和/或羧基末端缺失的一个或多个(若干个)氨基酸的片段;其中该片段具有转半乳糖基化活性。在一方面,片段包含至少500、550、600、650、700、750、800、850、900、950或1000个氨基酸残基。在另一方面,多肽变体的长度为500至1300个氨基酸残基。在另一方面,多肽变体的长度为600至1300个氨基酸。在另一方面,多肽变体的长度为700至1300个氨基酸。在另一方面,多肽变体的长度为800至1300个氨基酸。在另一方面,多肽变体的长度为800至1300个氨基酸。为了评估变体在宿主细胞中的表达,测定可以测量所表达的蛋白质、相应的mrna或β-半乳糖苷酶活性。例如,合适的测定包括使用适当标记的杂交探针的rna印迹法和dna印迹法、rt-pcr(逆转录酶聚合酶链式反应)和原位杂交。合适的测定还包括测量样品中的活性。该变体的活性的合适的测定包括但不限于基于onpg的测定或确定例如像在此的方法和实例中所描述的反应混合物中的葡萄糖。seqidno:1、2、3、4或5的多肽变体在一方面,使用相对于seqidno:1、2、3、4或5在一个或多个位置处具有取代的seqidno:1、2、3、4或5的变体,该取代影响改变的特性,如改进的转半乳糖基化。在本文件中为了方便起见,这样的变体多肽又称为“变体多肽”、“多肽变体”或“变体”。在一方面,与seqidno:1、2、3、4或5的多肽相比,在此定义的多肽具有改进的转半乳糖基化活性。在另一方面,与seqidno:1、2、3、4或5的多肽相比,如在此所定义的多肽具有改进的反应速度。在此使用的多肽和变体多肽包括转半乳糖基化活性。在一方面,在如高于3%w/w初始乳糖浓度的浓度下30min反应后,转半乳糖基化活性:β-半乳糖苷酶活性的比率为至少0.5,如至少1,如至少1.5,或如至少2。在一方面,在如高于3%w/w初始乳糖浓度的浓度下30min反应后,转半乳糖基化活性:β-半乳糖苷酶活性的比率为至少2.5、如至少3、如至少4、如至少5、如至少6、如至少7、如至少8、如至少9、如至少10、如至少11、或如至少12。在一方面,如在此定义的多肽和变体可衍生自微生物来源,特别是可衍生自丝状真菌或酵母,或可衍生自细菌。该酶可以例如衍生自如下各项的菌株:伞菌属,例如双孢蘑菇;ascovaginospora;曲霉属,例如黑曲霉、泡盛曲霉、臭曲霉、日本曲霉、米曲霉;念珠菌属;毛壳菌属;chaetotomastia;网柄菌属,例如盘基网柄菌;克鲁维酵母菌属,例如脆壁克鲁维酵母、乳酸克鲁维酵母;毛霉属,例如爪哇毛霉、高大毛霉、细小毛霉;脉孢菌属,例如粗糙脉孢菌;根毛霉属,例如微小根毛霉;根霉属,例如少根根霉、日本根霉、匍枝根霉;核盘霉属,例如白腐核盘霉;圆酵母属;球拟酵母属;毛癣菌属,例如红色毛癣菌;维氏核盘菌属,例如大豆维氏核盘菌;芽孢杆菌属,例如凝结芽孢杆菌、环状芽孢杆菌、巨大芽孢杆菌、诺瓦利斯芽孢杆菌(b.novalis)、枯草芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、苏云金芽孢杆菌;双歧杆菌属,例如长双歧杆菌、两歧双歧杆菌、动物双歧杆菌;金黄杆菌属;柠檬酸杆菌属,例如弗氏柠檬酸杆菌;梭菌属,例如产气荚膜梭菌;色二孢属,例如棉色二孢;肠杆菌属,例如产气肠杆菌,阴沟肠杆菌;爱德华菌属,迟钝爱德华菌;欧文氏菌属,例如草生欧文氏菌;埃希氏菌属,例如大肠杆菌;克雷伯氏菌属,例如肺炎克雷伯氏菌;多球菌属(miriococcum);漆斑菌属;毛霉属;脉孢菌属,例如粗糙脉孢菌;变形杆菌属,例如普通变形杆菌;普罗维登斯菌属,例如斯氏普罗威登斯菌;密孔菌属,例如朱红密孔菌、血红密孔菌;瘤胃球菌属,例如扭链瘤胃球菌;沙门氏菌属,例如鼠伤寒沙门菌;沙雷氏菌属,例如液化沙雷氏菌、粘质沙雷氏菌;志贺菌属,例如弗氏志贺菌;链霉菌属,例如抗生链霉菌、栗色球孢链霉菌、紫红链霉菌;栓菌属;木霉属,例如里氏木霉、绿色木霉;耶尔森氏菌属,例如小肠结肠炎耶尔森氏菌。提供包括如在此定义的多肽或变体多肽的分离的和/或纯化的多肽。在一个实施例中,变体多肽是多肽(seqidno:1、2、3、4或5)的成熟形式。在一方面,这些变体包括c端结构域。在一方面,如在此定义的变体多肽包括变体,其中相对于seqidno:1、2、3、4或5已经添加或缺失了在一个和约25个之间的氨基酸残基。在一方面,如在此定义的变体多肽包括变体,其中相对于seqidno:1、2、3、4或5已经取代、添加或缺失了在一个和25个之间的氨基酸残基。在一方面,该变体具有seqidno:1、2、3、4或5的氨基酸序列,其中已经取代了在一个和约25个之间任何数目的氨基酸。在另一方面,该变体具有seqidno:1、2、3、4或5的氨基酸序列,其中已经取代了在三个和十二个之间任何数目的氨基酸。在另一方面,该变体具有seqidno:1、2、3、4或5的氨基酸序列,其中已经取代了在五个和九个之间任何数目的氨基酸。在一方面,seqidno:1、2、3、4或5中的至少两个,在另一方面,至少三个,并且在又另一方面,至少五个氨基酸已经被取代。在一方面,在此披露的一个或多个多肽具有1、2、3、4或5的序列。在一方面,在此披露的一个或多个多肽具有seqidno:1、2、3、4或5的序列,其中n末端中的10,如9、如8、如7、如6、如5、如4、如3、如2、如1个氨基酸被取代和/或缺失。其酶和酶变体可以通过以下表征:其核酸和初级多肽序列、三维结构建模和/或其比活度。如在此所定义的多肽或多肽变体的另外的特征包括例如稳定性、ph范围、氧化稳定性和热稳定性。可以使用本领域技术人员已知的标准测定来评估表达水平和酶活性。在另一方面,变体表现出相对于具有seqidno:1、2、3、4或5的多肽的改进的性能特征,如在高温,例如,65℃-85℃下改进的稳定性。提供如在此定义的具有如下氨基酸序列的多肽变体,该氨基酸序列与seqidno:1、2、3、4或5的多肽具有至少约66%、68%、70%、72%、74%、78%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%同一性。核苷酸在一方面,本发明使用如上所述的具有转半乳糖基化活性的分离的多肽,该多肽由如下多核苷酸编码,这些多核苷酸在非常低的严格条件,优选地低严格条件,更优选地中严格条件,更优选地中-高严格条件,甚至更优选地高严格条件,以及最优选地非常高严格条件下与i)包含在seqidno:9、10、11、12或13中的编码seqidno:1、2、3、4或5的成熟多肽的核酸序列;ii)i)的cdna序列;或iii)i)或ii)的互补链杂交(j.萨姆布鲁克,e.f.弗里奇(fritsch),和t.马尼亚蒂斯(maniatis),1989,分子克隆,实验室手册(molecularcloning,alaboratorymanual),第2版,冷泉港,纽约州)。seqidno:9、10、11、12或13的子序列包含至少100个连续核苷酸或优选至少200个连续核苷酸。此外,子序列可以编码具有乳糖酶活性的多肽片段。可以使用seqidno:9、10、11、12或13的核苷酸序列或其子序列、连同seqidno:1、2、3、4或5的氨基酸序列或其片段来设计核酸探针,以根据本领域众所周知的方法来鉴定并克隆对来自不同属或物种的菌株的具有转半乳糖基酶活性的多肽进行编码的dna。具体地说,这类探针可以用于按照标准dna印迹程序与感兴趣的属或物种的基因组或cdna杂交,以便鉴定并分离其中的相应基因。这些探针可以比完整序列短得多,但是长度应当是至少14个、优选至少25个、更优选至少35个、且最优选至少70个核苷酸。然而,优选的是核酸探针的长度是至少100个核苷酸。例如,核酸探针的长度可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。可使用甚至更长的探针,例如长度为至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。dna和rna探针都可以使用。通常将探针标记以探测相应的基因(例如,用32p、3h、35s、生物素或抗生物素蛋白标记)。这类探针涵盖于本发明中。因此,可以针对与以上所描述的探针杂交并且编码具有乳糖酶活性的多肽的dna对由这类其他生物体制备的基因组dna文库进行筛选。可通过琼脂糖或聚丙烯酰胺凝胶电泳、或其他分离技术分离来自这类其他生物的基因组或其他dna。可以将来自文库的dna或分离的dna转移并且固定在硝酸纤维素(nitrocellulose)或其他适合的载体材料上。为鉴定与seqidno:9、10、11、12或13或其子序列同源的克隆或dna,在dna印迹法中使用载体材料。出于本发明的目的,杂交表明该核苷酸序列在非常低到非常高严格条件下与一种被标记的核酸探针杂交,该探针对应于seqidno:9、10、11、12或13中所示的核苷酸序列、其互补链、或其子序列。可以使用x射线胶片检测在这些条件下与核酸探针杂交的分子。该核酸探针可以是seqidno:9、10、11、12或13的成熟多肽编码区域。对于至少100个核苷酸长度的长探针,非常低至非常高严格性条件被定义为最佳地按照标准dna印迹程序,在42℃下在5xsspe、0.3%sds、200g/ml剪切和变性的鲑鱼精子dna中,以及对于非常低和低严格性在25%甲酰胺中,对于中和中-高严格性在35%甲酰胺中,或对于高和非常高严格性在50%甲酰胺中预杂交和杂交12至24小时。对于长度为至少100个核苷酸的长探针而言,载体材料最终使用2xssc、0.2%sds,优选至少在45℃下(非常低严格性),更优选至少在50℃下(低严格性),更优选至少在55℃下(中严格性),更优选至少在60℃下(中-高严格性),甚至更优选至少在65℃下(高严格性),并且最优选至少在70℃下(非常高严格性)洗涤三次,每次15分钟。在一个具体实施例中,洗涤使用0.2xssc、0.2%sds,优选至少在45℃下(非常低严格性),更优选至少在50℃下(低严格性),更优选至少在55℃下(中严格性),更优选至少在60℃下(中高严格性),甚至更优选至少在65℃下(高严格性),并且最优选至少在70℃下(非常高严格性)进行。在另一个具体实施例中,洗涤使用0.1xssc、0.2%sds,优选至少在45℃下(非常低严格性),更优选至少在50℃下(低严格性),更优选至少在55℃下(中严格性),更优选至少在60℃下(中高严格性),甚至更优选至少在65℃下(高严格性),并且最优选至少在70℃下(非常高严格性)进行。对于长度为约15个核苷酸至约70个核苷酸的短探针而言,严格条件被定义为根据标准dna印迹程序,在比使用根据博尔顿(bolton)和麦卡锡(mccarthy)(1962,美国国家科学院院刊(proceedingsofthenationalacademyofsciencesusa)48:1390)的计算计算的tm低约5℃至约10℃下,在0.9mnacl、0.09mtris-hcl(ph7.6)、6mmedta、0.5%np-40、1x登哈特氏溶液(denhardt'ssolution)、1mm焦磷酸钠、1mm磷酸二氢钠、0.1mmatp、以及每ml0.2mg的酵母rna中预杂交、杂交及杂交后洗涤。对于长度为约15个核苷酸至约70个核苷酸的短探针而言,将载体材料在比计算的tm低5℃至10℃下,在6xscc加0.1%sds中洗涤一次,持续15分钟,并且使用6xssc洗涤两次,每次15分钟。在包含盐的杂交条件下,有效tm控制了用于成功杂交的探针和滤器结合的dna之间所需的同一性程度。可以使用以下公式确定有效tm,以确定两种dna在各种严格条件下杂交所需的同一性程度。有效tm=81.5±16.6(logm[na+])+0.41(g+c%)-0.72(甲酰胺%)(参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)seqidno:10的g+c含量为42%,并且seqidno:11的g+c含量为44%。对于中严格性,甲酰胺为35%,并且5xsspe的na+浓度为0.75m。另一个相关关系是两个dna的1%错配将tm降低1.4℃。为了确定两个dna在42℃的中严格条件下杂交所需的同一性程度,使用下列公式:同源性%=100-[(有效tm-杂交温度)/1.4](参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)变体核酸包括与编码seqidno:1、2、3、4或5的核酸具有一定百分比,例如60%、65%、70%、75%、80%、85%、90%、95%、或99%序列同一性的多核苷酸。在一方面,提供了能够编码如在此披露的多肽的核酸。在另一方面,在此披露的核酸具有与seqidno:9、10、11、12或13具有至少60%,如至少65%,如至少70%,如至少75%,如至少80%,如至少85%,如至少90%,如至少95%,如至少99%同一性的核酸序列。可以使用包括如在此所述的核酸的质粒。可以使用包括在此所述的核酸或能够表达如在此所述的多肽的表达载体。提供了与编码本文中所定义的任意多肽变体的核酸互补的核酸。另外,提供了能够与补体杂交的核酸。在另一个实施例中,用于本文所述方法和组合物的序列是合成序列。它包括但不限于:用最佳密码子使用制备的用于在宿主生物体如酵母中表达的序列。根据本领域众所周知的程序,如在此提供的多肽变体可以经合成或通过在宿主细胞中重组表达来产生。在一方面,在此披露的一种或多种多肽是一种或多种重组多肽。任选地将如在此定义的所表达的多肽变体在使用前分离。在另一个实施例中,如在此定义的多肽变体在表达后进行纯化。例如,在美国专利号7,371,552、7,166,453、6,890,572、和6,667,065;以及美国公开申请号2007/0141693、2007/0072270、2007/0020731、2007/0020727、2006/0073583、2006/0019347、2006/0018997、2006/0008890、2006/0008888、和2005/0137111中描述了多肽变体的遗传修饰和重组生产方法。这些披露的相关教导通过引用并入本文,这些相关教导包括编码多肽的多核苷酸序列、引物、载体、选择方法、宿主细胞、所表达的多肽变体的纯化和重构以及如在此定义的多肽变体的表征,包括有用的缓冲液、ph范围、ca2+浓度、底物浓度和用于酶法测定的酶浓度。提供编码seqidno:1、2、3、4或5的蛋白质的核酸序列或与编码seqidno:1、2、3、4或5的蛋白质的核酸具有至少约66%、68%、70%、72%、74%、78%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在一个实施例中,核酸序列与seqidno:9、10、11、12或13的核酸具有至少约60%、66%、68%、70%、72%、74%、78%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性。载体在一方面,本发明使用包括多核苷酸的载体。在一方面,细菌细胞包括载体。在一些实施例中,将包括编码变体的核酸的dna构建体在包括与编码序列可操作地连接的调节序列的表达载体中转移到宿主细胞。载体可以是可以整合到真菌宿主细胞基因组中并且当被引入宿主细胞时进行复制的任何载体。密苏里大学fgsc菌株目录列出合适的载体。萨姆布鲁克等人,分子克隆:实验室手册,第3版,冷泉港实验室出版社,冷泉港,纽约州(2001);班尼特(bennett)等人,真菌中更多的基因操作(moregenemanipulationsinfungi),学术出版社,圣迭哥(1991),第396-428页;和美国专利号5,874,276中提供了合适的表达和/或整合载体的另外的实例。示例性载体包括pfb6、pbr322、puc18、puc100和pentr/d、pdontm201、pdonrtm221、pentrtm、3z以及4z。用于细菌细胞的示例包括允许在大肠杆菌中复制的pbr322和puc19,以及例如允许在芽孢杆菌属中复制的pe194。在一些实施例中,编码变体的核酸可操作地连接到合适的启动子,其允许在宿主细胞中转录。启动子可以衍生自编码与宿主细胞同源或异源的蛋白质的基因。启动子的合适的非限制性实例包括cbh1、cbh2、egl1、和egl2启动子。在一个实施例中,该启动子是对宿主细胞天然的启动子。例如,当宿主为嗜糖假单胞菌时,启动子为天然的嗜糖假单胞菌启动子。“诱导型启动子”是指在环境调节或发育调节下具有活性的启动子。在另一个实施例中,该启动子是对宿主细胞异源的启动子。在一些实施例中,将编码序列可操作地连接到编码信号序列的dna序列上。在另一方面,代表性的信号肽是seqidno:27。代表性的信号肽是seqidno:9,该seqidno:9是枯草芽孢杆菌apre前体的天然信号序列。在其他实施例中,将编码信号序列的dna用编码来自其他细胞外枯草芽孢杆菌前体的信号序列的核苷酸序列替代。在一个实施例中,编码信号序列的多核苷酸紧邻编码多肽的多核苷酸的上游并在框内。信号序列可以选自与宿主细胞相同的物种。在另外的实施例中,包扩待引入真菌宿主细胞的dna构建体或载体的信号序列和启动子序列衍生自相同的来源。在一些实施例中,表达载体还包括终止序列。在一个实施例中,终止序列和启动子序列衍生自相同的来源。在另一个实施例中,终止序列与宿主细胞是同源的。在一些实施例中,表达载体包括选可选择的标志物。合适的可选择的标志物的实例包括赋予抗微生物剂抗性的那些,例如潮霉素或腐草霉素。营养选择性标志物也是合适的,并且包括amds、argb和pyr4。在一个实施例中,选择性标志物是编码乙酰胺酶的amds基因;它允许转化的细胞在作为氮源的乙酰胺上生长。在凯利(kelley)等人,欧洲分子生物学学会杂志(emboj.)4:475-479(1985)和彭蒂拉(penttila)等人,基因(gene)61:155-164(1987)中描述了构巢曲霉amds基因作为选择性标志物的用途。包含具有编码变体的多核苷酸的dna构建体的合适的表达载体可以是能够在给定宿主生物体中自主复制的或整合到宿主dna中的任何载体。在一些实施例中,表达载体是质粒。在一些实施例中,考虑了两种类型的表达载体,用于获得基因表达。第一表达载体包括dna序列,其中启动子、编码区和终止子全部来源于待表达基因。在一些实施例中,在其自身的转录和翻译调节序列的控制下,通过删除不想要的dna序列以留下待表达的结构域而获得基因截短。预先组装第二种类型表达载体,并且包含高水平转录所需的序列和可选择的标志物。在一些实施例中,将基因或其部分的编码区插入到该通用表达载体中,这样使得它处于表达构建体启动子和终止子序列的转录控制下。在一些实施例中,将基因或其部分插入强cbh1启动子的下游。表达宿主/宿主细胞在另一方面,使用包括如在此所述的质粒或如在此所述的表达载体的,优选经其转化的,宿主细胞。在另一方面,使用能够表达如在此所述的多肽的细胞。在一方面,如在此所述的宿主细胞或如在此所述的细胞是细菌、真菌或酵母细胞。在另一方面,宿主细胞选自由以下各项组成的组:瘤胃球菌属、双歧杆菌属、乳球菌属、乳杆菌属、链球菌属、明串珠菌属、埃希氏杆菌属、芽孢杆菌属、链霉菌属、酵母菌属、克鲁维酵母菌属、念珠菌属、圆酵母属、球拟酵母属和曲霉属。在另一方面,该宿主细胞选自由以下各项组成的组:汉逊瘤胃球菌(ruminococcushansenii)、短双岐杆菌、长双歧杆菌、婴儿双岐杆菌、两歧双歧杆菌和乳酸乳球菌。在另一个实施例中,合适的宿主细胞包括选自下组的革兰氏阳性细菌,该组由以下各项组成:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、苏云金芽孢杆菌、变铅青链霉菌、或鼠灰链霉菌;或革兰氏阴性细菌,其中所述革兰氏阴性细菌为大肠杆菌或假单胞菌属物种。在一方面,宿主细胞是枯草芽孢杆菌或地衣芽孢杆菌。在一个实施例中,宿主细胞是枯草芽孢杆菌,并且所表达的蛋白质被工程化以包括枯草芽孢杆菌信号序列,如以下进一步详细阐述的。在一些实施例中,宿主细胞被遗传工程化以表达如在此定义的具有如下氨基酸序列的多肽变体,该氨基酸序列与seqidno:1、2、3、4或5的多肽具有至少约66%、68%、70%、72%、74%、78%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%同一性。在一些实施例中,编码如在此定义的多肽变体的多核苷酸将具有编码seqidno:1、2、3、4或5的蛋白质的核酸序列或与编码seqidno:1、2、3、4或5的蛋白质的核酸具有至少约66%、68%、70%、72%、74%、78%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在一个实施例中,核酸序列与seqidno:9、10、11、12或13的核酸具有至少约60%、66%、68%、70%、72%、74%、78%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性。诱变可以通过使用重组遗传操作技术的基因工程、使宿主经受诱变、或两者来获得纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型宿主细胞或其中这些酶基本上是无活性的宿主细胞。编码本发明的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶的基因的修饰或失活可能是由于使亲本细胞经受诱变和选择突变细胞造成的,在突变细胞中与亲本细胞相比,表达这些酶的能力已经降低。诱变可能是特异性的或随机的,可以通过例如使用适合的物理或化学诱变剂进行,通过使用适合的寡核苷酸进行,或通过将所述dna序列经受pcr产生的诱变来进行。此外,诱变可通过使用这些诱变剂的任意组合来进行。适用于本发明目的的物理或化学诱变剂的实例包括γ或紫外线(uv)照射、羟胺、n-甲基-n’-硝基-n-亚硝基胍(mnng)、邻甲基羟胺、亚硝酸、乙基甲磺酸(ems)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并选择表现出基因表达降低的突变细胞。可替代地,可以使用遗传技术如杂交或交配、和原生质体融合或任何其他经典遗传技术来诱导遗传多样性来分离这些菌株。随后可以通过监测酶的表达水平来选择所获得的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型菌株。任选地,随后通过测量宿主细胞中待表达的给定的感兴趣基因的表达水平来选择纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型菌株。具有降低的酶活性的菌株的选择可以通过直接测量培养肉汤、培养上清液、透化细胞或细胞裂解物中的酶活性来进行。重组dna技术可替代地,可以使用重组dna技术构建具有减少量的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的宿主细胞或其中这些酶基本上无活性的宿主细胞。本领域中描述了基因失活或基因破坏的若干种技术,例如一步基因破坏法、标志物插入、定点诱变、缺失、rna干扰、反义rna等,并且都可以用于降低、抑制或干扰纤维素酶、甘露聚糖酶和果胶酶的合成以及任选地干扰淀粉酶活性,以便获得具有降低的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的工业生产菌株。此外,通过改变指导纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶基因的表达的一个或多个控制序列使纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶失活是本发明的一部分。其实例是通过基因破坏降低启动子活性。使用现代遗传修饰技术,人们可以获得重组纤维素酶、甘露聚糖酶和果胶酶,以及任选地淀粉酶缺陷型菌株,优选通过干扰编码纤维素酶、甘露聚糖酶和果胶酶,以及任选地淀粉酶活性的基因,更优选地通过将标记基因插入编码酶活性的基因,最优选地通过从基因组去除部分或全部酶编码区进行。已经针对许多不同的微生物描述了进行这种基因失活的方法,并且是本领域技术人员已知的(即,参见ep357127)。因此可以减少或消除纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶在突变细胞中表达。取决于使用这些技术修饰的宿主菌株,该过程可重复若干次以除去所有或大部分纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶编码序列。宿主基因如纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶的修饰或失活可以通过已建立的反义技术、使用与该基因的核苷酸序列互补的核苷酸序列进行。更具体地,可以通过引入与核苷酸序列互补的核苷酸序列来减少或消除基因的表达,该核苷酸序列可以在细胞中转录并且能够与细胞中产生的mrna杂交。在允许互补的反义核苷酸序列与mrna杂交的条件下,由此降低或消除了所翻译的蛋白质的量。尼安(ngiam)等人(应用与环境微生物学(appl.environ.microbiol.)66:775-782,2000)和茨伦纳(zrenner)等人(普兰塔(planta)190:247-252,1993)提供了表达反义rna的实例。可以通过rna干扰(rnai)技术(欧洲微生物学会联合会微生物学快报(femsmicrob.lett.)237:317-324,2004)获得宿主基因的修饰、下调或失活。更具体地说,丝状真菌细胞基因表达可以通过如下来减少或消除:克隆其表达待受影响的核苷酸序列的同一的正义和反义部分(其后各自具有位于其间的核苷酸间隔物),插入表达载体,并且将表达载体引入细胞中,在该细胞中双链rna(dsrna)可以被转录,并且然后加工成能够杂交至靶mrna的较短的sirna。dsrna转录后,小(21-23)核苷酸sirna片段的形成将导致待受影响的mrna的靶向降解。特异性mrna的消除可以是各种程度的。wo2005/05672和wo2005/026356中描述的rna干扰技术可用于宿主基因的修饰、下调或失活。纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型宿主细胞可能具有另一个核苷酸序列,该宿主细胞已经通过上述任何方法修饰或失活,并且在相同条件下培养时产生比亲本细胞更少的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性,如使用与之前定义的相同测定所测量的。具有降低的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的,通过经典遗传技术或重组dna技术分离的或构建的这些工业生产菌株可以用于需要最终产品包含膳食纤维的相关工业方法。优选地,这些菌株用于生产具有转半乳糖基化活性的工业上相关的酶。更优选地,这些菌株用于生产食品工业中使用的酶,甚至更优选地,这些酶用于奶产品的加工。最优选地,将具有降低的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的这种工业生产菌株用于从乳糖生产gos。优选地,本发明的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型宿主细胞是如在模式反应中所检测的具有少于50%的可检测的细胞内或细胞外纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的菌株(参见实例2、3或4中的实验信息)。更优选地,本发明的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型菌株是具有少于50%的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的菌株。更优选地,本发明的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型菌株是具有如下纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性的菌株,如在模式反应中所检测的,该活性少于其来源的宿主细胞的纤维素酶、甘露聚糖酶和果胶酶及任选地淀粉酶活性的25%,优选地少于10%,更优选地少于5%,更优选地少于1%,并且最优选地该纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶活性在本发明的缺陷型宿主细胞中是不可检测的。多种用于检测多肽的系统是本领域技术人员已知的。检测系统包括用于检测多肽或酶活性的任何可能的测定。举例来说,这些测定系统包括但不限于基于以下测定:比色、光度、荧光、比浊、粘度、免疫学、生物学、色谱和其他可用测定。优选地,如果产生的多肽是酶,则通过在模式反应中测量其活性来确定产生的活性酶的量(参见实例2、3或4)。根据另一个优选的实施例,本发明的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型宿主细胞的特征在于如下事实:当该菌株已经用包括编码具有转半乳糖基化活性的多肽的基因的表达构建体转化时,所述菌株至少产生其来源的野生型菌株在相同培养条件下产生的多肽的量(当野生型菌株也已经用与纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型宿主细胞相同的表达构建体转化时)。优选地,本发明的纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型菌株是在相同培养条件下产生比其来源的野生型菌株相同或更多量的具有转半乳糖基化活性的多肽的菌株。更优选地,纤维素酶、甘露聚糖酶和果胶酶以及任选地淀粉酶缺陷型菌株比在相同培养条件下其来源的野生型菌株产生更多的给定多肽。具有转半乳糖基化活性的多肽的生产根据又另一个实施例,本发明涉及在缺乏纤维素、甘露聚糖酶、果胶酶和/或淀粉酶活性的宿主细胞中转录核苷酸序列的方法,其中该转录序列编码具有转半乳糖基化活性的多肽,该方法包括:(a)在培养基中培养本发明的宿主细胞,该宿主细胞包括(i)启动子,(iv)编码多肽的下游核苷酸序列,(iii)翻译停止信号和(iv)转录终止信号,(b)在宿主细胞中表达多肽,并且(c)任选地,从培养基或从宿主细胞中回收多肽。优选地,根据本发明的方法产生缺陷型菌株。可以使用本领域已知的方法将缺陷型菌株在适于产生所需多肽的营养介质中生长或维持。例如,可以将细胞接种在固体基质上,在烧瓶中摇动,在小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)中在实验室或工业发酵罐中在适合的介质中并且在允许表达和/或分离多肽的条件下培养。使用本领域已知的程序,在包括碳源和氮源和无机盐的合适营养介质中进行培养(参见,例如,班尼特和拉热(lasure)编辑,真菌中更多的基因操作,学术出版社,加利福尼亚州,1991)。适合的介质可从商业供应商获得或可以使用公开的组合物(例如,在美国典型培养物保藏中心的目录中)来制备。如果多肽分泌到该营养介质中,那么可直接从介质中回收多肽。如果多肽不被分泌,那么其可从细胞裂解液中回收。可以通过本领域已知的方法来分离该所得的多肽。例如,可以通过常规程序从营养介质中分离多肽,这些常规程序包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。然后可以通过本领域已知的多种程序进一步纯化分离的多肽,这些程序包括但不限于色谱法(例如,离子交换、亲和力、疏水性、色谱聚焦或尺寸排阻),电泳(例如,制备型等电聚焦),差异溶解度(例如,丙酮或硫酸铵沉淀)或萃取(例如离液剂、盐或ph)。参见,例如詹森(janson)和赖登(ryden)编辑,蛋白质纯化(proteinpurification),vch出版商,纽约,1989。可以使用特异性针对具有转半乳糖基化活性的多肽的本领域已知的方法来检测该多肽。这些检测方法可以包括使用特异性抗体、酶产物的形成、酶底物的消失或sds-page。例如,可以使用酶测定来确定多肽的活性。对于许多酶,用于确定酶活性的程序在本领域中是已知的。用于生产多肽的方法在另一方面,如在此所述的表达多肽的方法包括获得如在此所述的宿主细胞或细胞,并从该细胞或宿主细胞表达具有转半乳糖基化活性的多肽,以及任选地纯化该多肽。可以在本发明中使用这样的多肽。宿主细胞的转化、表达和培养将dna构建体或载体引入宿主细胞中包括如下技术如:转化;电穿孔;核显微注射;转导;转染,例如脂质介导的转染和deae-糊精介导的转染;用磷酸钙dna沉淀孵育;用dna包被的微粒高速轰击;和原生质体融合。通用转化技术是本领域已知的。参见,例如,奥苏贝尔等人(1987),同上,第9章;萨姆布鲁克等人(2001),同上;和坎贝尔(campbell)等人,当代遗传学(curr.genet.)16:53-56(1989)。本领域已知的方法可用于选择转化体。用于固定和配制多肽和多肽组合物的方法多肽组合物可以根据本领域已知的方法制备,并可以是液体或干组合物的形式。例如,该多肽组合物可以呈颗粒或微粒的形式。包括在该组合物中的多肽可以根据本领域中已知的方法稳定化。应用以下给出了本发明的多肽或多肽组合物的优选用途的实例。在一方面,在此披露了通过用在如此所述的多肽或多肽组合物处理包括乳糖的底物来生产食品的方法。在一方面,在此披露了通过用如在此所述的多肽或多肽组合物处理包括乳糖的乳基底物来生产奶产品的方法。在一方面,将包括乳糖的底物进一步用水解的β-半乳糖苷酶处理。酶制剂(如处于根据本发明制备的食物成分的形式)可以是溶液形式或作为固体-这取决于用途和/或应用模式和/或给予模式。固体形式可以是呈干燥酶粉末或呈造粒酶。干酶配制品的实例包括喷雾干燥的产物,混合器造粒产物,层状产物如流化床颗粒,挤出或颗粒状颗粒造粒产物,冻干产物。酶制剂(如处于根据本发明制备的食物成分的形式)可以是溶液形式或作为固体-这取决于用途和/或应用模式和/或给予模式。固体形式可以是呈干燥酶粉末或呈造粒酶。在一方面,提供组合物,优选食物组合物,更优选包括如在此所述的细胞或多肽或多肽组合物的奶产品。此外,基于在组合物中与seqidno:22具有至少70%,例如像72%、74%、74%、78%、80%、82%、84%、86%、88%、90%序列同一性的多肽的总量,在此披露了包括至少5%,例如像,10%、15%、20%、25%、30%、35%、40%、45%、50%w/w的一种或多种多肽的组合物。这可以通过使用本领域技术人员已知的以下技术来评估。使待评估的样品进行sds-page,并使用适合于蛋白质定量的染料例如像伯乐标准(bio-radcriterion)系统进行可视化。然后使用适当的光密度扫描仪(例如像伯乐标准系统)扫描凝胶,并确保所得图像处于动态范围内。对与衍生自seqidno:8的任何变体/片段相对应的条带进行定量,并且如下计算多肽的百分比:所讨论的多肽的百分比=所讨论的多肽/(表现出转半乳糖基化活性的所有多肽的总和)*100。组合物中衍生自seqidno:8的多肽变体/片段的总数可以通过本领域技术人员已知的方法使用多克隆抗体通过蛋白质印迹检测衍生自seqidno:8的片段来确定。在一方面,根据本发明的组合物包括选自下组的一种或多种多肽,该组由seqidno:1、2、3、4和5组成的多肽组成。在另一方面,组合物包括一种或多种选自下组的多肽,该组由seqidno:1、2和3组成的多肽组成。在又另一方面,组合物包括一种或多种选自下组的多肽,该组由seqidno:1和2组成的多肽组成。在一方面,本发明提供了包括根据本发明所述的酶复合物、酶载体和任选地稳定剂和/或防腐剂的酶复合物制剂。在本发明的又另一方面,酶载体选自下组,该组由甘油或水组成。在一个实施例中,酶载体不包括多元醇(例如,甘油、丙二醇或山梨糖醇)。在另一方面,制剂/组合物包括稳定剂。在一方面,该稳定剂选自由以下各项组成的组:无机盐、多元醇、糖及其组合。在一方面,该稳定剂是无机盐如氯化钾。在另一方面,该多元醇是甘油、丙二醇或山梨糖醇。在另一方面,该稳定剂不是多元醇,如甘油、丙二醇或山梨糖醇。在又另一方面,糖是小分子碳水化合物,特别是若干种甜味碳水化合物如葡萄糖、半乳糖、果糖和蔗糖中的任何一种。在又另一方面,制剂包括防腐剂。在一方面,该防腐剂是对羟基苯甲酸甲酯、对羟基苯甲酸丙酯、苯甲酸酯、山梨酸酯或其他食品认可的防腐剂或其混合物。本发明的方法可以用固定化酶实施,例如,固定化的乳糖酶或其他产生半乳寡糖的酶。可以将酶固定在任何有机或无机支持物上。示例性无机支持物包括氧化铝、硅藻土、dowex-1氯化物、玻璃珠和硅胶。示例性有机支持物包括deae-纤维素、藻酸盐水凝胶或藻酸盐珠或等效物。在本发明的各个方面,可以通过物理吸附到无机支持物上来优化乳糖酶的固定化。可以将用于实施本发明的酶固定在不同的介质中,包括水、tris-hcl缓冲液和磷酸盐缓冲溶液。可以将酶固定在任何类型的底物上,例如滤器、纤维、柱、珠、胶体、凝胶、水凝胶、网眼等。在一方面,提供了通过用如在此所述的多肽或多肽组合物处理包括乳糖的乳基底物来生产奶产品的方法。在另一方面,提供了通过将包括乳糖的乳基底物用一种多肽处理用于生产奶产品的方法,该多肽在15min反应后具有高于60%、如高于70%、如高于75%的相对转半乳糖基化活性。在一方面,在30min反应后相对转半乳糖基化活性高于3。在另一方面,在30min反应后相对转半乳糖基化活性高于6。在又另一方面,在30min反应后相对转半乳糖基化活性高于12。在一方面,提供了一种方法,其中在酶的活性的最佳温度下进行如在此所述的多肽或多肽组合物的处理。在另一方面,将多肽或多肽组合物以0.01-1000ppm的浓度添加到乳基底物中。在又另一方面,将多肽或多肽组合物以0.1-100ppm的浓度添加到乳基底物中。在另一方面,将多肽或多肽组合物以1-10ppm的浓度添加到乳基底物中。在一方面,提供了一种进一步包括用微生物发酵底物如奶产品的方法。在另一方面,该奶产品是酸奶。在另一方面,基本上同时进行多肽或多肽组合物和微生物的处理。在一方面,基本上同时将多肽或多肽组合物和微生物添加到乳基底物中。在一方面,提供包括如在此所述的细胞或多肽或多肽组合物的奶产品。在一方面,以0.01-1000ppm的浓度添加如在此定义的多肽或多肽组合物。在一方面,提供包括由如在此定义的多肽或多肽组合物原位形成的gos的奶产品。在一方面,提供了包括如在此定义的细胞的奶产品。如在此所述的奶产品可以是例如脱脂乳、低脂乳、全脂乳、奶油、uht乳、具有延长的保质期的乳、发酵的奶产品、奶酪、酸奶、黄油、乳质涂抹料(dairyspread)、黄油乳、酸化乳饮料、酸奶油、乳清基饮料、冰淇淋、炼乳、牛奶焦糖酱(dulcedeleche)或风味乳饮料。奶产品可以通过本领域已知的任何方法制造。奶产品还可以包括非乳组分,例如,植物组分如植物油,植物蛋白和/或植物碳水化合物。奶产品还可以包括另外的添加剂,如酶、调味剂、微生物培养物如益生菌培养物、盐、甜味剂、糖、酸、水果、果汁或本领域已知的可作为奶产品的组分或添加到奶产品中的任何其他组分。在本发明的一个实施例中,一种或多种乳组分和/或乳馏分占奶产品的至少50%(重量/重量),如至少70%,例如至少80%,优选地至少90%。在本发明的一个实施例中,已经用如在此定义的具有转半乳糖基化活性的酶处理的一种或多种乳基底物占奶产品的至少50%(重量/重量),如至少70%,例如至少80%,优选地至少90%。在本发明的一个实施例中,该奶产品是未通过添加预先生产的半乳寡糖而被浓缩的奶产品。在本发明的一个实施例中,多肽处理的乳基底物在用作奶产品中的成分之前未进行干燥。在本发明的一个实施例中,该奶产品是冰淇淋。在上下文中,冰淇淋可以是任何种类的冰淇淋,如全脂冰淇淋、低脂冰淇淋或基于酸奶或其他发酵的乳产品的冰淇淋。冰淇淋可以通过本领域已知的任何方法制造。在本发明的一个实施例中,该奶产品是乳或炼乳。在本发明的一个实施例中,该奶产品是uht乳。在本发明的上下文中的uht乳是已经进行灭菌程序的乳,其旨在杀死包括细菌孢子在内的所有微生物。uht(超高温)处理可以是例如在130℃下热处理30秒,或者在145℃下热处理1秒。在本发明的一个优选实施例中,该奶产品是esl乳。在上下文中,esl乳是由于微量过滤和/或热处理而具有延长的保质期,并且能够在2℃-5℃的商店架上保持新鲜至少15天,优选至少20天的乳。在本发明的另一个优选实施例中,该奶产品是发酵的奶产品,例如酸奶。用于大多数发酵的乳产品的微生物选自下组,该组由通常称为乳酸菌的细菌组成。如在此所用,术语“乳酸菌”是指革兰氏阳性、微量需氧或厌氧细菌,该细菌发酵糖,并且产生酸,这些酸包括作为主要产生的酸的乳酸、乙酸和丙酸。工业上最有用的乳酸菌可在“乳杆菌(lactobacillales)”目中找到,其中包括乳球菌属物种、链球菌属物种、乳杆菌属物种、明串珠菌属物种、假明串珠菌属物种、片球菌属物种、短杆菌属物种、肠球菌属物种和丙酸菌属物种。此外,乳酸菌组中通常包括属于厌氧细菌的组的产乳酸细菌,双歧杆菌,即双歧杆菌属物种,这些产乳酸细菌常单独或与乳酸菌组合用作食品培养物。乳酸菌通常作为冷冻或冻干培养物供应给奶业,用于进行起子增殖(bulkstarterpropagation)或者所谓的“直投式”(dvs)培养物,旨在直接接种入发酵容器或桶中用于产生发酵奶产品。这种培养物通常称作“起子培养物”或“起子”。常用的乳酸菌的起子培养物菌株通常分成嗜常温生物体(其最适生长温度约30℃),和嗜热生物体(其最适生长温度在约40℃至约45℃的范围内)。属于嗜常温组的典型生物体包括乳酸乳球菌、乳酸乳球菌乳脂亚种(lactococuslactissubsp.cremoris)、肠膜状明串珠菌乳脂亚种(leuconostocmesenteroidessubsp.cremoris)、肠膜状假明串珠菌乳脂亚种(pseudoleuconostocmesenteroidessubsp.cremoris)、戊糖片球菌(pediococcuspentosaceus)、乳酸乳球菌乳酸亚种双乙酰生物突变株(lactococuslactissubsp.lactisbiovar.diacetylactis)、干酪乳杆菌干酪亚种(lactococuscaseisubsp.casei)和副干酪乳杆菌副干酪亚种(lactococusparacaseisubsp.paracasei)。嗜热乳酸细菌物种包括例如嗜热链球菌、屎肠球菌、德氏乳杆菌乳酸亚种、瑞士乳杆菌、德氏乳杆菌保加利亚亚种和嗜酸乳杆菌。此外,属于双歧杆菌属的厌氧细菌,包括两歧双歧杆菌、动物双歧杆菌和长双歧杆菌常用作乳品起子培养物,并且通常包括在乳酸菌组中。此外,丙酸杆菌属物种用作乳品起子培养物,特别是在奶酪的制造中。此外,属于双歧杆菌属的生物体通常用作食物起子培养物。另一组微生物起子培养物是真菌培养物,包括丝状真菌的酵母培养物和培养物,其具体用于制造某些类型的奶酪和饮料。真菌的实例包括娄地青霉、白青霉(penicilliumcandidum)、白地霉、开菲尔圆酵母、开菲尔酵母和酿酒酵母。在本发明的一个实施例中,用于乳基底物发酵的微生物是干酪乳杆菌、或嗜热链球菌和德氏乳酸杆菌保加利亚亚种的混合物。本发明的方法中使用的发酵方法是众所周知的,并且本领域的技术人员知道如何选择合适的工艺条件,如温度、氧、微生物的量和特征、添加剂如碳水化合物、调味剂、矿物质、酶、和处理时间。显然,选择发酵条件以便支持本发明的实现。作为发酵的结果,将降低乳基底物的ph。本发明的发酵奶产品的ph可以是,例如,在3.5-6的范围内,如在3.5-5的范围内,优选在3.8-4.8的范围内。在一方面,提供了使用多肽或多肽组合物或使用上述细胞类型中的任何一种或多种用于产生寡糖的方法。寡糖包括但不限于果寡糖、半乳寡糖、异麦芽寡糖、麦芽寡糖、乳果糖和木寡糖。在本发明的一个实施例中,寡糖通过在包括二糖底物的介质中孵育表达多肽的细胞而产生,该二糖底物例如像乳果糖、海藻糖、鼠李糖、麦芽糖、蔗糖、乳糖或纤维二糖。孵育在生产寡糖的条件下进行。细胞可以是选自下组的产物的一部分,该组由以下各项组成:酸奶、奶酪、发酵的乳产品、膳食补充剂和益生菌食物产品。可替代地,可以回收寡糖并随后在其制备之前或之后将其添加到感兴趣的产品中。在一方面,提供了在此披露的细胞用于生产选自下组的产品的用途,该组由以下各项组成:酸奶、奶酪、发酵的乳产品、膳食补充剂和益生菌食物产品。在一方面,可以将在此所述的多肽或多肽组合物用于制备奶酪产品并且可以在制备奶酪产品的方法中使用。例如,奶酪产品可以选自由以下各项组成的组:奶油奶酪、松软奶酪、和精制奶酪。通过添加多肽或多肽组合物,奶酪可以包含显著增加的半乳寡糖水平和降低的乳糖水平。在一方面,最终奶酪产品中的乳糖水平可以降低至少约25%,优选至少约50%,并且更优选至少约75%。多肽或多肽组合物可以用于将乳酪产品中的乳糖降低至少于约1克/份,这是大多数乳糖不耐个体可以耐受的一个量。在此提供的奶酪产品是具有增加的可溶性纤维含量、降低的热量含量、优异的感官特性、改进的质地和风味的营养增强的奶酪产品。此外,在此所述的多肽可以降低奶酪产品的血糖指数,因为gos比乳糖或其水解产物更慢地吸收。最后,多肽或多肽组合物可以降低奶酪产品,特别是奶油奶酪产品的生产成本,因为gos令人惊奇地为奶油奶酪产品提供了改进的质地,从而允许减少稳定剂的使用,或通过允许增加水分含量而无需脱水。在另一方面,提供了包括如在此所述的多肽或多肽组合物和碳水化合物底物的组合物。在另一方面,该碳水化合物底物是二糖。另一方面,该二糖是例如乳果糖、海藻糖、鼠李糖、麦芽糖、蔗糖、乳糖或纤维二糖。在又另一方面,该碳水化合物底物是乳糖。制备组合物,这样使得产生寡糖。如在此所述的多肽可以是选自下组的产物的一部分,该组由以下各项组成:酸奶、奶酪、发酵的乳产品、膳食补充剂和益生菌食物产品。在一方面,提供了包括如在此所述的多肽和稳定剂的组合物。稳定剂的实例是例如多元醇,例如像甘油或丙二醇、糖或糖醇、乳酸、硼酸或硼酸衍生物(例如芳族硼酸酯)。在一方面,提供了如在此披露的转半乳糖基化多肽或多肽组合物或如在此披露的细胞用于产生半乳寡糖的用途。在一方面,提供了如在此披露的转半乳糖基化多肽或多肽组合物或如在此披露的细胞用于生产半乳寡糖的用途,该半乳寡糖将成为选自下组的产品的一部分,该组由以下各项组成:酸奶、奶酪、发酵的奶产品、膳食补充剂和益生菌食物产品。在一方面,该产品是酸奶、奶酪或发酵的奶产品。在一方面,提供了如在此披露的转半乳糖基化多肽或多肽组合物或如在此披露的细胞用于产生半乳寡糖以增强双歧杆菌生长的用途。在一方面,提供了如在此披露的转半乳糖基化多肽或多肽组合物或如在此披露的细胞用于产生半乳寡糖以增强双歧杆菌在混合培养物发酵中的生长的用途。在一方面,提供了用于生产如在此披露的转半乳糖基化多肽或多肽组合物的方法,该方法包括在允许表达所述多肽的条件下在适合的培养基中培养如在此披露的细胞,并且从培养物回收得到的多肽。提供了一种用于生产半乳寡糖的方法,该方法包括使如在此披露的多肽或多肽组合物或如在此披露的细胞与包括乳糖的乳基溶液接触。添加寡糖可以增强单独的双歧杆菌或在混合培养物中的双歧杆菌的生长。用将乳糖转化为单糖或gos的酶处理乳产品具有若干个优点。首先,产品可以被患有乳糖不耐症的人消耗,否则会出现症状如胃肠气胀和腹泻。其次,与乳糖相比,用乳糖酶处理的奶产品将比类似的未处理产品具有更高的甜度,这是因为葡萄糖和半乳糖的更高的感知甜度。这种效果对于应用如酸奶和冰淇淋尤为有益,其中最终产品的高甜度是所希望的,并且这允许所消耗的产品中的碳水化合物的净减少。第三,在冰淇淋生产中,经常看到称为沙质的现象,其中乳糖分子由于乳糖的相对低的溶解度而结晶。当乳糖转化为单糖或gos时,冰淇淋的口感比未处理产品大大改进。可以消除由于乳糖结晶引起的沙感的存在,并且可以通过用乳清粉替代脱脂乳粉来降低原料成本。酶处理的主要作用是增加甜味。在一方面,如在此披露的转半乳糖基化多肽或多肽组合物可以与其他酶如蛋白酶如凝乳酶或肾素,脂酶如磷脂酶,淀粉酶,转移酶和乳糖酶一起使用。在一方面,如在此披露的一种或多种转半乳糖基化多肽可与乳糖酶一起使用。当用如在此披露的一种或多种转半乳糖基化多肽处理后,特别是在低乳糖水平下希望减少残留的乳糖时,这可以是特别有用的。在一个实施例中,酶是来自细菌的乳糖酶,例如,来自双歧杆菌科,如来自双歧杆菌属如特别是在wo2009/071539和wo2013/182686中描述的乳糖酶。实例1-根据本发明的宿主细胞的构建本实例的宿主细胞衍生自枯草芽孢杆菌。去除amyeα-淀粉酶基因:通过重组dna技术将野生型基因(amye)的体外产生的缺失引入枯草芽孢杆菌菌株中。通过活性以及dna印迹法监测amye缺失。宿主菌株中不存在异源dna。通过壮观霉素标志物替代bglc内切葡聚糖酶基因:为了使bglc基因缺失,使用了采用cre-lox方法的策略。克隆上游和下游bglc序列,并且将中间(待删除)部分替代为允许在转化中进行选择的loxp-壮观霉素盒。用构建体转化枯草芽孢杆菌菌株,选择大观霉素,将基因组bglc基因用克隆的变体替代。将来自包含壮观霉素标志物的菌株的基因组dna整合到内切葡聚糖酶bglc基因座的缺失中,用于通过自然感受态转化菌株。阳性克隆由壮观霉素抗性确定。壮观霉素抗性基因的侧翼是能够除去基因的loxp序列。用四环素标志物替代gmug甘露聚糖酶基因:使用与针对bglc基因相同的技术使甘露聚糖酶gmug缺失,尽管这次使用四环素标志物而不是壮观霉素标志物。在包含四环素的介质上选择转化体,并且用pcr验证阳性克隆。用壮观霉素标志物替代pel果胶酸裂解酶基因:使用与用于bglc基因相同的技术,通过用壮观霉素标志物替代pelorf,使果胶酸裂解酶基因pel缺失。在壮观霉素平板上选择转化体,并通过cpcr筛选。bif917基因的引入:使用本出版物中阐述的方法将在wo2013/182626中披露为“bif917”的β-半乳糖苷酶的编码序列转化到枯草芽孢杆菌中。一般来说,这描述了使用合成基因生产多肽,该合成基因被设计编码两歧双歧杆菌全长(1752个残基)基因,针对在枯草芽孢杆菌中的表达所优化的密码子购自geneart(雷根斯堡,德国)seqidno.8。采用反向引物,使用聚合酶链式反应构建两歧双歧杆菌截短突变体,其允许合成基因的所选择的区域的特异性扩增。正向引物:ggggtaactagtggaagatgcaacaagaag(加下划线的spei)(seqidno:15)。截短突变体和相应的反向引物的seqid如下表2所示。表2使用独特的限制性位点spei和paci将合成基因克隆到pbnspe枯草芽孢杆菌表达载体中,并且将分离的质粒转化到枯草芽孢杆菌菌株中。将转化体作为选择重新划线到包含10μg/ml新霉素的lb平板上。测量β-半乳糖苷酶活性使用市售的底物2-硝基苯基-β-d-吡喃半乳糖苷(onpg)(西格玛(sigma)n1127)测量酶活性。onpgw/o受体100mmkpo4ph6.012,3mmonpg补充有受体的onpg100mmkpo4ph6.020mm纤维二糖12,3mmonpg终止溶液10%na2co3将10μl稀释系列的纯化的酶添加到包含90μlonpg缓冲液的具有或没有受体的微量滴定板的孔中。将样品混合并在37℃下孵育10min,然后向每个孔中添加100μl终止溶液以终止反应。在由softmax软件包控制的分子装置spectramax平板读数器上在420nm下记录吸光度测量值。如下计算转半乳糖基化活性的比率:对于其中吸光度在0.5和1.0之间的稀释液,转半乳糖基化活性比率=(abs420+纤维二糖/abs420-纤维二糖)*100。lau活性的确定原理:该测定方法的原理是乳糖酶在37℃下将2-邻硝基苯基-β-d-吡喃半乳糖苷(onpg)水解成2-邻硝基苯酚(onp)和半乳糖。用碳酸钠停止反应,并在分光光度计或色度计在420nm下测量释放的onp。试剂:mes缓冲液ph6.4(100mmmesph6.4,10mmcacl2):将19,52gmes水合物(mw:195.2g/mol,西格玛-奥德里奇(sigma-aldrich)#m8250-250g)和1.470gcacl2二水合物(mw:147.01g/mol,西格玛-奥德里奇)溶解在1000mlddh2o中,通过10mnaoh将ph调节至6.4。通过0.2μm滤器过滤溶液,并在4℃下储存1个月。onpg底物ph6.4(12.28mmonpg,100mmmesph6.4,10mmcacl2):将0.370g2-邻硝基苯基-β-d-吡喃半乳糖苷(onpg,mw:301.55g/mol,西格玛-奥德里奇#n1127)溶解在100mlmes缓冲液ph6.4中,并在4℃下黑暗保存长达7天。终止试剂(10%na2co3):将20.0gna2co3溶解在200mlddh2o中,通过0.2μm滤器过滤溶液,并在室温下保存1个月。程序:在mes缓冲液(ph6.4)中制备稀释系列的酶样品,并且将10μl每个样品稀释液转移到包含90μlonpg底物(ph6.4)的微量滴定板(96孔格式)的孔中。将样品混合并使用恒温混匀仪(舒适型恒温混匀仪(comfortthermomixer),艾本德(eppendorf))在37℃下孵育5min,并且随后向每个孔中添加100μl终止试剂以终止反应。使用mes缓冲液(ph6.4)代替酶样品构建空白。在elisa读数器(spectramax平板读数器,分子装置公司(moleculardevice))上针对空白测量在420nm处的吸光度的增加。酶活性计算:确定mes缓冲液(ph6.4)中2-邻硝基苯酚(西格玛-奥德里奇#33444-25g)的摩尔消光系数(0.5998x10-6m-1xcm-1)。一个单位(u)的乳糖酶活性(lau)被定义为对应于每分钟1nmol的onpg水解的量。使用总反应体积为200μl(光路径为0.52cm)的微量滴定板,可以使用以下公式计算每ml酶样品的乳糖酶活性:计算在此示为seqidno:1的bif917的比活度:bif917浓度的确定:使用criterionstainfreesds-page系统(伯乐公司(biorad))确定靶酶(bif917)和截短产物的定量。将任何kdstainfree预制凝胶4%-20%tris-hcl,18孔(康贝公司(comb)#345-0418)与塞尔瓦(serva)tris-甘氨酸/sds缓冲液(伯乐公司目录号42529)一起使用。使用以下参数运行凝胶:200v、120ma、25w、50min。使用bsa(1,43mg/ml)(西格玛-奥德里奇,目录号500-0007)作为蛋白质标准品,并且将criterionstainfree成像仪(伯乐公司)与imagelab软件(伯乐公司)一起使用,用于使用与色氨酸含量相关的带强度进行定量。从两种独立发酵(如方法1中所述)的粗制酵素(超滤浓缩物)并且使用5种不同稀释度(参见表1)确定bif917的特异性lau活性。发现bif917比活度为21.3lau/mg或0.0213lau/ppm。表1:bif917比活度的确定实例2测试:1测定:p-甘露聚糖酶活性,还原糖(mu)该测试方法用于以mu(甘露聚糖酶单位)单位确定甘露聚糖酶活性。目的该测定适用于甘露聚糖酶活性的qa/qc监测。原理该测定通过内切-1,4-p-d-甘露聚糖酶对槐豆胶(lbg)底物的作用测量还原糖的释放。将二硝基水杨酸反应用于确定还原糖含量的增加,这与所添加的酶活性成正比。程序1.材料和设备1.1能够达到3500rpm的离心机1.2设置为40℃的水浴1.3设置为60℃的水浴1.4沸水浴1.5外置活塞式移液器(positivedisplacementpipet)和吸头(瑞宁公司(ranininc))1.6涡旋1.716x100mm玻璃试管(带帽)1.8计时器1.9容量瓶、刻度量筒、烧杯1.10磁力搅拌棒和搅拌板/加热板1.11垂熔玻璃滤器漏斗1.12ph计1.13分析天平1.14制备平衡1.15温度计1.16冰水浴1.17分光光度计,能够读取540nm1.18具有一次性吸头的可变移液装置(1ml)1.20玻璃器皿的烤箱或高压釜2.试剂:使用以下试剂或等效物2.1氢氧化铵,浓缩的(28%-30%)2.2tris-羟甲基氨基甲烷(tris)盐酸化物2.3氢氧化钠颗粒2.43,5-二硝基水杨酸,98%,(dns),西格玛-奥德里奇目录号1288482.5槐豆胶,西格玛化学#g07532.6酒石酸钾钠,四水合物,西格玛-奥德里奇目录号2172552.7去离子水2.81-丙醇3.试剂制备3.1氢氧化铵1.5%3.1.1使用去离子水,在容量瓶中将5ml30%氢氧化铵稀释至100ml。3.2tris-盐酸盐缓冲液3.2.1在约1900ml去离子水中溶解15.67gmtris-盐酸盐。用氢氧化铵(1.5%)调节至ph7.5±0.05,并用去离子水稀释至2000ml。该溶液可以在室温下保持至少两周。3.3氢氧化钠10.67%3.3.1添加32.0gm氢氧化钠颗粒至200ml去离子水中。搅拌至溶解并冷却。用去离子水使达到300ml3.4dns试剂(a)在2l烧杯中将20gm的dns悬浮于1000g去离子水中。添加300ml的10.67%氢氧化钠溶液。(b)将悬浮液在加热搅拌板上加热,直至溶液澄清。温度不应超过50℃。(c)逐渐添加600gm酒石酸钾钠四水合物至溶液中,并持续混合。使溶液达到室温。(d)用去离子水将溶液稀释至2000ml,并且如果需要,通过烧结玻璃滤器过程过滤。在室温下存放在深琥珀色瓶中。该溶液持续至少两个月保持良好。3.5槐豆胶(lbg)底物溶液3.5.1确保与底物接触的所有玻璃器皿都非常干净,并且没有可能的甘露聚糖酶污染。推荐在120℃下进行1-丙醇洗涤或烘烤。5.1.1将500mltris-盐酸盐缓冲液放入1000ml烧杯中。将烧杯放在沸水浴或加热搅拌板中,并且使烧杯中的温度达到80℃。快速搅拌溶液,同时非常缓慢地添加1.4gm的槐豆胶。减少混合并在水浴中将溶液保持在60℃持续60分钟。冷却至室温。用去离子水调节至500ml。以3500rpm离心10分钟。使用澄清的上清液作为底物。3.6酶标准品制备3.6.1选择大量的甘露聚糖酶最终产品作为标准品。将其设置为等于批次分析证书上所报告的mu值。使用这种材料,使用以mu/升计的已知浓度的样品制作3点标准曲线。相应地使用tris-盐酸盐缓冲液稀释该标准品,这样使得其净吸光度在减去试剂空白后落入测定的线性范围内。该测定的线性范围为0.17和0.52aa。0.050-0.140mu/升之间的标准曲线和样品浓度通常落入该测定的线性范围内。3.7液体样品制备3.7.1在tris-盐酸盐缓冲液中稀释每个样品(w/v),这样使得部分4中概述的测定反应在540nm下落入17和0.52aa之间。3.7.2将稀释的酶溶液储存在冰上。为最佳结果,应在1小时内测定稀释的酶溶液。4.测定程序4.1酶样品-应将酶样品一式两份进行检测4.1.1将2mllbg底物在40℃下在16×100玻璃试管中平衡20分钟。4.1.2添加0.5ml酶样品稀释液,混合并且精确孵育10分钟。4.1.3通过添加3.0ml的dns溶液并混合来终止反应。4.1.4在沸水浴中将样品煮沸15分钟,用帽覆盖每个试管的顶部以防止蒸发。在冰水浴中冷却50分钟。使样品平衡至室温持续10分钟。5.1.1针对去离子水空白,读取540nm处的吸光度。在减去空白试剂后,吸光度应在0.17和0.52aa之间。4.2空白试剂4.2.1可以单独运行空白。该反应对照用于lbg底物中存在的或酶样品中存在的还原糖。5.1.1将2mllbg底物在40℃下在16×100玻璃试管中平衡20分钟。5.1.2孵育另外10分钟。5.1.3添加3.0mldns溶液并混合。添加0.5ml酶稀释液并再次混合。5.1.4在沸水浴中煮沸15分钟,用帽覆盖试管的顶部以防止蒸发。在冰水浴中冷却5分钟。使样品平衡至室温持续10分钟。5.1.5针对去离子水空白,读取540nm处的吸光度。5.计算5.1为了确定净吸光度,从所有标准品和样品的吸光度读数中减去平均试剂/酶空白。5.2使用线性回归制备标准曲线,其中净吸光度在y轴上,并且浓度(mu/升)在x轴上。5.3相关系数必须是>0.998。5.4从线性回归确定每个样品的浓度。5.5对于液体:mu甘露聚糖酶/kg样品=来自曲线的值(mu/升)*样品稀释因子(总体积(升)/样品重量(kg))实例3测试2:内切葡聚糖酶活性,羧甲基纤维素(cmc)活性目的该测定方法用于以cmc单位计确定纤维素酶的内切葡聚糖酶活性。注意:以iu/g或iu/ml(国际单位)所报告的纤维素酶分别相当于cmc/g或cmc/ml。原理该测定通过纤维素酶对cmc底物的作用来测量还原糖的释放。如通过与3,5-二硝基水杨酸(dns)的反应所测量的,还原糖释放速率与酶活性成正比。一个cmc单位定义为在测定条件下每分钟产生1^摩尔葡萄糖还原糖当量所需的酶量。相对于酶标准品,以指定的cmc单位测量此程序中的活性。程序1.0材料和设备1.1818x150mm试管1.19石珠1.20比色皿1.21外置活塞式移液器和吸头,瑞宁公司1.22ph计1.23设置为50℃的水浴1.24冰浴1.25沸水浴1.26分光光度计1.27磁力搅拌器1.28秒表1.29coarseglassvwrkt93700-471.30深琥珀色瓶1.31外置活塞式移液器1.32涡旋振荡器1.33试管架2.0试剂:使用以下试剂或等效物。2.9羧甲基纤维素钠盐fluka21900取代度必须为0.70-0.852.103,5-二硝基水杨酸,钠盐(dns),默克(merck)108462.11酒石酸钾钠,四水合物,默克80872.12氢氧化钠,试剂级别2.13冰乙酸,试剂级别3.0试剂制备3.10.05m乙酸钠缓冲液,ph4.83.1.1向900ml蒸馏水中添加2.85ml冰乙酸。在用磁力搅拌棒搅拌的同时,用50%氢氧化钠调节ph至4.8。用蒸馏水使总体积为一升。3.410.67%(w/v)氢氧化钠溶液3.2.1将32.0g氢氧化钠颗粒添加到200ml蒸馏水中。搅拌至溶解并冷却。用蒸馏水使达到300ml。3.51%cmc底物溶液3.3.1向99ml乙酸钠缓冲液中添加1.00gcmc。搅拌来彻底混合,并且保持在4℃下持续至少1小时,然后再使用。将该溶液在4℃下稳定3天3.61%3,-5二硝基水杨酸(dns)(e)将20.0gdns悬浮于1000ml蒸馏水中,并在混合的同时逐渐添加300ml的10.67%氢氧化钠溶液。(f)在设置为50℃(122°f)的水浴中加热该悬浮液直到该溶液澄清。水浴温度应当不超过50℃。3.4.3逐渐向溶液中添加600g酒石酸钾钠四水合物,并连续混合。3.4.4用蒸馏水将溶液稀释至2000ml,并通过粗玻璃滤器过滤。在室温下存放在深琥珀色瓶中。该溶液稳定2个月。溶液必须澄清才能使用。4.1颗粒样品制备3.7.2将颗粒样品溶解在乙酸盐缓冲液中,这样使得从部分4.5中概述的测定反应产生的净吸光度落入0.4和0.5之间。约0.2cmc/ml的制剂通常会产生所需的吸光度。3.7.3在制备样品时,称重至少100mg颗粒。相应地按4.1.1用乙酸盐缓冲液通过磁力搅拌溶解。针对5.1中的计算以mg/ml记录颗粒浓度。以中等速度混合持续至少20分钟。将稀释的样品储存在冰上。稳定至少2小时。3.7.4注意一些样品在混合时间后会形成细浆。应取代表性的浆液样品进行4.5中的测定。4.1.4一式三份执行每个颗粒样品制备。4.2液体样品制备4.1.3将每个样品稀释在乙酸盐缓冲液中,这样使得从部分4.5中概述的测定反应产生的净吸光度落入0.4和0.5之间。约0.2cmc/ml的制剂通常会产生所需的吸光度。4.1.4当制备样品时,使用外置活塞式移液器等分出至少0.10ml的液体样品。将稀释的样品储存在冰上。稳定至少2小时。4.1.5一式三份执行每个液体样品制备。4.3工作标准品准备4.44.3.1选择大量的纤维素酶最终产品(液体或颗粒)作为标准品。将其设置为等于批次分析证书上所报告的cmc值。使用此材料,按4.1或4.2制备已知cmc/ml的工作标准品。使用乙酸盐缓冲液稀释标准品,这样使得来自部分4.5中概述的测定反应的净吸光度产率落入0.4和0.5之间。制备约0.2cmc/ml的标准品溶液通常会产生所需的吸光度。4.3.2以cmc/ml记录工作标准品的活性。将其在计算部分5.1和5.2中使用。4.3.3一式三份准备标准品。4.4空白溶液4.4.1在部分4.5中使用乙酸盐缓冲液作为空白酶溶液。一式两份运行每个空白酶溶液。4.5酶测定反应4.5.1在50℃下,在18x150mm玻璃试管中孵育1.00ml的cmc底物10-15分钟,这些玻璃试管竖立在试管架中。4.5.2以20秒的间隔,使用外置活塞式移液器将1.00ml的酶稀释液和空白添加到cmc底物中。在50℃(122°f)下,将每个反应混合并孵育10分钟。4.5.3以与4.5.2中相同的时间间隔,添加3.0mldns溶液并且进行混合。4.5.4通过将试管和支架置于沸水浴中,将所有反应混合物+dns精确煮沸5分钟。用石珠盖住试管的顶部,以防止沸腾期间蒸发。所有样品,标准品和空白应一起煮沸。煮沸后,在冰浴中将管冷却。4.5.5针对作为零吸光度的蒸馏水,测量酶样品和空白样品在540nm处的吸光度。4.5.6从平均样品和标准品吸光度中减去平均空白吸光度。此净吸光度应在0.4-0.5之间。如果不是,则应重复该测定。4.5.7在测定中一式三份运行每个酶样品。5.0计算5.1如下计算颗粒样品中的活性:cmc/g(或iu/g)=(样品的净吸光度)(cmc/ml的工作标准品)(1000mg/g)(工作标准品的净吸光度)(mg颗粒/ml乙酸盐缓冲液)5.2如下计算液体样品中的活性:cmc/ml(或iu/ml)=(样品的净吸光度)(cmc/ml的工作标准品)(样品稀释液)(工作标准品的净吸光度)注意:以iu/g或iu/ml(国际单位)所报告的纤维素酶分别相当于cmc/g或cmc/ml。实例4测试3使用基于viscoman的粘度法。该方法目前可用于检测非常低水平的甘露聚糖酶、淀粉酶、cmc酶和果胶酶活性。(有用的粘度方法也在us2013/0045498中公开,其通过引用结合在此)。水状胶体被酶切割,从而导致水状胶体溶液的粘度降低。粘度的降低表示为从添加酶的水状胶体样品的粘度相对于添加h2o的水状胶体样品的粘度所计算出的相对粘度值。因此,该值始终将在1和0之间,其中1意指样品的粘度没有降低。底物为guar、淀粉、cmc或果胶。根据底物使用两种缓冲液;mcllvaine的柠檬酸磷酸盐:a)0.1m柠檬酸;21.0gc6h8o7,h2o/1l去离子水b)0.2m磷酸氢二钠;35.6gna2hpo4,2h2o/1l去离子水。保质期:3个月缓冲液(ph4.0)=71.50mla+28.50mlb(在带刻度的量筒中)缓冲液(ph6.7)=25.00mla+75.00mlb底物浓度底物溶液的制备:将用于特定底物的缓冲液用水稀释五次,并在带有磁铁的电热板上在bluecap瓶中加热。称重水状胶体,并且当缓冲液冒泡时,粉末在剧烈搅拌下撒入直至稀释(约30分钟)。对于淀粉,建议在添加底物时关掉加热,并且取下瓶盖,并且避免底物沸溢-以防止形成块状物等。将水状胶体溶液冷却至40℃,淀粉溶液除外。必须将淀粉储存在50℃下直到使用,以便防止老化。样品处理将包括空白的每个样品的5ml底物转移到wheaton玻璃杯。将100μl酶样品或样品的稀释液(用水制成的)添加到5ml底物溶液中并混合。最多可添加500μl的样品,只要将相同的体积应用于空白样品。将样品在40℃下孵育20h,并且然后通过将样品放在冰上终止反应。然后使用brookfield将样品回火至10℃进行粘度测量。实例5酶副活性筛选对样品1和商业godoynl2乳糖酶进行筛选,用于进行比较。样品1是包括由枯草芽孢杆菌宿主细胞产生的具有转半乳糖基化活性的酶的多肽组合物,其中纤维素、甘露聚糖酶和果胶酶未失活。测定和结果列于表2中。观察到,与godoynl2乳糖酶相比,样品1具有显著更高水平的甘露聚糖酶和cmc酶活性。表2甘露聚糖酶和纤维素酶水平的半定量通过稀释样品直到几乎不能再观察到粘度变化来评估样品1中存在的纤维素酶和甘露聚糖酶的水平。测试浸解酶以确定当在发酵期间在大豆介质中使用时,它是否对存在于最终产品中的甘露聚糖酶和纤维素酶的水平有影响。浸解酶是一种已知的纤维素酶,并且因此它只测试甘露聚糖酶活性,因为纤维素酶活性将被预期。稀释度(参见表3)表明在浸解酶中高水平的甘露聚糖酶活性和样品中高水平的甘露聚糖酶和纤维素酶活性。存在于浸解酶中的甘露聚糖酶活性水平不能仅仅解释存在的甘露聚糖酶水平,因为在浸解酶的f10.000稀释液中相对粘度接近1,而样品1必须稀释超过f100.000以便相对粘度接近1。添加100μl所指示浸解酶原料或样品1的稀释液的guar或cmc溶液的相对粘度。浸解酶原料是浸渍样品的54倍稀释液,该浸渍样品对应于在发酵期间向大豆介质中添加酶时所制备的稀释液。表3在敲除果胶酶、甘露聚糖酶和纤维素酶的新宿主菌株中的副活性筛选决定从枯草芽孢杆菌宿主菌株(样品2)中敲除果胶酶、纤维素酶和甘露聚糖酶,并且然后重新测试副活性的存在。收到使用新菌株的第一次3k发酵样品,用于分析。将来自3k样品的结果与使用样品1的结果进行比较,显然使用样品2,果胶酶、纤维素酶和甘露聚糖酶的副活性水平降低(参见表4)。表4使用gilsonviscoman的粘度测定规范为了确定酸奶应用中的甘露聚糖酶和纤维素酶活性的阈值水平,使用了基于粘度降低来定量甘露聚糖酶和纤维素酶活性的测定。对于该测定,使用来自biolaba/s的viscoman自动移液器来确定每个样品中的粘度。为了确定使用viscoman的样品中的变化,在根据测试3制备的0.5%guar底物上测量粘度。在6种不同的底物制剂上进行三次样品测量。6次运行中最大变化为约4%。为了安全起见,将样品中的变化限设定为5%。为了使空白样品的变化不与添加酶的样品的变化重叠,我们需要观察粘度的变化处于大于10%。这意味着为了说样品包含甘露聚糖酶活性,相对粘度应该小于0.9。因此,将标准曲线的相对粘度的上限设定为0.85。表5使用标准品(699mu/kg)测试适用于甘露聚糖酶粘度测定的酶稀释范围。还测试了包含甘露聚糖酶活性的样品,样品1。通过最小二乘法发现当相对粘度相对于ln(mu/kg)进行绘制时,数据呈现直线(参见图2)。从在guar底物中具有标准酶稀释液的6次运行得出结论,r2≥0.98的直线呈现在0.25-0.85的范围内(数据未显示)。为了限制测试量,对于使用的所有底物,相对粘度值的规定设定为≥0.25且≤0.85。图2中的曲线图显示样品1(标准品)的稀释液相对于ln(mu/kg)绘制的相对粘度,其中基于viscoman使用速度2确定粘度。它还显示了相对于ln(mu/kg)所绘制的,以速度1所确定的样品1的1-4mu/kg样品的相对粘度,和以速度2所确定的样品1的5-80mu/kg样品的相对粘度。另外,还显而易见的是,仅当基于viscoman使用相同速度获得数据时才能获得线性函数(参见图1)。基于viscoman使用相同速度获得数据。针对该测定,低粘度样品使最相关的,并且因此所有样品应使用速度2测量,这意味着粘度低于400mpa.s。因此,定义了当以速度2用viscoman测量时,底物空白样品应具有在60-130mpa.s内的粘度。甘露聚糖酶定量测定:为了建立基于相对粘度的甘露聚糖酶定量测定,我们使用来自甘露聚糖酶比色测定的建立的对照和标准品450mu/kg。确定样品1、样品2和浸解酶的甘露聚糖酶活性。外推该线,发现粉末的检测限为约0.003mu/kg(在10ml中最大1g),并且液体的检测限为0.0003mu/kg。每个样品如测试3中所述进行处理,但使用viscoman确定粘度。使用四点标准曲线计算每个样品的甘露聚糖酶活性。下表涉及图3。计算表明,样品2中的甘露聚糖酶活性主要来源于浸解酶(3mu/kg除以54,相当于在大豆介质中添加浸解酶时的稀释度)。因此可以确认甘露聚糖酶基因已被有效地从宿主菌株中敲除。纤维素酶定量测定基于相对粘度,使用对照2222cmcu/g和标准品2306cmcu/g来建立的纤维素酶定量测定。将标准品的相对粘度值相对于ln(cmcu/g)进行绘制,并在相对粘度为0,242-0,885(参见图4)内,被证实是线性的。外推该线,发现该测定的液体检测限为约0.002cmcu/g,并且粉末检测限为0.02cmcu/g。将来自发酵的具有或没有浸解酶的两个额外样品与现有样品一起进行纤维素酶活性测试。结果显示,从宿主菌株敲除纤维素酶是有效的(34cmcu/g对比约4cmcu/g),尽管由于在发酵期间在大豆介质中浸解酶的添加,仍存在一定活性(参见表6和图4)。表6样品idcmcu/g对照2414样品134,38样品24,1标准品:用浸解酶发酵,806lau/g3,4标准品:用浸解酶发酵,971lau/g<0,002在酸奶应用中的纤维素酶阈值水平为了建立酸奶应用的纤维素酶阈值水平,采用用于粘度测定的纤维素酶对照处理饮用酸奶。将一份饮用酸奶(milram,开菲尔饮品(kefirdrink),草莓(erdbeere);bb14-02-14)等分5ml在wheaton玻璃杯中,每份样品一式两份。将原料稀释液(0,081ml,在1000ml中)进一步以10倍因子稀释为四个新样品。将每个样品的100μl以及空白样品的100μlddh2o添加到每个5ml酸奶中。然后将样品储存在4℃下或40℃下。在各个时间点,使用viscoman以速度2测量粘度。将相对粘度相对于在a)40℃或b)4℃下稀释样品的孵育时间(a)小时b)天)进行绘制。对于每次稀释,注意cmcu/ml酸奶。这些结果呈现为相对于在40℃(图5a)或4℃(图5b)下孵育的时间所绘制的相对粘度。曲线显示随时间的推移类似的发展,表明40℃孵育可用作加速测定,代替耗时的4℃孵育测定。为了计算阈值水平,定义了纤维素酶活性的可接受水平在储存期间内会降低粘度小于10%。基于图5b中所示的数据,计算每个数据点的比活度(相对粘度降低/cmcu/每ml酸奶/h),假设观察到的最高比活度将代表初始速率。发现最高的比活度为9.6相对粘度降低/cmcu/每ml乳酸/h,意味着在一ml酸奶中每小时粘度将降低960%每cmcu。然后可以计算各储存时期允许10%粘度降低的cmcu/ml阈值水平(参见表7)。阈值水平=0,1/(比活度*储存时间)对于1个月的储存,如下计算阈值水平:0.1/(9.6*720)=1,45x10-5表7纤维素酶对照960%粘度降低/h/cmcu/ml将计算与图5b中的数据进行比较,发现它们与在4℃下孵育1个月的所有稀释液所获得数据相关。3.6x10-6cmcu/ml或更低的水平在一个月内没有降低粘度超过10%,而超过3.6x10-6cmcu/ml则使粘度降低了10%以上。结论果胶酶、纤维素酶和甘露聚糖酶基因已被有效地从宿主菌株中敲除。上述说明书中提及的所有出版物通过引用结合在此。本发明的所描述的方法和系统的各种修改和变化对于本领域的技术人员将是显而易知的,而不背离本发明的范围和精神。虽然已结合特定优选实施例描述了本发明,但应当理解,要求保护的本发明不应不适当地限于这类特定实施例。事实上,对于化学、生物化学、生物学、或相关领域的技术人员而言显而易见的、用于执行本发明的所述模式的各种修改预期在以下权利要求的范围内。序列表>seqidno:1(bif_917)vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstekt>seqidno:2(bif_995)vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstektvrsfyysrnyyvktgnkpilpsdvevrysdgtsdrqnvtwdavsddqiakagsfsvagtvagqkisvrvtmideigal>seqidno:3(bif_1068)vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstektvrsfyysrnyyvktgnkpilpsdvevrysdgtsdrqnvtwdavsddqiakagsfsvagtvagqkisvrvtmideigallnysastpvgtpavlpgsrpavlpdgtvtsanfavhwtkpadtvyntagtvkvpgtatvfgkefkvtatirvq>seqidno:4(bif_1172)vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstektvrsfyysrnyyvktgnkpilpsdvevrysdgtsdrqnvtwdavsddqiakagsfsvagtvagqkisvrvtmideigallnysastpvgtpavlpgsrpavlpdgtvtsanfavhwtkpadtvyntagtvkvpgtatvfgkefkvtatirvqrsqvtigssvsgnalrltqnipadkqsdtldaikdgsttvdantggganpsawtnwayskaghntaeitfeyateqqlgqivmyffrdsnavrfpdagktkiqi>seqidno:5(bif_1241)vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstektvrsfyysrnyyvktgnkpilpsdvevrysdgtsdrqnvtwdavsddqiakagsfsvagtvagqkisvrvtmideigallnysastpvgtpavlpgsrpavlpdgtvtsanfavhwtkpadtvyntagtvkvpgtatvfgkefkvtatirvqrsqvtigssvsgnalrltqnipadkqsdtldaikdgsttvdantggganpsawtnwayskaghntaeitfeyateqqlgqivmyffrdsnavrfpdagktkiqisadgknwtdlaatetiaaqessdrvkpytydfapvgatfvkvtvtnadtttpsgvvcaglteielktat>seqidno:6(bif_1326)vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstektvrsfyysrnyyvktgnkpilpsdvevrysdgtsdrqnvtwdavsddqiakagsfsvagtvagqkisvrvtmideigallnysastpvgtpavlpgsrpavlpdgtvtsanfavhwtkpadtvyntagtvkvpgtatvfgkefkvtatirvqrsqvtigssvsgnalrltqnipadkqsdtldaikdgsttvdantggganpsawtnwayskaghntaeitfeyateqqlgqivmyffrdsnavrfpdagktkiqisadgknwtdlaatetiaaqessdrvkpytydfapvgatfvkvtvtnadtttpsgvvcaglteielktatskfvtntsaalssltvngtkvsdsvlaagsyntpaiiadvkaegegnasvtvlpahdnvirvitesedhvtrktftinlgteqef>seqidno:7两歧双歧杆菌糖苷水解酶催化核心qnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmty>seqidno:8编码全长的核苷酸序列gcagttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaacagtccgcagcttttattacagccgcaactattatgtcaaaacaggcaacaaaccgattctgccgtcagatgttgaagttcgctattcagatggaacaagcgatagacaaaacgttacatgggatgcagtttcagatgatcaaattgcaaaagcaggctcattttcagttgcaggcacagttgcaggccaaaaaattagcgttcgcgtcacaatgattgatgaaattggcgcactgctgaattattcagcaagcacaccggttggcacaccggcagttcttccgggatcaagaccggcagtcctgccggatggcacagtcacatcagcaaattttgcagtccattggacaaaaccggcagatacagtctataatacagcaggcacagtcaaagtaccgggaacagcaacagtttttggcaaagaatttaaagtcacagcgacaattagagttcaaagaagccaagttacaattggctcatcagtttcaggaaatgcactgagactgacacaaaatattccggcagataaacaatcagatacactggatgcgattaaagatggctcaacaacagttgatgcaaatacaggcggaggcgcaaatccgtcagcatggacaaattgggcatattcaaaagcaggccataacacagcggaaattacatttgaatatgcgacagaacaacaactgggccagatcgtcatgtatttttttcgcgatagcaatgcagttagatttccggatgctggcaaaacaaaaattcagatcagcgcagatggcaaaaattggacagatctggcagcaacagaaacaattgcagcgcaagaatcaagcgatagagtcaaaccgtatacatatgattttgcaccggttggcgcaacatttgttaaagtgacagtcacaaacgcagatacaacaacaccgtcaggcgttgtttgcgcaggcctgacagaaattgaactgaaaacagcgacaagcaaatttgtcacaaatacatcagcagcactgtcatcacttacagtcaatggcacaaaagtttcagattcagttctggcagcaggctcatataacacaccggcaattatcgcagatgttaaagcggaaggcgaaggcaatgcaagcgttacagtccttccggcacatgataatgttattcgcgtcattacagaaagcgaagatcatgtcacacgcaaaacatttacaatcaacctgggcacagaacaagaatttccggctgattcagatgaaagagattatccggcagcagatatgacagtcacagttggctcagaacaaacatcaggcacagcaacagaaggaccgaaaaaatttgcagtcgatggcaacacatcaacatattggcatagcaattggacaccgacaacagttaatgatctgtggatcgcgtttgaactgcaaaaaccgacaaaactggatgcactgagatatcttccgcgtccggcaggctcaaaaaatggcagcgtcacagaatataaagttcaggtgtcagatgatggaacaaactggacagatgcaggctcaggcacatggacaacggattatggctggaaactggcggaatttaatcaaccggtcacaacaaaacatgttagactgaaagcggttcatacatatgcagatagcggcaacgataaatttatgagcgcaagcgaaattagactgagaaaagcggtcgatacaacggatatttcaggcgcaacagttacagttccggcaaaactgacagttgatagagttgatgcagatcatccggcaacatttgcaacaaaagatgtcacagttacactgggagatgcaacactgagatatggcgttgattatctgctggattatgcaggcaatacagcagttggcaaagcaacagtgacagttagaggcattgataaatattcaggcacagtcgcgaaaacatttacaattgaactgaaaaatgcaccggcaccggaaccgacactgacatcagttagcgtcaaaacaaaaccgagcaaactgacatatgttgtcggagatgcatttgatccggcaggcctggttctgcaacatgatagacaagcagatagacctccgcaaccgctggttggcgaacaagcggatgaacgcggactgacatgcggcacaagatgcgatagagttgaacaactgcgcaaacatgaaaatagagaagcgcatagaacaggcctggatcatctggaatttgttggcgcagcagatggcgcagttggagaacaagcaacatttaaagtccatgtccatgcagatcagggagatggcagacatgatgatgcagatgaacgcgatattgatccgcatgttccggtcgatcatgcagttggcgaactggcaagagcagcatgccatcatgttattggcctgagagtcgatacacatagacttaaagcaagcggctttcaaattccggctgatgatatggcagaaatcgatcgcattacaggctttcatcgttttgaacgccatgtc>seqidno:9编码bif_917的核苷酸序列gttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaaca>seqidno:10编码bif_995的核苷酸序列gttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaacagtccgcagcttttattacagccgcaactattatgtcaaaacaggcaacaaaccgattctgccgtcagatgttgaagttcgctattcagatggaacaagcgatagacaaaacgttacatgggatgcagtttcagatgatcaaattgcaaaagcaggctcattttcagttgcaggcacagttgcaggccaaaaaattagcgttcgcgtcacaatgattgatgaaattggcgcactg>seqidno:11编码bif_1068的核苷酸序列gttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaacagtccgcagcttttattacagccgcaactattatgtcaaaacaggcaacaaaccgattctgccgtcagatgttgaagttcgctattcagatggaacaagcgatagacaaaacgttacatgggatgcagtttcagatgatcaaattgcaaaagcaggctcattttcagttgcaggcacagttgcaggccaaaaaattagcgttcgcgtcacaatgattgatgaaattggcgcactgctgaattattcagcaagcacaccggttggcacaccggcagttcttccgggatcaagaccggcagtcctgccggatggcacagtcacatcagcaaattttgcagtccattggacaaaaccggcagatacagtctataatacagcaggcacagtcaaagtaccgggaacagcaacagtttttggcaaagaatttaaagtcacagcgacaattagagttcaa>seqidno:12编码bif_1172的核苷酸序列gttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaacagtccgcagcttttattacagccgcaactattatgtcaaaacaggcaacaaaccgattctgccgtcagatgttgaagttcgctattcagatggaacaagcgatagacaaaacgttacatgggatgcagtttcagatgatcaaattgcaaaagcaggctcattttcagttgcaggcacagttgcaggccaaaaaattagcgttcgcgtcacaatgattgatgaaattggcgcactgctgaattattcagcaagcacaccggttggcacaccggcagttcttccgggatcaagaccggcagtcctgccggatggcacagtcacatcagcaaattttgcagtccattggacaaaaccggcagatacagtctataatacagcaggcacagtcaaagtaccgggaacagcaacagtttttggcaaagaatttaaagtcacagcgacaattagagttcaaagaagccaagttacaattggctcatcagtttcaggaaatgcactgagactgacacaaaatattccggcagataaacaatcagatacactggatgcgattaaagatggctcaacaacagttgatgcaaatacaggcggaggcgcaaatccgtcagcatggacaaattgggcatattcaaaagcaggccataacacagcggaaattacatttgaatatgcgacagaacaacaactgggccagatcgtcatgtatttttttcgcgatagcaatgcagttagatttccggatgctggcaaaacaaaaattcagatc>seqidno:13编码bif_1241的核苷酸序列gttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaacagtccgcagcttttattacagccgcaactattatgtcaaaacaggcaacaaaccgattctgccgtcagatgttgaagttcgctattcagatggaacaagcgatagacaaaacgttacatgggatgcagtttcagatgatcaaattgcaaaagcaggctcattttcagttgcaggcacagttgcaggccaaaaaattagcgttcgcgtcacaatgattgatgaaattggcgcactgctgaattattcagcaagcacaccggttggcacaccggcagttcttccgggatcaagaccggcagtcctgccggatggcacagtcacatcagcaaattttgcagtccattggacaaaaccggcagatacagtctataatacagcaggcacagtcaaagtaccgggaacagcaacagtttttggcaaagaatttaaagtcacagcgacaattagagttcaaagaagccaagttacaattggctcatcagtttcaggaaatgcactgagactgacacaaaatattccggcagataaacaatcagatacactggatgcgattaaagatggctcaacaacagttgatgcaaatacaggcggaggcgcaaatccgtcagcatggacaaattgggcatattcaaaagcaggccataacacagcggaaattacatttgaatatgcgacagaacaacaactgggccagatcgtcatgtatttttttcgcgatagcaatgcagttagatttccggatgctggcaaaacaaaaattcagatcagcgcagatggcaaaaattggacagatctggcagcaacagaaacaattgcagcgcaagaatcaagcgatagagtcaaaccgtatacatatgattttgcaccggttggcgcaacatttgttaaagtgacagtcacaaacgcagatacaacaacaccgtcaggcgttgtttgcgcaggcctgacagaaattgaactgaaaacagcgaca>seqidno:14编码bif_1326的核苷酸序列gttgaagatgcaacaagaagcgatagcacaacacaaatgtcatcaacaccggaagttgtttattcatcagcggtcgatagcaaacaaaatcgcacaagcgattttgatgcgaactggaaatttatgctgtcagatagcgttcaagcacaagatccggcatttgatgattcagcatggcaacaagttgatctgccgcatgattatagcatcacacagaaatatagccaaagcaatgaagcagaatcagcatatcttccgggaggcacaggctggtatagaaaaagctttacaattgatagagatctggcaggcaaacgcattgcgattaattttgatggcgtctatatgaatgcaacagtctggtttaatggcgttaaactgggcacacatccgtatggctattcaccgttttcatttgatctgacaggcaatgcaaaatttggcggagaaaacacaattgtcgtcaaagttgaaaatagactgccgtcatcaagatggtattcaggcagcggcatttatagagatgttacactgacagttacagatggcgttcatgttggcaataatggcgtcgcaattaaaacaccgtcactggcaacacaaaatggcggagatgtcacaatgaacctgacaacaaaagtcgcgaatgatacagaagcagcagcgaacattacactgaaacagacagtttttccgaaaggcggaaaaacggatgcagcaattggcacagttacaacagcatcaaaatcaattgcagcaggcgcatcagcagatgttacaagcacaattacagcagcaagcccgaaactgtggtcaattaaaaacccgaacctgtatacagttagaacagaagttctgaacggaggcaaagttctggatacatatgatacagaatatggctttcgctggacaggctttgatgcaacatcaggcttttcactgaatggcgaaaaagtcaaactgaaaggcgttagcatgcatcatgatcaaggctcacttggcgcagttgcaaatagacgcgcaattgaaagacaagtcgaaatcctgcaaaaaatgggcgtcaatagcattcgcacaacacataatccggcagcaaaagcactgattgatgtctgcaatgaaaaaggcgttctggttgtcgaagaagtctttgatatgtggaaccgcagcaaaaatggcaacacggaagattatggcaaatggtttggccaagcaattgcaggcgataatgcagttctgggaggcgataaagatgaaacatgggcgaaatttgatcttacatcaacaattaaccgcgatagaaatgcaccgtcagttattatgtggtcactgggcaatgaaatgatggaaggcatttcaggctcagtttcaggctttccggcaacatcagcaaaactggttgcatggacaaaagcagcagattcaacaagaccgatgacatatggcgataacaaaattaaagcgaactggaacgaatcaaatacaatgggcgataatctgacagcaaatggcggagttgttggcacaaattattcagatggcgcaaactatgataaaattcgtacaacacatccgtcatgggcaatttatggctcagaaacagcatcagcgattaatagccgtggcatttataatagaacaacaggcggagcacaatcatcagataaacagctgacaagctatgataattcagcagttggctggggagcagttgcatcatcagcatggtatgatgttgttcagagagattttgtcgcaggcacatatgtttggacaggatttgattatctgggcgaaccgacaccgtggaatggcacaggctcaggcgcagttggctcatggccgtcaccgaaaaatagctattttggcatcgttgatacagcaggctttccgaaagatacatattatttttatcagagccagtggaatgatgatgttcatacactgcatattcttccggcatggaatgaaaatgttgttgcaaaaggctcaggcaataatgttccggttgtcgtttatacagatgcagcgaaagtgaaactgtattttacaccgaaaggctcaacagaaaaaagactgatcggcgaaaaatcatttacaaaaaaaacaacagcggcaggctatacatatcaagtctatgaaggcagcgataaagattcaacagcgcataaaaacatgtatctgacatggaatgttccgtgggcagaaggcacaatttcagcggaagcgtatgatgaaaataatcgcctgattccggaaggcagcacagaaggcaacgcatcagttacaacaacaggcaaagcagcaaaactgaaagcagatgcggatcgcaaaacaattacagcggatggcaaagatctgtcatatattgaagtcgatgtcacagatgcaaatggccatattgttccggatgcagcaaatagagtcacatttgatgttaaaggcgcaggcaaactggttggcgttgataatggctcatcaccggatcatgattcatatcaagcggataaccgcaaagcattttcaggcaaagtcctggcaattgttcagtcaacaaaagaagcaggcgaaattacagttacagcaaaagcagatggcctgcaatcaagcacagttaaaattgcaacaacagcagttccgggaacaagcacagaaaaaacagtccgcagcttttattacagccgcaactattatgtcaaaacaggcaacaaaccgattctgccgtcagatgttgaagttcgctattcagatggaacaagcgatagacaaaacgttacatgggatgcagtttcagatgatcaaattgcaaaagcaggctcattttcagttgcaggcacagttgcaggccaaaaaattagcgttcgcgtcacaatgattgatgaaattggcgcactgctgaattattcagcaagcacaccggttggcacaccggcagttcttccgggatcaagaccggcagtcctgccggatggcacagtcacatcagcaaattttgcagtccattggacaaaaccggcagatacagtctataatacagcaggcacagtcaaagtaccgggaacagcaacagtttttggcaaagaatttaaagtcacagcgacaattagagttcaaagaagccaagttacaattggctcatcagtttcaggaaatgcactgagactgacacaaaatattccggcagataaacaatcagatacactggatgcgattaaagatggctcaacaacagttgatgcaaatacaggcggaggcgcaaatccgtcagcatggacaaattgggcatattcaaaagcaggccataacacagcggaaattacatttgaatatgcgacagaacaacaactgggccagatcgtcatgtatttttttcgcgatagcaatgcagttagatttccggatgctggcaaaacaaaaattcagatcagcgcagatggcaaaaattggacagatctggcagcaacagaaacaattgcagcgcaagaatcaagcgatagagtcaaaccgtatacatatgattttgcaccggttggcgcaacatttgttaaagtgacagtcacaaacgcagatacaacaacaccgtcaggcgttgtttgcgcaggcctgacagaaattgaactgaaaacagcgacaagcaaatttgtcacaaatacatcagcagcactgtcatcacttacagtcaatggcacaaaagtttcagattcagttctggcagcaggctcatataacacaccggcaattatcgcagatgttaaagcggaaggcgaaggcaatgcaagcgttacagtccttccggcacatgataatgttattcgcgtcattacagaaagcgaagatcatgtcacacgcaaaacatttacaatcaacctgggcacagaacaagaattt>seqidno:15用于生成bif变体的正向引物ggggtaactagtggaagatgcaacaagaag>seqidno:16bif917的反向引物gcgcttaattaattatgttttttctgtgcttgttc>seqidno:17bif995的反向引物gcgcttaattaattacagtgcgccaatttcatcaatca>seqidno:18bif1068的反向引物gcgcttaattaattattgaactctaattgtcgctg>seqidno:19bif1241的反向引物gcgcttaattaattatgtcgctgttttcagttcaat>seqidno:20bif1326的反向引物gcgcttaattaattaaaattcttgttctgtgccca>seqidno:21bif1478的反向引物gcgcttaattaattatctcagtctaatttcgcttgcgc>seqidno:22两歧双歧杆菌bif1750vedatrsdsttqmsstpevvyssavdskqnrtsdfdanwkfmlsdsvqaqdpafddsawqqvdlphdysitqkysqsneaesaylpggtgwyrksftidrdlagkriainfdgvymnatvwfngvklgthpygyspfsfdltgnakfggentivvkvenrlpssrwysgsgiyrdvtltvtdgvhvgnngvaiktpslatqnggdvtmnlttkvandteaaanitlkqtvfpkggktdaaigtvttasksiaagasadvtstitaaspklwsiknpnlytvrtevlnggkvldtydteygfrwtgfdatsgfslngekvklkgvsmhhdqgslgavanrraierqveilqkmgvnsirtthnpaakalidvcnekgvlvveevfdmwnrskngntedygkwfgqaiagdnavlggdkdetwakfdltstinrdrnapsvimwslgnemmegisgsvsgfpatsaklvawtkaadstrpmtygdnkikanwnesntmgdnltanggvvgtnysdganydkirtthpswaiygsetasainsrgiynrttggaqssdkqltsydnsavgwgavassawydvvqrdfvagtyvwtgfdylgeptpwngtgsgavgswpspknsyfgivdtagfpkdtyyfyqsqwnddvhtlhilpawnenvvakgsgnnvpvvvytdaakvklyftpkgstekrligeksftkkttaagytyqvyegsdkdstahknmyltwnvpwaegtisaeaydennrlipegstegnasvtttgkaaklkadadrktitadgkdlsyievdvtdanghivpdaanrvtfdvkgagklvgvdngsspdhdsyqadnrkafsgkvlaivqstkeageitvtakadglqsstvkiattavpgtstektvrsfyysrnyyvktgnkpilpsdvevrysdgtsdrqnvtwdavsddqiakagsfsvagtvagqkisvrvtmideigallnysastpvgtpavlpgsrpavlpdgtvtsanfavhwtkpadtvyntagtvkvpgtatvfgkefkvtatirvqrsqvtigssvsgnalrltqnipadkqsdtldaikdgsttvdantggganpsawtnwayskaghntaeitfeyateqqlgqivmyffrdsnavrfpdagktkiqisadgknwtdlaatetiaaqessdrvkpytydfapvgatfvkvtvtnadtttpsgvvcaglteielktatskfvtntsaalssltvngtkvsdsvlaagsyntpaiiadvkaegegnasvtvlpahdnvirvitesedhvtrktftinlgteqefpadsderdypaadmtvtvgseqtsgtategpkkfavdgntstywhsnwtpttvndlwiafelqkptkldalrylprpagskngsvteykvqvsddgtnwtdagsgtwttdygwklaefnqpvttkhvrlkavhtyadsgndkfmsaseirlrkavdttdisgatvtvpakltvdrvdadhpatfatkdvtvtlgdatlrygvdylldyagntavgkatvtvrgidkysgtvaktftielknapapeptltsvsvktkpskltyvvgdafdpaglvlqhdrqadrppqplvgeqadergltcgtrcdrveqlrkhenreahrtgldhlefvgaadgavgeqatfkvhvhadqgdgrhddaderdidphvpvdhavgelaraachhviglrvdthrlkasgfqipaddmaeidritgfhrferhvg>seqidno:23来自两歧双歧杆菌dsm20215的胞外乳糖酶的信号序列vrskklwisllfalaliftmafgstssaqa当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1