被增溶酶及其用途的制作方法

文档序号:11526318阅读:1191来源:国知局
被增溶酶及其用途的制造方法与工艺

相关申请

本申请要求2014年9月26日提交的美国临时申请号62/055,702的权益;所述美国临时申请的整个内容据此以引用的方式并入。

序列表

本申请含有已以电子方式以ascii格式提交,并且据此以引用的方式整体并入的序列表。所述ascii拷贝于2015年9月1日创建,命名为x2002-7003wo_sl.txt,并且大小是76,946个字节。

发明领域

本发明大体上涉及包含从包涵体增溶并具有生物质降解活性的具有生物质降解活性的多肽的混合物,以及用于产生本文所述的混合物的方法。本发明也提供用于使用此类混合物例如来加工生物质材料的方法。

发明背景

诸如纤维素酶、木聚糖酶和木质素酶的生物质降解酶对于诸如原料的生物质的降解是重要的。纤维素和木质纤维素材料在许多应用中被大量生产、加工和使用。此类材料常常被使用一次,接着作为废弃物丢弃,或仅被视为是废弃材料,例如污水、甘蔗渣、锯屑和秸杆。

发明概述

重组蛋白在诸如大肠杆菌(e.coli)的宿主细胞中高水平表达可导致重组蛋白在宿主细胞内积聚成不溶性聚集物。这些不溶性聚集物被称为包涵体,并且也可含有其它组分,诸如宿主细胞内源性蛋白质、核糖体组分、核酸和细胞碎片。从包涵体增溶重组蛋白可通过用高浓度的破坏氢键和疏水性相互作用的增溶剂诸如尿素处理来实现。然而,用诸如尿素的增溶剂处理可导致蛋白质变性和酶活性丧失。因此,重组蛋白聚集成包涵体可降低可从宿主细胞分离的具有酶活性的重组蛋白的产率。

本发明至少部分地基于以下惊人发现:已通过诸如尿素的增溶剂来从包涵体增溶的异源性表达的纤维二糖酶保留纤维二糖酶活性。因此,本文所述的用于增溶异源性表达的纤维二糖酶或其它生物质降解酶的方法适用于使具有生物质降解活性的异源性表达的酶的产率增加例如30-40%。此外,由于添加被增溶生物质降解酶例如纤维二糖酶而存在例如尿素的增溶剂并不会不利地影响用于使生物质转化成糖产物的糖化反应和/或产物的产率。

因此,在一个方面,本公开的特征在于一种包含具有生物质降解活性的一种多肽或多种多肽和例如尿素的增溶剂的混合物,其中相较于天然多肽,所述多肽或多种所述多肽具有至少8-10%生物质降解活性。

在一个实施方案中,混合物进一步包含一种或多种与包涵体相关的蛋白质。或者,在一个实施方案中,混合物不包含一种或多种与包涵体相关的蛋白质。在一个实施方案中,混合物进一步包含细胞碎片、一种或多种核糖体组分、一种或多种宿主蛋白质例如由宿主细胞内源性表达的蛋白质、和/或宿主核酸例如dna和/或rna。

在一个实施方案中,生物质降解活性是纤维二糖酶活性、木质素酶活性、内切葡聚糖酶活性、纤维二糖水解酶活性或木聚糖酶活性。

在一个实施方案中,多肽是部分未折叠的,部分错误折叠的,或部分变性的。

在另一方面,本公开的特征在于一种包含具有与seqidno:1具有至少90%同一性的氨基酸序列的一种多肽或多种多肽和例如尿素的增溶剂的混合物,其中所述多肽或多种所述多肽具有至少20%的天然多肽例如seqidno:1或来自里氏木霉(t.reesei)的cel3a的活性。举例来说,混合物进一步包含一种或多种与包涵体相关的蛋白质。或者,混合物不包含一种或多种与包涵体相关的蛋白质。混合物可进一步包含以下中的一种或多种:细胞碎片、一种或多种核糖体组分、一种或多种宿主蛋白质例如由宿主细胞内源性表达的蛋白质、和/或宿主核酸例如dna和/或rna。与seqidno:1具有至少90%同一性的多肽可为部分未折叠的,部分错误折叠的,或部分变性的。

在一个实施方案中,多肽包含与seqidno:1具有至少90%同一性的氨基酸序列。在一个实施方案中,多肽包括来自里氏木霉的cel3a酶或其功能性变体或片段。在一个实施方案中,cel3a酶包含氨基酸序列seqidno:1(例如由所述氨基酸序列seqidno:1组成)。在一个实施方案中,多肽由包含与seqidno:2或seqidno:3的至少90%同一性(例如由seqidno:2或seqidno:3组成)的核酸序列编码。

在一个实施方案中,多肽是无糖基化的。

在一个实施方案中,例如尿素的增溶剂以0.2m-6m之间的浓度存在于混合物中。

在一个实施方案中,混合物进一步包含至少一种具有生物质降解活性的额外多肽或产生一种或多种具有生物质降解活性的酶的微生物。在一个实施方案中,额外多肽选自木质素酶、内切葡聚糖酶、纤维二糖水解酶、纤维二糖酶和木聚糖酶或其任何组合。在一个实施方案中,额外多肽选自:

a.包含与seqidno:1具有至少90%同一性的氨基酸序列(例如由所述氨基酸序列组成)的多肽;

b.来自里氏木霉的cel3a酶或其功能性变体或片段;或

c.由包含seqidno:2或seqidno:3(例如由seqidno:2或seqidno:3组成)的核酸序列编码的多肽。

在一个实施方案中,额外多肽是无糖基化的。

在一个实施方案中,额外多肽是糖基化的。

在一个方面,本公开的特征在于一种用于产生本文所述的包含具有生物质降解活性的多肽、一种或多种与包涵体相关的蛋白质、和例如尿素的增溶剂的混合物的方法,其中所述方法包括使表达具有生物质降解活性的所述多肽的细胞或其溶解产物与适于增溶所述多肽的浓度的例如尿素的增溶剂接触。在一个实施方案中,方法进一步包括溶解细胞以获得溶解产物,使所述溶解产物的可溶性部分与不溶性部分分离,以及将所述不溶性部分再混悬于例如尿素的增溶剂中。在一个实施方案中,例如尿素的增溶剂的浓度介于0.2m-6m之间,例如是6m。

在一个实施方案中,生物质降解活性是纤维二糖酶活性、木质素酶活性、内切葡聚糖酶活性、纤维二糖水解酶或木聚糖酶活性。

在一个实施方案中,多肽包含与seqidno:1具有至少90%同一性的氨基酸序列。在一个实施方案中,多肽包括来自里氏木霉的cel3a或其功能性变体或片段。

在一个实施方案中,多肽是无糖基化的。

在一个方面,本公开的特征在于一种用于产生具有生物质降解活性的多肽的方法,其包括在细胞中表达所述多肽,以及使所述细胞或其溶解产物与适于增溶所述多肽的浓度的例如尿素的增溶剂接触。

在另一方面,本公开的特征在于一种用于产生具有生物质降解活性的多肽的方法,其包括提供已被遗传修饰来产生至少一种具有生物质降解活性的多肽的细胞,其中至少一部分具有生物质降解活性的所述多肽见于包涵体中,以及使含有所述包涵体的所述细胞或其溶解产物与适于增溶所述多肽的浓度的例如尿素的增溶剂接触。

在一个实施方案中,本文公开的方法进一步包括溶解细胞以获得溶解产物,使所述溶解产物的可溶性部分与不溶性部分分离,以及将所述不溶性部分再混悬于例如尿素的增溶剂中。在一个实施方案中,例如尿素的增溶剂的浓度介于0.2m-6m之间,例如是6m。

在一个实施方案中,生物质降解活性是纤维二糖酶活性、木质素酶活性、内切葡聚糖酶活性、纤维二糖水解酶活性或木聚糖酶活性。

在一个实施方案中,无糖基化多肽包含与seqidno:1具有至少90%同一性的氨基酸序列(例如由所述氨基酸序列组成)。在一个实施方案中,无糖基化多肽包括来自里氏木霉的cel3a或其功能性变体或片段。

在一个实施方案中,细胞是原核或细菌细胞,例如大肠杆菌细胞、origami大肠杆菌细胞。

在一个实施方案中,多肽是无糖基化的。

在一个方面,本公开的特征在于一种从生物质产生产物(例如氢气、糖、醇等)(或使生物质转化成产物)的方法,其包括使生物质与本文所述的包含具有生物质降解活性的多肽、一种或多种与包涵体相关的蛋白质、和例如尿素的增溶剂的混合物,以及任选地,与产生一种或多种生物质降解酶的微生物和/或包含生物质降解酶的酶混合物在适于产生所述产物的条件下接触。

在一个实施方案中,方法进一步包括在使生物质与本文所述的包含具有生物质降解活性的多肽、一种或多种与包涵体相关的蛋白质、和例如尿素的增溶剂的混合物接触之前,用电子束处理生物质的步骤。

在一个实施方案中,产物是糖产物。在一个实施方案中,糖产物是葡萄糖和/或木糖。

在一个实施方案中,方法进一步包括分离产物的步骤。在一个实施方案中,分离产物的步骤包括沉淀、结晶、色谱法、离心和/或提取。

在一个实施方案中,酶混合物包含选自以下的酶中的至少两种:b2af03、cip1、cip2、cel1a、cel3a、cel5a、cel6a、cel7a、cel7b、cel12a、cel45a、cel74a、paman5a、paman26a、膨胀蛋白(swollenin)。

在一个实施方案中,生物质包括淀粉材料、甘蔗、农业废弃物、纸、纸产品、纸废弃物、纸浆、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸(polycoatedpaper)、卡片坯料、卡纸板、纸板、棉花、木材、创花板、林业废弃物、锯屑、白杨木、木片、草、柳枝稷、芒草、绳草、草芦(reedcanarygrass)、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳、农业废弃物、青贮饲料、菜籽秆(canolastraw)、小麦秆、大麦秆、燕麦秆、稻草、黄麻、大麻、亚麻、竹子、剑麻、蕉麻(abaca)、玉米穗轴、玉米秸杆、大豆秸杆、玉米纤维、苜蓿、干草、椰子毛、糖加工残渣、甘蔗渣、甜菜浆、龙舌兰渣(agavebagasse)、海藻、海草、粪肥、污水、垃圾(offal)、农业或工业废弃物、秘鲁胡萝卜(arracacha)、荞麦、香蕉、大麦、木薯、野葛(kudzu)、圆齿酢酱草(oca)、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆或其任何组合。

在一个实施方案中,生物质包括淀粉材料或包括纤维素组分的淀粉材料。在一些实施方案中,生物质包括以下中的一种或多种:农业产品或废弃物、纸产品或废弃物、林业产品或一般性废弃物或其任何组合;其中:a)农业产品或废弃物包括甘蔗、黄麻、大麻、亚麻、竹子、剑麻、苜蓿、干草、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆、草、柳枝稷、芒草、绳草、草芦、谷物残渣、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、玉米穗轴、玉米秸杆、玉米纤维、椰子毛、甜菜浆、甘蔗渣、大豆秸杆、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳或细麸(beeswing)或其组合;b)纸产品或废弃物包括纸、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板或纸浆或其组合;c)林业产品包括白杨木、创花板、木片或锯屑或其组合;并且d)一般性废弃物包括粪肥、污水或垃圾或其组合。

在一个实施方案中,方法进一步包括在引入微生物或酶混合物之前处理生物质以降低生物质的不顺应性的步骤,例如通过用电子进行轰击、声波处理、氧化、热解、蒸汽爆炸、化学处理、机械处理和/或冷冻研磨来处理生物质。

在一个实施方案中,产生生物质降解酶的微生物来自选自以下属的种:芽孢杆菌属(bacillus)、鬼伞属(coprinus)、毁丝霉属(myceliophthora)、头孢霉属(cephalosporium)、柱顶孢霉属(scytalidium)、青霉属(penicillium)、曲霉属(aspergillus)、假单胞菌属(pseudomonas)、腐质霉属(humicola)、镰刀菌属(fusarium)、梭孢壳属(thielavia)、枝顶孢属(acremonium)、金孢子菌属(chrysosporium)或木霉属(trichoderma)。在一个实施方案中,产生生物质降解酶的微生物选自曲霉属、特异腐质霉(humicolainsolens)(嗜热柱顶孢霉(scytalidiumthermophilum))、灰盖鬼伞(coprinuscinereus)、尖孢镰刀菌(fusariumoxysporum)、嗜热毁丝霉(myceliophthorathermophila)、大型亚灰树花菌(meripilusgiganteus)、太瑞斯梭孢壳霉(thielaviaterrestris)、桃色枝顶孢(acremoniumpersicinum)、acremoniumacremonium、acremoniumbrachypenium、acremoniumdichromosporum、acremoniumobclavatum、acremoniumpinkertoniae、灰粉枝顶孢(acremoniumroseogriseum)、acremoniumincoloratum、棕色枝顶孢(acremoniumfuratum)、chrysosporiumlucknowense、绿色木霉(trichodermaviride)、里氏木霉(trichodermareesei)或康宁木霉(trichodermakoningii)。

在一个实施方案中,已通过将微生物与诱导生物质样品在相较于未诱导微生物,适于使生物质降解酶的产生增加的条件下组合来诱导微生物产生生物质降解酶。在一个实施方案中,诱导生物质样品包括淀粉材料、甘蔗、纸、纸产品、纸废弃物、纸浆、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板、棉花、木材、创花板、林业废弃物、锯屑、白杨木、木片、草、柳枝稷、芒草、绳草、草芦、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳、农业废弃物、青贮饲料、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、黄麻、大麻、亚麻、竹子、剑麻、蕉麻、玉米穗轴、玉米秸杆、大豆秸杆、玉米纤维、苜蓿、干草、椰子毛、糖加工残渣、甘蔗渣、甜菜浆、龙舌兰渣、海藻、海草、粪肥、污水、垃圾、农业或工业废弃物、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆或其任何组合。

在一个实施方案中,诱导生物质包括淀粉材料或包括纤维素组分的淀粉材料。在一些实施方案中,诱导生物质包括以下中的一种或多种:农业产品或废弃物、纸产品或废弃物、林业产品或一般性废弃物或其任何组合;其中:a)农业产品或废弃物包括甘蔗、黄麻、大麻、亚麻、竹子、剑麻、苜蓿、干草、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆、草、柳枝稷、芒草、绳草、草芦、谷物残渣、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、玉米穗轴、玉米秸杆、玉米纤维、椰子毛、甜菜浆、甘蔗渣、大豆秸杆、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳或细麸或其组合;b)纸产品或废弃物包括纸、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板或纸浆或其组合;c)林业产品包括白杨木、创花板、木片或锯屑或其组合;并且d)一般性废弃物包括粪肥、污水或垃圾或其组合。

在一个实施方案中,相对于本领域中使用的当前方法,本发明提供优势。这些优势包括提供对将通常被丢弃的不溶性酶的获取,从而增加保留酶活性的所需蛋白质的产率,酶被纯化以达成较清洁的下游加工,以及生物体选择(例如,增加可已由于倾向于产生包涵体而先前从使用排除的生物体的可用性)。

附图简述

图1是显示对被增溶cel3a的imac纯化的结果的色谱图。纯化的被增溶cel3a峰用箭号指示。

图2是sds-page胶凝的照片,其显示imac纯化的不同部分中的蛋白质。泳道1显示分子量标准物。泳道2显示来自可溶性部分的纯化cel3a。泳道3显示由对不溶性部分进行的imac纯化获得的流过物。泳道4显示来自不溶性部分的纯化的被增溶cel3a。

图3是比较纯化的可溶性cel3a和来自不溶性部分的纯化的被增溶cel3a的纤维二糖酶活性的图。

图4是比较纯化的可溶性cel3a、不溶性部分的洗涤部分、和从不溶性部分增溶的未经纯化的cel3a的纤维二糖酶活性的图。

详细描述

定义

除非另外定义,否则本文所用的所有技术和科学术语都具有与由本发明所属领域中的普通技术人员通常理解相同的含义。

术语″一个/一种(a/an)″是指冠词的一个或超过一个(即至少一个)语法对象。举例来说,″一种要素″意指一种要素或超过一种要素。

如本文所用的术语″无糖基化″是指例如多肽的分子在一个或多个当所述分子在它的天然环境中产生时连接有聚糖的位点处未被糖基化(即它包含不连接于糖基化基团的羟基或其它官能团)。在一些实施方案中,无糖基化分子不具有任何连接的聚糖。在一个实施方案中,已使分子改变或突变以致分子不能被糖基化,例如使一个或多个糖基化位点突变以致聚糖不能连接于糖基化位点。在另一实施方案中,可例如通过酶促过程,例如通过与移除聚糖或具有去糖基化活性的酶一起孵育来从分子移除连接的聚糖。在另一实施方案中,可例如通过使用糖基化抑制剂(其抑制糖基化酶)来抑制分子的糖基化。在另一实施方案中,例如多肽的分子可由不进行糖基化的宿主细胞(例如大肠杆菌)产生。举例来说,当蛋白质中的一个或多个在里氏木霉中产生cel3a酶时通常具有连接于它的聚糖基团的位点不具有连接在那个位点处的聚糖时,所述cel3a酶是无糖基化的。

如本文所用的术语″生物质″是指任何非化石化有机物质。各种类型的生物质包括植物生物质(例如木质纤维素和纤维素生物质)、微生物生物质、动物生物质(任何动物副产物、动物废弃物等)和城市废弃物生物质(诸如金属和玻璃的可再循环物被移除的住宅和轻型商业废物)。植物生物质是指任何植物源性有机物质(木质或非木质)。植物生物质可包括但不限于农业或粮食作物(例如甘蔗、糖用甜菜或玉米粒)或由其获得的提取物(例如来自甘蔗的糖和来自玉米的玉米淀粉)、农业作物废弃物和残渣,诸如玉米秸杆、小麦秆、稻草、甘蔗渣等。植物生物质进一步包括但不限于树木、木质能源作物、木材废弃物和残渣诸如软木林疏伐物、含有树皮的废弃物、锯屑、造纸和纸浆行业废弃物物流、木材纤维等。另外,诸如柳枝稷等的草类作物具有作为另一植物生物质来源加以大规模产生的潜力。对于市区,最具潜力的植物生物质原料包括庭院废弃物(例如草修剪物、叶子、树木修剪物和灌丛)和蔬菜加工废弃物。

如本文所用的术语″生物质降解酶″是指将本文所述的生物质物质的组分分解成中间体或最终产物的酶。举例来说,生物质降解酶包括至少木质素酶、内切葡聚糖酶、纤维二糖酶、木聚糖酶和纤维二糖水解酶。生物质降解酶由广泛多种微生物产生,并且可从诸如里氏木霉的微生物分离。

如本文所用的术语″生物质降解活性″是指将本文所述的生物质物质的组分分解成中间体或最终产物的酶活性。生物质降解活性包括至少木质素酶活性、内切葡聚糖酶活性、纤维二糖酶活性、纤维二糖水解酶活性和木聚糖酶活性。举例来说,具有生物质降解活性的多肽是纤维二糖酶,诸如来自里氏木霉的cel3a。

如本文所用的术语″纤维二糖酶″是指催化葡萄糖的二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体或寡聚体;或葡萄糖和木糖的寡聚体水解成葡萄糖和/或木糖的酶。举例来说,纤维二糖酶是β-葡萄糖苷酶,其催化纤维二糖中的β-1,4键以释放两个葡萄糖分子。

如本文所用的术语″纤维二糖酶活性″是指一个种类的纤维素酶催化纤维二糖水解成葡萄糖,例如催化β-d-葡萄糖残基水解以释放β-d-葡萄糖的活性。可根据本文例如在实施例4中所述的测定来测定纤维二糖酶活性。一个单位的纤维二糖酶活性可定义为[葡萄糖]g/l/[cel3a]g/l/30分钟。

如本文所用的术语″纤维二糖水解酶″是指水解纤维素中的糖苷键的酶。举例来说,纤维二糖水解酶是1,4-β-d-葡聚糖纤维二糖水解酶,其催化纤维素、纤维寡糖或任何含有β-1,4连接的葡萄糖的聚合物中的1,4-β-d-葡萄糖苷键的水解,从而从聚合物链释放寡糖。

如本文所用的术语″纤维二糖水解酶活性″是指催化纤维素中的糖苷键的水解,具体来说纤维素、纤维寡糖或任何含有β-1,4连接的葡萄糖的聚合物中的1,4-β-d-葡萄糖苷键的水解,以从糖链的末端,例如从链的还原性或非还原性末端释放纤维二糖的酶的活性。可根据本文所述的测定来测定纤维二糖水解酶活性。一个单位的纤维二糖水解酶活性可例如定义为每分钟从底物(例如阿维塞尔(avicel))释放1μm葡萄糖当量的酶的量。

如本文所用的术语″内切葡聚糖酶″是指催化内部β-1,4糖苷键的水解的酶。举例来说,内切葡聚糖酶是内切-1,4-(1,3;1,4)-β-d-葡聚糖4-葡聚糖水解酶,其催化纤维素、纤维素衍生物(诸如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenan)中的1,4-β-d-糖苷键;混合β-1,3葡聚糖(诸如谷类β-d-葡聚糖或木葡聚糖)和其它含有纤维素组分的植物材料中的β-1,4键的内水解。

如本文所用的术语″内切葡聚糖酶活性″是指催化纤维素、纤维素衍生物(诸如羧甲基纤维素和羟乙基纤维素)、地衣淀粉的内部糖苷键例如内部β-1,4糖苷键;混合β-1,3葡聚糖(诸如谷类β-d-葡聚糖或木葡聚糖)和其它含有纤维素组分的植物材料中的β-1,4键的内水解的酶的活性。可根据本文所述的测定来测定内切葡聚糖酶活性。一个单位的内切葡聚糖酶活性可例如定义为每分钟从底物使还原性末端的浓度增加1μm的酶的量。

如本文所用的术语″酶混合物″是指至少两种不同酶或某一酶的两种不同变体(例如某一酶的糖基化形式和无糖基化形式)的组合。本文提及的酶混合物包括至少本文所述的具有纤维二糖酶活性的无糖基化多肽。在一个实施方案中,酶混合物包括纤维二糖酶、内切葡聚糖酶、纤维二糖水解酶、木质素酶和/或木聚糖酶中的一种或多种。在一些实施方案中,酶混合物包括表达和例如分泌一种或多种酶的细胞,例如微生物。举例来说,酶混合物可包括本文所述的无糖基化多肽和表达和例如分泌一种或多种额外酶和/或所述多肽的变体的细胞,例如微生物。

如本文所用的术语″包涵体″是指由例如宿主细胞的微生物产生的不溶性聚集物,其含有以下中的一种或多种:异源性表达的多肽例如具有生物质降解活性的多肽、细胞碎片、一种或多种核糖体组分、一种或多种由所述宿主细胞内源性表达的蛋白质、一种或多种核酸(rna和/或dna)或其任何组合。包涵体通常在高水平表达重组蛋白期间存在于宿主细胞例如细菌细胞中。见于包涵体中的异源性表达的多肽可为部分未折叠的,部分错误折叠的,或部分变性的。

如本文所用的术语″木质素酶″是指诸如通过氧化反应来催化通常见于植物的细胞壁中的木质素的分解的酶。木质素酶包括木质素修饰酶、木质素过氧化酶和漆酶。

如本文所用的术语″木质素酶活性″是指通过氧化反应来催化木质素和木质素样聚合物的分解的酶的活性。可根据本文所述的测定来测定木质素酶活性。

术语″核酸″或″多核苷酸″可互换使用,并且是指呈单链或双链形式的脱氧核糖核酸(dna)或核糖核酸(rna)及其聚合物。除非明确限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,其与参照核酸具有类似结合性质,并且以与天然存在的核苷酸类似的方式进行代谢。除非另外指示,否则特定核酸序列也隐含地涵盖其保守修饰的变体(例如简并密码子取代)、等位基因、直系同源物、snp和互补序列以及明确指示的序列。具体来说,简并密码子取代可通过产生其中一个或多个所选(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(batzer等,nucleicacidres.19:5081(1991);ohtsuka等,j.biol.chem.260:2605-2608(1985);以及rossolini等,mol.cell.probes8:91-98(1994))。

如本文所用的术语″可操作地连接″是指以下构型:其中控制或调控序列相对于编码多肽的核酸序列被放置在使得所述控制序列影响多肽(由dna序列编码)的表达的位置处。在一个实施方案中,控制或调控序列在编码具有纤维二糖酶活性的多肽的核酸序列的上游。在一个实施方案中,控制或调控序列在编码具有纤维二糖酶活性的多肽的核酸序列的下游。

术语″肽″、″多肽″和″蛋白质″可互换使用,并且是指包含由肽键共价连接的氨基酸残基组成的化合物。蛋白质或肽必须含有至少两个氨基酸,并且关于可构成蛋白质的序列或肽的序列的氨基酸的最大数目不设限制。多肽包括包含两个或更多个由肽键彼此接合的氨基酸的任何肽或蛋白质。″多肽″包括例如生物活性片段、大致上同源性多肽、寡肽、同二聚体、异二聚体、多肽的变体、修饰的多肽、衍生物、类似物、融合蛋白以及其它多肽。多肽包括天然肽、重组肽或其组合。″多种多肽″是指两种或更多种多肽,例如2、3、4、5、6、7、8、9、10、20、50、100、200或500种或更多种多肽。

如本文所用的术语″启动子″是指由细胞的合成机构或引入的合成机构识别,为启始多核苷酸序列的特异性转录所需的dna序列。

如在本文中可互换使用的术语″调控序列″或″控制序列″是指为表达核酸产物所需的核酸序列。在一些情况下,这个序列可为启动子序列,并且在其它情况下,这个序列也可包括增强子序列和为表达基因产物所需的其它调控元件。调控/控制序列可例如是以调控方式(例如可诱导方式)来表达核酸产物的序列。

术语″组成型″启动子是指当与编码多肽的多核苷酸可操作地连接时,在细胞的大多数或所有生理条件下导致在所述细胞中产生所述多肽的核苷酸序列。在一个实施方案中,多肽是具有纤维二糖酶活性的多肽。

术语″诱导型″启动子是指当与编码多肽的多核苷酸可操作地连接时,仅当对应于启动子的诱导剂存在于细胞中时导致在所述细胞中大量产生所述多肽的核苷酸序列。在一个实施方案中,多肽是具有纤维二糖酶活性的多肽。

术语″阻遏型″启动子是指当与编码多肽的多核苷酸可操作地连接时,仅直至对应于启动子的阻遏子存在于细胞中时导致在所述细胞中大量产生所述多肽的核苷酸序列。在一个实施方案中,多肽是具有纤维二糖酶活性的多肽。

术语″增溶剂″是指具有破坏非共价键例如氢键、疏水性相互作用、范德华(vanderwaals)相互作用、偶极-偶极相互作用、离子相互作用、π堆积作用或其任何组合的能力的试剂。破坏非共价键导致先前不溶性物质增溶或溶解至溶液中。具体来说,本文所用的增溶剂使已聚集成包涵体的本文所述的具有生物质降解活性的多肽溶解至溶液例如基于水的溶液或缓冲液中的能力增加。本文描述适合的增溶剂的实例。

如本文所用的术语″木聚糖酶″是指水解含有木聚糖的材料的酶。木聚糖是包含木糖单元的多糖。木聚糖酶可为内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡萄糖醛酸苷酶、乙酰木聚糖酯酶、阿魏酸酯酶(feruloylesterase)或α-葡萄糖醛酸基酯酶。

如本文所用的术语″木聚糖酶活性″是指催化木聚糖和木聚糖样聚合物中的1,4-β-d-木糖苷键的内水解的酶的活性。可根据本文所述的测定来测定木聚糖酶活性。一个单位的木聚糖酶活性将每分钟从木聚糖释放1um木糖当量。

描述

重组蛋白在诸如大肠杆菌的宿主细胞中高水平表达常常导致重组蛋白在宿主细胞内积聚成非活性、错误折叠以及不溶性聚集物。这些不溶性聚集物被称为包涵体,并且也可含有其它宿主细胞内源性组分,诸如蛋白质、核糖体组分、核酸和细胞碎片。多达70-80%的通过重组技术产生的蛋白质可形成包涵体,由此显著降低可易于从宿主细胞分离的活性重组蛋白的产率。

从包涵体增溶重组蛋白可通过用破坏氢键和疏水性相互作用的离液剂,例如高浓度的尿素处理来实现。然而,所述增溶方法常常导致蛋白质变性和天然功能或酶活性损失。在移除离液剂之后,可溶性变性蛋白可再折叠成它们的天然状态,然而,使重组蛋白再折叠成具有酶活性的生物活性形式可为麻烦的,昂贵的,并且导致最终产物的回收率较低。

本发明至少部分地基于以下惊人发现:已通过尿素来从包涵体增溶的异源性表达的纤维二糖酶保留纤维二糖酶活性。从包涵体回收异源性表达的纤维二糖酶使纤维二糖酶的总产率增加30-40%。此外,由于添加被增溶生物质降解酶例如纤维二糖酶而存在例如尿素的增溶剂并不会不利影响用于使生物质转化成糖产物的糖化反应和/或产物的产率。

因此,本发明提供用于从包涵体增溶具有生物质降解活性的多肽的方法,其中所得被增溶多肽保留生物质降解活性,借此不需要再折叠所述多肽和移除增溶剂的额外处理步骤。本发明提供用于在保留酶活性的同时使从包涵体对异源性表达的生物质降解酶的回收增加,以及在用于例如通过糖化来使生物质转化成产物的方法中使用回收的生物质降解酶的方法。

具有生物质降解活性的多肽

本公开提供具有生物质降解活性的一种多肽、多种多肽。在各实施方案中,具有生物质降解活性的多肽或多种所述多肽与一种或多种增溶剂以混合物形式存在。一些混合物也可含有一种或多种与包涵体相关的蛋白质。在其它实施方案中,混合物不含有一种或多种与包涵体相关的蛋白质,例如从一种或多种与包涵体相关的蛋白质纯化具有生物质降解活性的多肽或多种所述多肽。

举例来说,多肽具有纤维二糖酶活性、木质素酶活性、内切葡聚糖酶活性、纤维二糖水解酶活性或木聚糖酶活性。

在一个实施方案中,多肽是纤维二糖酶。纤维二糖酶是水解它的底物例如纤维二糖中的β-1,4键以释放两个葡萄糖分子的酶。纤维二糖是葡萄糖的水溶性1,4-连接的二聚体。在一个实施方案中,多肽是cel3a。cel3a(也称为bgli)是在里氏木霉中鉴定的纤维二糖酶。以下提供cel3a的氨基酸序列(genbank登记号nw_006711153):

mgdshstsgasaeavvppagtpwgtaydkakaalaklnlqdkvgivsgvgwnggpcvgntspaskisypslclqdgplgvrystgstaftpgvqaastwdvnlirergqfigeevkasgihvilgpvagplgktpqggrnwegfgvdpyltgiamgqtingiqsvgvqatakhyilneqelnretissnpddrtlhelytwpfadavqanvasvmcsynkvnttwacedqytlqtvlkdqlgfpgyvmtdwnaqhttvqsansgldmsmpgtdfngnnrlwgpaltnavnsnqvptsrvddmvtrilaawyltgqdqagypsfnisrnvqgnhktnvraiardgivllkndanilplkkpasiavvgsaaiignharnspscndkgcddgalgmgwgsgavnypyfvapydaintrassqgtqvtlsntdntssgasaargkdvaivfitadsgegyitvegnagdrnnldpwhngnalvqavagansnvivvvhsvgaiileqilalpqvkavvwaglpsqesgnalvdvlwgdvspsgklvytiakspndyntrivsggsdsfseglfidykhfddanitpryefgyglsytkfnysrlsvlstaksgpatgavvpggpsdlfqnvatvtvdiansgqvtgaevaqlyitypssaprtppkqlrgfaklnltpgqsgtatfnirrrdlsywdtasqkwvvpsgsfgisvgassrdirltstlsvagsgs

(seqidno:1)

在一个实施方案中,多肽是木质素酶。木质素酶是分解木质素的酶,所述木质素是称为单木质醇的芳族醇的复杂聚合物,并且是植物和一些藻类的次生细胞壁的主要组成部分。木质素酶包括木质素过氧化物酶1,2-双(3,4-二甲氧基苯基)丙烷-1,3-二醇:过氧化氢氧化还原酶、二芳基丙烷加氧酶、木质素酶i、二芳基丙烷过氧化物酶、lip、过氧化氢氧化还原酶(裂解c-c键)以及一些漆酶。木质素酶的实例包括来自里氏木霉的cip2;来自黄孢原毛平革菌(phanerochaetechrysosporium)的lpoa、glg2、glg4、lipa、glg5、glg3、glg6和lipb;来自射纹革菌(phelbiaradiate)的木质素酶-3;来自云芝(coriolusversicolor)的木质素酶a和b;以及云芝lpgi和lpgiv。

在一个实施方案中,多肽是内切葡聚糖酶。内切葡聚糖酶是催化纤维素的水解的酶。具体来说,内切葡聚糖酶裂解纤维素链的内部键。内切葡聚糖酶由真菌、细菌和原虫产生。内切葡聚糖酶也称为β-1-4内切葡聚糖酶、4-β-d-葡聚糖纤维二糖水解酶、外切-纤维二糖水解酶、β-1,4-葡聚糖纤维二糖水解酶、β-1,4-葡聚糖纤维二糖基水解酶、1,4-β-葡聚糖纤维二糖苷酶、外切葡聚糖酶、微晶纤维素酶、cbh1、c1纤维素酶、纤维二糖水解酶i、纤维二糖水解酶、外切-β-1,4-葡聚糖纤维二糖水解酶、1,4-β-d-葡聚糖纤维二糖水解酶或纤维二糖苷酶。内切葡聚糖酶的实例包括来自里氏木霉的cel5a、cel5b、cel7b、cel12a、cel45a、cel61a、cel61b和cel74a。

在一个实施方案中,多肽是纤维二糖水解酶,也称为外切葡聚糖酶。纤维二糖水解酶催化含有1-4-β-d-葡萄糖苷键的寡糖例如纤维素和纤维四糖中的那个键的水解,由此从链的非还原性末端释放纤维二糖。纤维二糖水解酶的实例包括来自里氏木霉的纤维二糖水解酶(cbhi)和纤维二糖水解酶ii(cbhii)。

在一个实施方案中,多肽是木聚糖酶。木聚糖酶也称为内切-(1-4)-β-木聚糖4-木聚糖水解酶、内切-1,4-木聚糖酶、内切-1,4-β-木聚糖酶、β-1,4-木聚糖酶、内切-1,4-β-d-木聚糖酶、1,4-β-木聚糖木聚糖水解酶、β-木聚糖酶、β-1,4-木聚糖木聚糖水解酶、β-d-木聚糖酶。木聚糖酶分解植物细胞壁的称为半纤维素的组分,例如降解多糖,诸如木聚糖例如β-1,4-木聚糖、葡糖醛酸木聚糖、阿糖基木聚糖、葡甘露聚糖和木葡聚糖,以释放木糖。木聚糖酶的实例包括来自里氏木霉的xyn1、xyn2和xyn3;以及来自船蛆杆菌(terendinibacterturnerae)t7901的tertu_1599、tertu_3603、tertu_2546和tertu_4506。

本公开也提供本文所述的具有生物质降解活性的多肽的功能性变体。在一个实施方案中,功能性变体具有与本文所述的生物质降解酶或其功能性片段具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性,例如与本文所述的生物质降解酶或其功能性片段具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的氨基酸序列。

在一个实施方案中,功能性变体具有与由里氏木霉产生的cel3a或seqidno:1或其功能性片段具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%同一性、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的氨基酸序列。

在两个或更多个氨基酸或核酸序列的情形下的同一性百分比是指相同的两个或更多个序列。如使用以下序列比较算法中的一种或通过手动比对和目视检查所测量,如果当在比较窗或指定区域上进行比较和对准以达成最大对应性时,两个序列具有指定百分比的相同氨基酸残基或核苷酸(例如在指定区域上,或当未指定时在整个序列上,60%同一性,任选70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性),那么两个序列″大致上同一″。任选地,在长度是至少约50个核苷酸、100个核苷酸、150个核苷酸的区域上存在同一性。更优选地,在长度是至少约200或更多个氨基酸、或至少约500或1000或更多个核苷酸的区域上存在同一性。

对于序列比较,通常一个序列充当一个或多个测试序列与其进行比较的参照序列。当使用序列比较算法时,将测试序列和参照序列输入计算机中,必要时指定子序列坐标,并且指定序列算法程序参数。可使用默认程序参数,或可指定替代参数。序列比较算法接着基于程序参数计算测试序列相对于参照序列的序列同一性百分比。使序列对准以供比较的方法在本领域中是熟知的。可例如通过smith和waterman,(1970)adv.appl.math.2:482c的局部同源性算法,通过needleman和wunsch,(1970)j.mol.biol.48:443的同源性比对算法,通过pearson和lipman,(1988)proc.nat'l.acad.sci.usa85:2444的类似性搜索方法,通过这些算法的计算机化执行程序(wisconsingenetics软件包,geneticscomputergroup,575sciencedr.,madison,wi)中的gap、bestfit、fasta和tfasta),或通过手动比对和目视检查(参见例如brent等,(2003)currentprotocolsinmolecularbiology)来进行供比较的序列的最优比对。

适于确定序列同一性百分比和序列类似性百分比的算法的两个实例是blast和blast2.0算法,其分别描述于altschul等,(1977)nuc.acidsres.25:3389-3402;以及altschul等,(1990)j.mol.biol.215:403-410中。用于进行blast分析的软件可通过国家生物技术信息中心(nationalcenterforbiotechnologyinformation)公开获得。

功能性变体可包含一个或多个突变,以使变体保留比由酶所源于的微生物产生的本文所述的生物质降解酶的生物质降解活性更好的生物质降解活性。在一个实施方案中,功能性变体具有如同如由大肠杆菌产生的生物质降解酶的生物质降解活性的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%(例如至少80%、至少85%、至少90%、至少95%或至少99%)。在各实施方案中,功能性变体具有如同由大肠杆菌或酶所源于的微生物产生的生物质降解酶的生物质降解活性的至少200%、至少300%、至少400%、至少500%、至少1000%或更多。可使用本文所述的功能性测定测试生物质降解活性。在一个实施方案中,功能性变体保留比如由里氏木霉产生的cel3a的纤维二糖酶活性更好的纤维二糖酶活性。在另一实施方案中,功能性变体具有如同cel3a或如由大肠杆菌产生的包含seqidno:1的酶的纤维二糖酶活性的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%(例如至少80%、至少85%、至少90%、至少95%或至少99%)。在各实施方案中,相较于本文所述的生物质降解酶,功能性变体具有增加的生物质降解活性,例如是本文所述的生物质降解酶的生物质降解活性(例如是如同cel3a或由大肠杆菌或酶所源于的微生物产生的包含seqidno:1的酶的纤维二糖酶活性)的至少200%、至少300%、至少400%、至少500%、至少1000%或更多。

存在于功能性变体中的突变包括氨基酸取代、添加和缺失。可通过本领域中已知的标准技术,诸如定点诱变和pcr介导的诱变来引入突变。突变可为保守性氨基酸取代,其中氨基酸残基被具有类似侧链的氨基酸残基替换。本领域中已定义具有类似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、具有β分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳族侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,本公开的具有纤维二糖酶活性的多肽内的一个或多个氨基酸残基可被来自同一侧链家族的其它氨基酸替换,并且所得多肽保留与野生型多肽的纤维二糖酶活性类似的纤维二糖酶活性(例如至少80%、85%、90%、95%或99%的纤维二糖酶活性)。或者,突变可为其中氨基酸残基被具有不同侧链的氨基酸残基替换的氨基酸取代。

所述突变可改变或影响生物质降解酶例如纤维二糖酶、木质素酶、内切葡聚糖酶或纤维二糖水解酶的各种酶特征。举例来说,所述突变可改变或影响生物质降解酶的生物质降解活性、热稳定性、最优反应ph、酶动力学或底物识别。在一些实施方案中,相较于生物质降解酶例如由里氏木霉产生的纤维二糖酶和/或在大肠杆菌中产生的seqidno:1,突变使变体的生物质降解活性增加。在一些实施方案中,相较于野生型生物质降解酶例如纤维二糖酶和/或在大肠杆菌中产生的seqidno:1,突变使变体的热稳定性增加或降低。在一个实施方案中,相较于野生型生物质降解酶例如野生型纤维二糖酶和/或在大肠杆菌中产生的seqidno:1,突变改变变体最优进行生物质降解反应所处的ph范围。在一个实施方案中,相较于野生型生物质降解酶例如野生型纤维二糖酶和/或在大肠杆菌中产生的seqidno:1,突变使生物质降解反应的动力学(例如kcat、km或kd)增加或降低。在一个实施方案中,相较于野生型纤维二糖酶和/或在大肠杆菌中产生的seqidno:1,突变使纤维二糖酶识别或结合底物(例如纤维二糖)的能力增加或降低。

本发明也提供如本文所述的具有生物质降解活性例如纤维二糖酶活性的多肽(例如cel3a或seqidno:1)的功能性月段。本领域普通技术人员可易于设想如本文所述的具有生物质降解活性的多肽的含有导致酶活性的功能性结构域的片段将保留例如生物质降解活性的功能活性,并且因此,所述片段涵盖在本发明中。在一个实施方案中,功能性月段的长度是至少700个氨基酸、至少650个氨基酸、至少600个氨基酸、至少550个氨基酸、至少500个氨基酸、至少450个氨基酸、至少400个氨基酸、至少350个氨基酸、至少300个氨基酸、至少250个氨基酸、至少200个氨基酸、至少150个氨基酸、至少100个氨基酸或至少50个氨基酸。在一个实施方案中,功能性片段是700至744个氨基酸、650至699个氨基酸、600至649个氨基酸、550至599个氨基酸、500至549个氨基酸、450至499个氨基酸、400至449个氨基酸、350至399个氨基酸、300至349个氨基酸、250至299个氨基酸、200至249个氨基酸、150至199个氨基酸、100至149个氨基酸或50至99个氨基酸。关于上述氨基酸长度的范围,氨基酸长度的最低值和最高值包括在各公开范围内。在一个实施方案中,功能性片段具有如同本文所述的野生型生物质降解酶或在大肠杆菌中产生的生物质降解酶的生物质降解活性的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。在一个实施方案中,功能性片段具有如同野生型cel3a或在大肠杆菌中产生的包含seqidno:1的多肽的纤维二糖酶活性的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。

用于检测纤维二糖酶活性的测定在本领域中是已知的。举例来说,可通过使纯化纤维二糖酶与例如纤维二糖d-(+)-纤维二糖的底物一起孵育,以及在反应完成之后检测游离葡萄糖的所得量来确定对从纤维二糖释放的葡萄糖的量的检测。可使用本领域中已知的多种方法测定游离葡萄糖的量。举例来说,在含有50mm柠檬酸钠的缓冲液(ph5.0,naoh)中制备纯化纤维二糖酶的稀释液。以使得纤维二糖在反应混合物中的最终浓度是30mm的量将纤维二糖底物添加至纯化纤维二糖酶中。在适于反应发生的条件下,例如在振荡器(700rpm)中,在48℃下持续30分钟孵育反应混合物。为终止反应,在100℃下加热反应混合物5分钟。使反应混合物经0.45μm过滤器过滤,分析滤液以定量葡萄糖和/或纤维二糖酶的量。测量诸如葡萄糖的分析物的ysi仪器可用于测定由反应产生的葡萄糖的浓度。或者,uplc(超高效液相色谱法)可用于测定来自反应的葡萄糖和纤维二糖的浓度。可将这个测定排列成单反应或多反应形式,例如96孔形式。在一些实施方案中,多反应形式可优选用以产生关于不同浓度的纯化纤维二糖酶来表示纤维二糖酶活性的活性曲线。可使用标准布拉德福德(bradford)测定来测定纯化纤维二糖酶的浓度。制备纯化纤维二糖酶测定的稀释液,例如2倍稀释液,并且等分至96孔板中,例如12个孔的2倍稀释液。如先前所述添加纤维二糖底物以使纤维二糖酶在反应中的最终浓度是30mm。将板密封并在足以发生纤维二糖酶反应的条件下,接着在足以终止反应的条件下处理。接着使反应经96孔形式0.45μm膜(例如durapore)过滤,并且通过ysi和/或hplc方法(例如uplc)来分析。

这个活性测定也可用于通过产生已知浓度的纤维二糖酶的活性的标准曲线以外推未知浓度样品的浓度来确定浓度未知的样品中纤维二糖酶的浓度或效价。举例来说,在96孔板的一行中制备具有已知浓度的纤维二糖酶的两倍连续稀释液,例如12个两倍连续稀释液。其它行含有效价待测定的其它剩余样品(例如粗制溶解产物样品或被增溶包涵体样品)的两倍连续稀释液。使稀释液与d-(+)-纤维二糖(fluka)底物溶液一起在48℃下在50mm柠檬酸二氢钠缓冲液中在ph5.0下孵育30分钟。在30分钟之后,加热样品至100℃,持续10分钟以终止反应。使用ysi生物化学分析仪(ysilifesciences)和/或hplc方法分析样品中的葡萄糖和纤维二糖。使用浓度已知的样品,利用在测定的线性范围内的数据点产生标准曲线。可将从效价未知的样品检测的纤维二糖酶活性与标准曲线进行比较以确定这些样品中的纤维二糖酶效价。

如果使用在测定的线性范围内的值进行计算,那么活性单位数仅是相对的。测定的线性范围如使用小于30%的原始可溶性底物负载量的葡萄糖值所定义。此外,低于0.05g/l的葡萄糖值由于仪器报告水平而被忽略。一个单位的纤维二糖酶活性定义为葡萄糖的量/cel3a的量/30分钟:[葡萄糖]g/l/[cel3a]g/l/30分钟。

在其它实施方案中,可使用比色/荧光测定。在用于发生反应的条件下使纯化纤维二糖酶与底物纤维二糖一起孵育。如下检测产物葡萄糖。向混合物中添加葡萄糖氧化酶,其使葡萄糖(产物)氧化成葡萄糖酸和过氧化氢。接着添加过氧化物酶和邻联茴香胺。邻联茴香胺与过氧化氢在过氧化物酶存在下反应以形成有色产物。添加硫酸,其与氧化邻联茴香胺反应以形成更稳定有色产物。当例如通过分光光度计或色度计例如在540nm下测量时,颜色的强度与葡萄糖浓度成正比。所述比色/荧光葡萄糖测定可例如从sigmaaldrich(目录号gago-20)商购获得。

用于检测木质素酶活性的测定在本领域中是已知的。可通过测定藜芦醇氧化成藜芦醛的速率来测量木质素酶活性(将藜芦醇氧化(veratrylalcoholoxidation)缩写为vao)。制备反应混合物,并且其含有各种稀释度的酶、2mm藜芦醇、0.4mmh2o2和20或100mm酒石酸钠,ph2.9,最终体积0.5ml。反应通过添加h2o2来起始,并且通过分光光度测定法在310nm下监测。根据bradford,m.m.,(1976)anal.biochem.72:248-254,使用牛血清白蛋白(sigmachemicalco.,st.louis,mo)作为标准物,或通过使用蛋白质溶液的409nm吸光度以及根据木质素酶的消光系数计算蛋白质量来测定蛋白质。

用于检测内切葡聚糖酶活性的测定在本领域中是已知的。举例来说,可通过测量底物羧甲基纤维素(cmc)的水解以及通过bca方法定量还原性末端的浓度来测定内切葡聚糖酶活性,其中还原性末端的总浓度通过样品溶液的与还原性末端的浓度成比例的颜色变化来展现。首先,在ph4.8的50mm柠檬酸盐缓冲液中稀释具有生物质降解活性的多肽。将cmc溶液(于柠檬酸钠缓冲液中的0.05%w/vcmc)添加至反应管中并在50℃下平衡。将稀释的酶样品添加至反应中,并且在50℃下孵育10分钟。添加bca试剂,并且在75℃下孵育30分钟。在减去酶空白和底物空白的读数之后,在560nm下读取吸光度。可基于还原性末端浓度与酶浓度之间的线性范围计算酶活性。其它内切葡聚糖酶活性测定在本领域中是已知的,例如通过测定底物粘度的降低(zhang等,biotechnoladv,2006,24:452-481)。

用于检测纤维二糖水解酶活性的测定在本领域中是已知的。可通过在苯酚-硫酸测定中测量从底物阿维塞尔释放的可溶性底物来测定纤维二糖水解酶活性。将阿维塞尔溶液(1.25%w/v于乙酸盐缓冲液中)等分至反应管中,并且制备酶的稀释液。使底物与酶溶液两者在50℃下平衡。将稀释的酶溶液添加至底物中,并且孵育一段足以发生反应的时间,例如在50℃下持续2小时。通过将样品浸没至冰冷水浴中来终止反应。将样品离心以使样品分成可溶性部分和不溶性部分。通过苯酚-硫酸测定来测定可溶性部分中可溶性糖的总浓度。具体来说,使可溶性部分的等分试样与5%苯酚混合,并且添加浓硫酸。使反应冷却至室温(约20-30分钟),并且在490nm下读取样品的吸光度。基于总可溶性糖释放量与酶稀释度之间的线性关系计算酶活性。其它纤维二糖水解酶活性测定描述于zhang等,biofuels:methodsandprotocols,第581卷.第213-231页中。

用于检测木聚糖酶活性的测定在本领域中是已知的。可通过比色测定对从木聚糖底物释放的木糖的水平进行测量来测定木聚糖酶活性。将木聚糖底物制备成于50mm乙酸钠缓冲液(ph4.5)中的1.0%w/v溶液。制备酶的稀释液。混合木聚糖和酶稀释液,并且在足以发生反应的条件下孵育,例如30℃持续10分钟。接着将含有16mm硫酸铜、1.3m硫酸钠、226mm碳酸钠、190mm碳酸氢钠和43mm酒石酸钾钠的溶液添加至反应中。接着将反应煮沸10分钟,并且使其冷却至室温。添加含有40mm钼酸、19mm砷酸和756mm硫酸的溶液。将反应振荡或涡旋直至起泡停止,并且存在的任何沉淀得以溶解。将反应离心以进行澄清,接着通过分光光度计在540nm下读取溶液,并且基于总可溶性糖释放量与酶稀释度之间的线性关系计算酶活性。

无糖基化多肽

任何本文所述的具有生物质降解活性例如纤维二糖酶活性的多肽都可为糖基化的或无糖基化的。如本文所述,可从包涵体增溶具有生物质降解活性的无糖基化多肽。或者,可将具有生物质降解活性的无糖基化多肽添加至包含已从包涵体增溶的具有生物质降解活性的多肽的混合物中,其中从包涵体增溶的所述多肽可为糖基化的或无糖基化的。

糖基化是碳水化合物连接于糖基接受体所采用的酶促过程,所述糖基接受体例如精氨酸或天冬酰胺侧链的氮或丝氨酸、苏氨酸或酪氨酸侧链的羟基氧。有两种类型的糖基化:n连接的糖基化和o连接的糖基化。n连接的糖基化发生在共有位点asn-x-ser/thr处,其中x可为除脯氨酸之外的任何氨基酸。o连接的糖基化发生在ser/thr残基处。可使用本领域中已知的各种算法预测糖基化位点,所述算法诸如可通过瑞士生物信息学研究所(swissinstituteofbioinformatics)公开获得的prosite和可通过生物序列分析中心(centerforbiologicalsequenceanalysis)公开获得的netnglyc1.0或netoglyc4.0。

本发明提供用于产生具有生物质降解活性的无糖基化多肽的方法。在一个实施方案中,已使编码多肽的核酸改变或突变以致多肽不能被糖基化,例如使一个或多个糖基化位点突变以致聚糖不能连接于糖基化位点。举例来说,由本文所述的核酸序列编码的具有生物质降解活性的无糖基化多肽在一个或多个糖基化位点处含有一个或多个突变,所述糖基化位点已被突变以致聚糖不再能附接或连接于糖基化位点。在另一实例中,由本文所述的核酸序列编码的具有生物质降解活性的多肽含有一个或多个邻近于一个或多个糖基化位点的突变,所述糖基化位点已被突变以致聚糖不再能附接或连接于糖基化位点。举例来说,邻近于糖基化位点的突变使由糖基化酶识别的共有基序突变,或改变多肽的构象以使多肽不能被糖基化,例如糖基化位点被隐藏或归因于新构象的空间位阻阻止糖基化酶接近糖基化位点。邻近于具有生物质降解活性的多肽中的糖基化位点的突变直接邻近于糖基化位点或离糖基化位点有至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少30或至少40个氨基酸,所述糖基化位点由于邻近突变而将不被糖基化。

在一个实施方案中,使纤维二糖酶例如cel3a或seqidno:1的一个或多个以下糖基化位点突变:氨基酸位置78处的苏氨酸、氨基酸位置241处的苏氨酸、氨基酸位置343处的丝氨酸、氨基酸位置450处的丝氨酸、氨基酸位置599处的苏氨酸、氨基酸位置616处的丝氨酸、氨基酸位置691处的苏氨酸、氨基酸位置21处的丝氨酸、氨基酸位置24处的苏氨酸、氨基酸位置25处的丝氨酸、氨基酸位置28处的丝氨酸、氨基酸位置38处的苏氨酸、氨基酸位置42处的苏氨酸、氨基酸位置303处的苏氨酸、氨基酸位置398处的丝氨酸、氨基酸位置435处的丝氨酸、氨基酸位置436处的丝氨酸、氨基酸位置439处的苏氨酸、氨基酸位置442处的苏氨酸、氨基酸位置446处的苏氨酸、氨基酸位置451处的丝氨酸、氨基酸位置619处的丝氨酸、氨基酸位置622处的丝氨酸、氨基酸位置623处的苏氨酸、氨基酸位置626处的丝氨酸或氨基酸位置630处的苏氨酸或其任何组合。在各实施方案中,使糖基化位点从丝氨酸或苏氨酸突变成丙氨酸。举例来说,本文所述的无糖基化多肽具有一个或多个以下突变:t78a、t241a、s343a、s450a、t599a、s616a、t691a、s21a、t24a、s25a、s28a、t38a、t42a、t303a、t398a、s435a、s436a、t439a、t442a、t446a、s451a、s619a、s622a、t623a、s626a或t630a或其任何组合。或者,使一个或多个邻近于上述糖基化位点的氨基酸突变。

用以检测多肽是否由聚糖修饰(例如多肽是否被糖基化或无糖基化)的测定在本领域中是已知的。多肽可被纯化或分离,并且可被染色以检测和定量聚糖部分,或可通过质谱测定法来分析多肽,并且与相应参照多肽进行比较。参照多肽与测试多肽(其糖基化状态待测定)具有相同一级序列,但被糖基化或无糖基化。

相较于相应糖基化多肽例如糖基化cel3a多肽,本文所述的无糖基化多肽可具有增加的生物质降解活性,例如纤维二糖酶活性。举例来说,相较于糖基化多肽,具有生物质降解活性例如纤维二糖酶活性的无糖基化多肽具有至少1%、2%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%或200%生物质降解活性,例如纤维二糖酶活性。

核酸、表达载体和宿主细胞

在宿主细胞中表达如本文所述的具有生物质降解活性的多肽。在一个实施方案中,将包含编码任何本文所述的具有生物质降解活性的多肽的核酸序列的表达载体引入宿主细胞中,并且在适于表达具有生物质降解活性的多肽的条件下培养所述宿主细胞。在各实施方案中,具有生物质降解活性的多肽的表达处于使得形成包含具有生物质降解活性的多肽的包涵体或聚集物的水平下。本文也描述用于表达和分离在宿主细胞中表达的具有生物质降解活性的可溶性多肽的方法。用于从包涵体增溶和分离具有生物质降解活性的多肽的方法进一步描述于题为″从包涵体进行增溶″的章节中。

本发明也提供一种编码具有生物质降解活性的多肽的核酸序列。在一个实施方案中,核酸序列编码本文所述的木质素酶、内切葡聚糖酶、纤维二糖水解酶、木聚糖酶或纤维二糖酶。可将编码具有生物质降解活性的多肽的核酸序列进行密码子优化以达成在宿主细胞中的表达增加。密码子优化包括改变核酸序列以考虑包括密码子使用偏好、隐蔽剪接位点、mrna二级结构、过早多聚腺苷酸位点、密码子和抗密码子的相互作用、以及rna不稳定性基序在内因素来增加编码多肽在宿主中的表达。用于密码子优化的各种算法和商业服务在本领域中是已知的和可用的。

在一个实施方案中,核酸序列编码来自里氏木霉的具有本文所述的氨基酸序列例如seqidno:1的cel3a酶。在一个实施方案中,以下提供编码cel3a的核酸序列:

atgcgttaccgaacagcagctgcgctggcacttgccactgggccctttgctagggcagacagtcactcaacatcgggggcctcggctgaggcagttgtacctcctgcagggactccatggggaaccgcgtacgacaaggcgaaggccgcattggcaaagctcaatctccaagataaggtcggcatcgtgagcggtgtcggctggaacggcggtccttgcgttggaaacacatctccggcctccaagatcagctatccatcgctatgccttcaagacggacccctcggtgttcgatactcgacaggcagcacagcctttacgccgggcgttcaagcggcctcgacgtgggatgtcaatttgatccgcgaacgtggacagttcatcggtgaggaggtgaaggcctcggggattcatgtcatacttggtcctgtggctgggccgctgggaaagactccgcagggcggtcgcaactgggagggcttcggtgtcgatccatatctcacgggcattgccatgggtcaaaccatcaacggcatccagtcggtaggcgtgcaggcgacagcgaagcactatatcctcaacgagcaggagctcaatcgagaaaccatttcgagcaacccagatgaccgaactctccatgagctgtatacttggccatttgccgacgcggttcaggccaatgtcgcttctgtcatgtgctcgtacaacaaggtcaataccacctgggcctgcgaggatcagtacacgctgcagactgtgctgaaagaccagctggggttcccaggctatgtcatgacggactggaacgcacagcacacgactgtccaaagcgcgaattctgggcttgacaigtcaatgcctggcacagacttcaacggtaacaatcggctciggggtccagctctcaccaatgcggtaaatagcaatcaggtccccacgagcagagtcgacgatatggtgactcgtatcctcgccgcatggtacttgacaggccaggaccaggcaggctatccgtcgttcaacatcagcagaaatgttcaaggaaaccacaagaccaatgtcagggcaattgccagggacggcatcgttctgctcaagaatgacgccaacatcctgccgctcaagaagcccgctagcattgccgtcgttggatctgccgcaatcattggtaaccacgccagaaactcgccctcgtgcaacgacaaaggctgcgacgacggggccttgggcatgggttggggttccggcgccgtcaactatccgtacttcgtcgcgccctacgatgccatcaataccagagcgtcttcgcagggcacccaggttaccttgagcaacaccgacaacacgtcctcaggcgcatctgcagcaagaggaaaggacgtcgccatcgtcttcatcaccgccgactcgggtgaaggctacatcaccgtggagggcaacgcgggcgatcgcaacaacctggatccgtggcacaacggcaatgccctggtccaggcggtggccggtgccaacagcaacgtcattgttgttgtccactccgttggcgccatcattctggagcagattcttgctcttccgcaggtcaaggccgttgtctgggcgggtcttccttctcaggagagcggcaatgcgctcgtcgacgtgctgtggggagatgtcagcccttctggcaagctggtgtacaccattgcgaagagccccaatgactataacactcgcatcgtttccggcggcagtgacagcttcagcgagggactgttcatcgactataagcacttcgacgacgccaatatcacgccgcggtacgagttcggctatggactgtcttacaccaagttcaactactcacgcctctccgtcttgtcgaccgccaagtctggtcctgcgactggggccgttgtgccgggaggcccgagtgatctgttccagaatgtcgcgacagtcaccgttgacatcgcaaactctggccaagtgactggtgccgaggtagcccagctgtacatcacctacccatcttcagcacccaggacccctccgaagcagctgcgaggctttgccaagctgaacctcacgcctggtcagagcggaacagcaacgttcaacatccgacgacgagatctcagctactgggacacggcttcgcagaaatgggtggtgccgtcggggtcgtttggcatcagcgtgggagcgagcagccgggatatcaggctgacgagcactctgtcggtagcg

(seqidno:2)

以下提供编码cel3a的密码子优化的核酸序列二

atgcgttatcgtacagccgcagccctggcactggccacaggtccgttcgcacgtgccgatagtcacagtaccagcggtgccagcgcagaagccgtggttccgccggcaggcacaccgtggggcacagcctatgataaagccaaagccgccctggccaagctgaatctgcaggataaagtgggcatcgtgagtggcgtgggctggaacggtggtccgtgcgttggcaacaccagcccggcaagcaagatcagctatccgagcttatgcctgcaggatggtccgctgggcgtgcgctatagcaccggtagtaccgcctttacacctggtgtgcaggccgccagtacctgggacgttaacctgatccgcgaacgtggccaatttatcggcgaagaagttaaagccagcggcattcatgttattctgggtccggtggccggtcctctgggtaaaaccccgcagggcggccgtaattgggaaggcttcggcgttgatccgtatttaaccggcatcgcaatgggccagaccattaatggcatccagagcgtgggtgttcaagccaccgccaaacactacatattaaacgaacaggaactgaatcgtgaaaccatcagcagcaatccggatgatcgcaccctgcatgagctgtatacatggccttttgccgacgcagttcaggccaacgtggcaagtgtgatgtgtagctataacaaggtgaacaccacctgggcctgcgaagaccagtacaccctgcagaccgttttaaaagaccaactgggcttccctggttacgtgatgacagattggaatgcccagcacacaaccgttcagagcgcaaacagtggcctggatatgagcatgccgggcaccgacttcaacggcaataatcgtctgtggggtccggcactgaccaatgccgttaacagcaaccaggtgccgaccagtcgtgtggacgatatggttacccgtattctggccgcctggtacctgacaggtcaagaccaggccggctacccgagcttcaacatcagccgcaacgtgcagggtaatcacaagaccaacgttcgcgcaatcgcacgcgatggtatcgtgctgttaaagaacgatgccaacattctgccgctgaaaaaaccggccagcatcgccgttgttggtagcgcagccatcattggcaaccacgcccgtaacagtccgagctgcaatgataaaggctgtgacgacggtgccctgggcatgggttggggtagtggtgccgtgaactacccgtatttcgtggccccgtacgacgccattaacacccgtgcaagtagccagggtacccaggttaccctgagcaacaccgacaacacaagcagcggtgccagtgcagcacgtggtaaggatgtggccatcgtgttcatcaccgccgacagcggcgaaggctacattaccgtggagggtaatgccggtgatcgcaataatctggacccgtggcataacggcaacgccctggttcaggcagtggcaggcgcaaatagcaacgtgatcgttgtggtgcatagcgtgggtgccatcattctggagcagatcctggccctgccgcaagttaaggcagttgtgtgggcaggtctgccgagccaagaaagtggcaatgccctggtggacgttctgtggggcgatgttagtccgagcggcaagctggtgtatacaatcgccaagagcccgaacgactataacacccgcatcgttagcggcggcagtgatagcttcagcgagggcctgtttatcgactacaagcatttcgatgatgccaatattaccccgcgctacgaatttggttatggcctgagctataccaagttcaactacagccgcctgagcgttttaagtaccgccaagagtggtccggcaacaggtgccgtggttcctggtggtccgagtgatctgtttcagaatgtggccaccgtgaccgtggatatcgccaacagtggtcaggttaccggcgccgaagtggcacagctgtacatcacctatccgagcagtgcaccgcgcaccccgccgaaacagctgcgtggcttcgccaaattaaacctgaccccgggccagagcggtacagcaaccttcaatattcgccgccgtgatctgagctattgggacaccgccagccaaaaatgggtggtgccgagcggcagctttggcattagtgtgggtgcaagtagccgcgacattcgcttaacaagcaccctgagtgttgcc

(seqidno:3)

在一个实施方案中,编码cel3a酶或其功能性变体的核酸序列包含与seqidno:2的至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性。在一个实施方案中,编码cel3a酶或其功能性变体的核酸序列包含与seqidno:2或seqidno:3的至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性。

本文也提供一种编码本文所述的具有生物质降解活性的无糖基化多肽例如cel3a多肽的核酸序列,其中一个或多个存在于多肽中的糖基化位点已被突变以致聚糖不再能附接或连接于糖基化位点。在另一实施方案中,本文所述的核酸序列编码如上所述的无糖基化多肽,例如cel3a多肽,其中一个或多个突变邻近于一个或多个存在于多肽中的已被突变的糖基化位点以致聚糖不再能附接或连接于糖基化位点,如先前所述。

用于分离或克隆编码多肽的核酸序列的技术在本领域中是已知的,并且包括从基因组dna分离、从cdna制备或其组合。可例如通过使用熟知的聚合酶链式反应(pcr)或抗体表达文库筛选以检测具有共有结构特征的克隆dna片段来实现从所述基因组dna克隆本发明的核酸序列。参见例如innis等,1990,pcr:aguidetomethodsandapplication,academicpress,newyork。可使用其它扩增程序,诸如连接酶链式反应(lcr)、连接活化转录(lat)和基于核苷酸序列的扩增(nasba)。核酸序列可从里氏木霉菌株(例如野生型里氏木霉或里氏木霉rutc30)或另一或相关生物体克隆,并且因此,例如可为核酸序列的多肽编码区域的等位基因或物种变体。

可通过在遗传工程改造中用于使核酸序列从它的天然位置重新定位于它将被再现所处的不同位点的标准克隆程序来获得核酸序列。克隆程序可涉及切除和分离包含编码多肽的核苷酸序列的所需片段,将所述片段插入载体分子中,以及将重组载体并入宿主细胞中,在所述宿主细胞中,多个拷贝或克隆的核苷酸序列将被复制。核苷酸序列可为基因组、cdna、rna、半合成、合成来源或其任何组合。

如本文所用,″表达载体″是用于向宿主细胞中引入和表达目标核酸序列的核酸构建体。在一些实施方案中,载体包含可操作地连接于本文所述的核酸序列,并且能够实现由本文所述的核酸序列编码的多肽的表达的适合控制序列。控制序列可为由用于表达核酸序列的宿主细胞识别的适当启动子序列。在一个实施方案中,目标核酸序列是编码如本文所述的具有生物质降解活性例如纤维二糖酶活性的多肽的核酸序列。

本文所述的表达载体中的启动子可包括从编码细胞外或细胞内多肽的基因获得的对于宿主细胞是同源性或异源性的启动子、突变启动子、截短启动子和杂合启动子。

适于指导本发明的核酸构建体在细菌宿主细胞中转录的启动子的实例是从大肠杆菌lac操纵元、大肠杆菌tac启动子(杂合启动子,deboer等,pnas,1983,80:21-25)、大肠杆菌reca、大肠杆菌arabad、大肠杆菌teta和原核β-内酰胺酶获得的启动子。适合启动子的其它实例包括病毒启动子,诸如来自噬菌体的启动子,包括t7启动子、t5启动子、t3启动子、m13启动子和sp6启动子。在一些实施方案中,超过一个启动子控制目标核酸序列的表达,例如大肠杆菌lac启动子和t7启动子。可适用于本发明中的其它启动子描述于"usefulproteinsfromrecombinantbacteria",scientificamerican,1980,242:74-94;以及sambrook等,molecularcloning:alaboratorymanual,1989中。在一些优选实施方案中,启动子是诱导型的,其中添加分子会刺激下游阅读框的转录和表达。

适于指导本发明的核酸构建体在真核宿主细胞中,例如在真菌或酵母细胞中转录的启动子的实例是从里氏木霉、甲醇诱导性醇氧化酶(aox启动子)、构巢曲霉(aspergillusnidulans)色氨酸生物合成(trpc启动子)、黑曲霉泡盛变种(aspergillusnigervar.awamori)葡萄糖淀粉酶(glaa)、酿酒酵母(saccharomycescerevisiae)半乳糖激酶(gal1)的基因获得的启动子或乳酸克鲁维酵母(kluyveromyceslactis)plac4-pbi启动子。

存在于本文所述的表达载体中的控制序列也可为编码连接于多肽的氨基末端的氨基酸序列,并且将所编码多肽引导至细胞的分泌路径中的信号序列,例如分泌信号序列。信号序列可为内源性信号序列,例如其中当由目标多肽所源于的生物体内源性表达时,信号序列存在于野生型多肽的n末端。信号序列可为外来或异源性信号肽,其中信号序列来自不同生物体或来自不同于所表达的目标多肽的多肽。将所表达多肽引导至宿主细胞的分泌路径中的任何信号序列都可用于本发明中。通常,信号序列由6个与136个之间的碱性和/或疏水性氨基酸组成。

适于本发明的信号序列的实例包括来自酿酒酵母α因子的信号序列。

融合标签也可用于本文所述的表达载体以有助于检测和纯化所表达多肽。适合融合标签的实例包括his标签(例如3xhis、6xhis(seqidno:22)或8xhis(seqidno:21))、gst标签、hsv标签、s标签、t7标签。其它适合融合标签包括myc标签、血凝素(ha)标签和荧光蛋白标签(例如绿色荧光蛋白)。通常使融合标签可操作地连接于待表达的多肽的n末端或c末端。在一些实施方案中,在融合标签序列与待表达的多肽的n末端或c末端之间可存在接头区域。在一个实施方案中,接头区域包含具有1个至20个的氨基酸,不影响或改变所表达多肽的表达或功能的序列。

利用本文所述的融合标签允许例如通过使用特异性识别标签的抗体进行蛋白质印迹来检测所表达蛋白质。标签也允许例如通过亲和色谱法来从宿主细胞纯化所表达多肽。举例来说,可通过使用镍亲和色谱法来纯化融合于his标签的所表达多肽。his标签对镍离子具有亲和力,并且镍柱将截留his标记的多肽,同时允许所有其它蛋白质和细胞碎片流动通过柱。使用例如含有咪唑的洗脱缓冲液洗脱his标记的多肽使his标记的多肽从柱释放,从而产生大致上纯化的多肽。

本文所述的表达载体可进一步包含如为本领域技术人员通常所知的用以使得能够分离用构建体转化的经遗传修饰的微生物的可选择标记基因。可选择标记基因可赋予对抗生素的抗性或在缺乏为宿主生物体所特定的营养物的培养基上生长的能力,所述宿主生物体否则不可在这些条件下生长。本发明不受对可选择标记基因的选择的限制,并且本领域技术人员可易于确定适当基因。举例来说,可选择标记基因可赋予对氨苄青霉素、氯霉素、四环素、卡那霉素、潮霉素、腐草霉素、遗传霉素或g418的抗性,或可弥补宿主微生物在trd、arg、leu、pyr4、pyr、ura3、ura5、his或ade基因中的一个基因方面的缺陷,或可赋予在乙酰胺作为唯一氮源的情况下生长的能力。

本文所述的表达载体可进一步包含如为本领域技术人员通常所知的其它核酸序列,例如额外控制序列,例如转录终止子、用以将各种其它核酸序列连接在一起的合成序列、复制起点、核糖体结合位点、多克隆位点(或多接头位点)、多聚腺苷酸化信号等。适于表达载体的核糖体结合位点取决于所用的宿主细胞,例如对于在原核宿主细胞中表达,可使用原核rbs,例如t7噬菌体rbs。多克隆位点或多接头位点含有一个或多个优选不存在于表达载体的其余序列中的限制酶位点。限制酶位点用于插入编码具有纤维二糖酶活性的多肽的核酸序列或其它所需控制序列。本发明的实施不受这些其它核酸序列例如其它控制序列中的任何一个或多个的存在的限制。

适用于本发明中的表达载体的实例包括用于在原核生物中表达的载体,例如细菌表达载体。适用于本发明中的一种细菌表达载体是pet载体(novagen),其含有以下:病毒t7启动子,其仅对t7rna聚合酶(而非细菌rna聚合酶)具有特异性,并且也不存在于原核基因组中任何地方;lac操纵子,其包含lac启动子和lac阻遏蛋白的编码序列(laci基因);多接头;f1复制起点(以使当与m13辅助噬菌体共感染时,可产生单链质粒);氨苄青霉素抗性基因和cole1复制起点(blaber,1998)。启动子与lac操纵子两者均位于其中插入编码本文所述的多肽的核酸序列的多接头的5′或上游。lac操纵子赋予编码具有纤维二糖酶活性的多肽的核酸序列的可诱导表达。添加乳糖代谢物iptg(异丙基β-d-1-硫代半乳糖吡喃糖苷)会触发lac操纵元的转录,并且诱导核酸序列在lac操纵子的控制下的蛋白质表达。使用这个系统要求向宿主细胞中添加t7rna聚合酶以达成载体表达。t7rna聚合酶可通过第二表达载体来引入,或可使用被遗传工程改造以表达t7rna聚合酶的宿主细胞株。

供与本发明一起使用的示例性表达载体是可从novagen商购获得的pet载体。pet表达系统描述于美国专利号4,952,496;5,693,489;和5,869,320中。在一个实施方案中,pet载体是可从novagen商购获得的pet-duet载体,例如pet-duet1。适用于本发明中的其它载体包括含有his标签序列的载体,诸如美国专利号5,310,663和5,284,933;以及欧洲专利号282042中所述的那些。

本发明也涉及一种包含本发明的核酸序列或表达载体的宿主细胞,其用于重组产生具有生物质降解活性的多肽。

将包含本发明的核酸序列的表达载体引入宿主细胞中以使所述载体得以维持(例如通过染色体整合或作为自我复制性染色体外载体),以便表达多肽。

宿主细胞可为原核生物或真核生物。宿主细胞可为细菌,诸如大肠杆菌菌株,例如k12菌株novablue、novabluet1r、jm109和dh5α。优选地,细菌细胞能够折叠或部分折叠外源性表达的蛋白质,诸如大肠杆菌origami菌株,例如origamib、origamib(de3)、origami2和origami2(de3)菌株。在一些实施方案中,可优选的是使用具有糖基化缺陷,或具有受损糖基化途径的宿主细胞以使由所述宿主细胞表达的蛋白质不被显著糖基化。

宿主细胞可为酵母或丝状真菌,特别是分类为子囊菌门(ascomycota)的那些。适用作用于表达本发明的经修饰的trcel3aβ-葡萄糖苷酶的宿主微生物的酵母的属包括酵母属(saccharomyces)、毕赤酵母属(pichia)、汉逊酵母属(hansenula)、克鲁维酵母属(kluyveromyces)、耶罗威亚酵母属(yarrowia)和arxula。适用作用于表达本发明的多肽的微生物的真菌的属包括木霉属、肉座菌属(hypocrea)、曲霉属、镰刀菌属、腐质霉属、链孢霉属(neurospora)、金孢子菌属、毁丝霉属、梭孢壳属、侧孢霉属(sporotrichum)和青霉属。举例来说,宿主细胞可为巴斯德毕赤酵母。举例来说,宿主细胞可为里氏木霉的工业菌株或其突变体,例如里氏木霉rutc30。通常,宿主细胞是不表达亲本生物质降解酶例如纤维二糖酶或cel3a的细胞。

对例如细菌细胞或真菌细胞的特定宿主细胞的选择取决于用于产生本发明的无糖基化多肽的表达载体(例如控制序列)和/或方法,如以下进一步详细所述。

可通过由微生物转化领域技术人员所知的许多方法来将本发明的表达载体引入宿主细胞中,所述方法包括但不限于转化、用cacl2处理细胞、电穿孔、基因枪轰击、脂质体转染和peg介导的原生质体融合(例如white等,wo2005/093072,其以引用的方式并入本文)。在选择含有表达载体的重组宿主细胞(例如通过利用表达载体的可选择标记进行选择)之后,可在诱导本发明的具有生物质降解活性的多肽的表达的条件下培养重组宿主细胞。

用于回收由原核生物和真核生物细胞表达的具有生物质降解活性的可溶性多肽的方法在本领域中是已知的。在各实施方案中,用于回收多肽的方法包括例如通过离心或过滤来收集细胞,以及例如通过机械、化学或酶促手段来溶解细胞。举例来说,可例如通过声波处理、研磨(与珠粒一起振荡)或剪切力来将细胞物理破坏分开。可处理细胞膜以使它们可被渗透以便释放细胞的内含物,诸如用例如曲通(triton)、np-40或sds的清洁剂处理。可使用诸如溶菌酶(lysozyme)或溶解酶(lysonase)的酶使具有细胞壁的细胞例如细菌细胞可被渗透。在本发明的情形下,上述机械、化学和酶促技术的任何组合也适于从宿主细胞回收所表达目标多肽。举例来说,当在例如大肠杆菌细胞的细菌细胞中表达本文所述的具有生物质降解活性的多肽时,通常通过离心和沉淀细胞培养物来收集细胞,并且通过将细胞沉淀再混悬于含有溶菌酶的溶解缓冲液中来使细胞溶解。为确保完全溶解,使再混悬细胞经受以下方法中的一种:声波处理、研磨或均质化。在离心之后,具有生物质降解活性的可溶性多肽存在于上清液中,而例如在包涵体中的具有生物质降解活性的不溶性多肽见于沉淀中。用于例如从包涵体回收具有生物质降解活性的不溶性多肽的方法以下进一步描述于题为″从包涵体进行增溶″的章节中。

可接着使用本领域中已知的标准方法从细胞溶解产物纯化或分离具有生物质降解活性的可溶性多肽。对于包含例如his标签的标签的具有生物质降解活性的多肽,亲和色谱法可用于使可溶性多肽与溶解产物的可溶性部分的其余部分分离。

在一个实施方案中,在添加至生物质中以进行糖化反应之前,不使表达本文所述的具有生物质降解活性的多肽的宿主细胞溶解。在一些情况下,用于溶解宿主细胞以及提取具有生物质降解活性的多肽的方法可导致蛋白质变性和/或酶活性降低,此导致下游加工成本增加。因此,本发明也提供用于在糖化步骤之前将表达本文所述的具有生物质降解活性的无糖基化多肽的宿主细胞直接添加至生物质中的方法。

在一个实施方案中,例如通过离心来分离表达本文所述的具有生物质降解活性的多肽的宿主细胞例如大肠杆菌细胞,并且添加至糖化反应,例如含有生物质的糖化反应器中。通过来自生物质的剪切力、叶轮和增加温度的组合来使细胞溶解。在一个实施方案中,将表达本文所述的具有生物质降解活性的多肽的宿主细胞例如大肠杆菌细胞的培养物从发酵罐直接添加至糖化罐中,并且消除对通过离心来沉淀细胞的需要。在一个实施方案中,多肽是糖基化的或无糖基化的。

从包涵体进行增溶

在各实施方案中,已使用本文所述的方法遗传修饰细胞例如本文公开的微生物以产生至少一种具有生物质降解活性的多肽。至少一部分,例如至少5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的具有生物质降解活性的多肽见于经遗传修饰的细胞中的包涵体中。本文公开用于从包涵体增溶至少一种具有生物质降解活性的多肽的方法。

包涵体是当在高水平下表达时于宿主细胞中的不溶性聚集物,其包含异源性表达的蛋白质,例如具有生物质降解活性的多肽。包涵体可见于核或细胞质中。包涵体也可含有其它组分,诸如其它宿主细胞内源性蛋白质例如宿主蛋白质、核糖体组分、核酸(例如rna和/或dna)和细胞碎片(例如细胞壁碎片、脂质、代谢物)。宿主细胞内源性蛋白质包括由宿主细胞的基因组dna编码的任何蛋白质。宿主细胞内源性蛋白质可定位于细胞质,或可与异源性表达的蛋白质相互作用。可见于包涵体中的核糖体组分的实例包括核糖体、核糖体亚基(例如50s亚基或30s亚基)的片段、部分翻译的多肽、转运rna、延伸因子和/或信使rna。可见于包涵体中的核酸的实例包括宿主的基因组dna、外源性dna(例如来自引入宿主细胞中的质粒或表达载体)、信使rna、转运rna、核糖体rna或其任何片段。可见于包涵体中的细胞碎片的实例包括细胞壁或细胞膜碎片(例如细胞壁或细胞膜的片段或组分)、核膜碎片(例如核膜的片段或组分)、其它宿主细胞器的片段或组分、内毒素、脂质和/或代谢物。

用于降低包涵体的聚集的额外方法包括声波处理、在不同温度下孵育、酸/碱处理、蛋白酶处理、电处理、机械处理和添加产生蛋白酶的生物体。举例来说,在-20℃至0℃、0℃至4℃、4℃至20℃、20℃至40℃以及40℃至80℃的范围内的温度下孵育含有包涵体的细胞或其溶解产物。

为分离包涵体,首先使用本领域中的标准方法溶解表达具有生物质降解活性的多肽的宿主细胞,所述方法诸如通过溶菌酶或其它变性剂来溶解、超声处理、声波处理或高压均质化。在不导致包涵体增溶的条件下使宿主细胞溶解。使用本领域中已知的技术从宿主细胞分离包涵体。举例来说,分离细胞溶解产物以使含有具有生物质降解活性的多肽和其它不溶性物质的包涵体存在于不溶性部分中,而可溶性部分含有具有生物质降解活性的可溶性多肽。所述分离可通过离心来实现,借此包涵体见于沉淀例如不溶性部分中,而可溶性多肽见于上清液例如可溶性部分中。适于使不溶性部分与可溶性部分分离的其它方法包括过滤。

使包涵体增溶以释放具有生物质降解活性的多肽包括将增溶剂添加至不溶性部分或包涵体中。在一些实施方案中,增溶剂可为阻止蛋白质聚集或沉淀,或溶解蛋白质聚集物的试剂。在一些实施方案中,增溶剂包括破坏范德华相互作用、疏水性相互作用、氢键合、偶极-偶极相互作用、离子相互作用、π堆积或其任何组合的试剂。

在一些实施方案中,增溶剂可为破坏疏水性相互作用的试剂,例如像清洁剂。示例性清洁剂包括非离子型、两性离子型、阴离子型和阳离子型清洁剂。在一些实施方案中,增溶剂可为非离子型的,例如np-40和曲通x-100。在一些实施方案中,增溶剂可为两性离子型的,例如chaps和磺基甜菜碱,例如sb3-10或asb14。在一些实施方案中,蛋白质试剂可为阴离子型的,例如十二烷基硫酸钠(sds)。

在一些实施方案中,增溶剂可为使二硫键还原的试剂,例如硫醇还原剂。示例性硫醇还原剂包括2-巯基乙醇βme和二硫苏糖醇(dtt)。在一些实施方案中,使二硫键还原的增溶剂可为膦,例如三丁基膦(tbp)或三羧乙基膦(tcep)。

在一些实施方案中,增溶剂可为破坏氢键合和疏水性相互作用的试剂。在一些实施方案中,增溶剂可为离液化合物,例如尿素和取代的尿素(例如硫脲)以及盐酸胍。

在一些实施方案中,增溶剂可为是非极性溶剂的试剂。非极性溶剂在具有类似电负性的原子诸如碳和氢之间含有键,并且具有极低介电常数。举例来说,非极性溶剂具有小于5的介电常数。非极性溶剂的实例包括戊烷、己烷、环己烷、苯、甲苯、氯仿、乙醚。

在一些实施方案中,增溶剂可为是极性溶剂的试剂。极性溶剂的特征在于具有大偶极矩(或″部分电荷″);它们在具有极其不同电负性的原子诸如氧和氢之间含有键。在一个实施方案中,本文中适用于本发明中的极性溶剂具有至少5或至少20的介电常数。在一个优选实施方案中,极性溶剂具有高介电常数,例如大于25的介电常数。在一些实施方案中,增溶剂是质子性极性溶剂,其具有o-h或n-h键,具有例如大于20、大于25的高介电常数,并且是良好氢键供体,例如甲酸、正丁醇、异丙醇、正丙醇、乙醇、甲醇或硝基甲烷。在一些实施方案中,增溶剂可为非质子性极性溶剂,其缺乏o-h或n-h键,并且具有在5与20之间的介电常数,例如二甲亚砜(dmso)、二氯甲烷(dcm)、四氢呋喃(thf)、乙酸乙酯、丙酮、二甲基甲酰胺(dmf)或乙腈(mecn)。

在一些实施方案中,增溶剂可为具有正电荷的试剂,其可适于破坏带净负电荷分子的离子相互作用。示例性带正电荷增溶剂包括n-甲基d-还原葡糖胺、胆碱、精氨酸、赖氨酸、普鲁卡因(procaine)、缓血酸胺(tris)、精胺(spermine)、n-甲基-吗啉、葡糖胺、n,n-双2-羟乙基甘氨酸、二氮杂双环十一烯、肌酸(creatine)、精氨酸乙酯、金刚烷胺(amantadine)、金刚烷乙胺(rimantadine)、鸟氨酸、牛磺酸和瓜氨酸。阳离子部分可另外包括钠、钾、钙、镁、铵、单乙醇胺、二乙醇胺、三乙醇胺、缓血酸胺、赖氨酸、组氨酸、精氨酸、吗啉、甲基还原葡糖胺和葡糖胺。

在一些实施方案中,增溶剂可为具有负电荷的试剂,其可适于破坏带净正电荷分子的离子相互作用。示例性带负电荷的增溶剂包括乙酸盐、丙酸盐、丁酸盐、戊酸盐、己酸盐、庚酸盐、乙酰丙酸盐、氯化物、溴化物、碘化物、柠檬酸盐、丁二酸盐、顺丁烯二酸盐、乙醇酸盐葡萄糖酸盐、葡糖醛酸盐、3-羟基异丁酸盐、2-羟基异丁酸盐、乳酸盐、苹果酸盐、丙酮酸盐、反丁烯二酸盐、酒石酸盐、丙醇二酸盐、硝酸盐、磷酸盐、苯磺酸盐、甲烷磺酸盐、硫酸盐、磺酸盐、乙酸、金刚烷甲酸、α酮戊二酸、d-天冬氨酸或l-天冬氨酸、苯磺酸、苯甲酸、10-樟脑磺酸、柠檬酸、1,2-乙烷二磺酸、反丁烯二酸、d-葡萄糖酸、d-葡萄糖醛酸、葡糖二酸、d-谷氨酸或l-谷氨酸、戊二酸、乙醇酸、马尿酸(hippuricacid)、氢溴酸、盐酸、1-羟基-2-萘甲酸、乳糖酸、顺丁烯二酸、l-苹果酸、扁桃酸、甲烷磺酸、粘液酸、1,5-萘二磺酸四水合物、2-萘磺酸、硝酸、油酸、帕莫酸、磷酸、对甲苯磺酸水合物、d-糖二酸单钾盐、水杨酸、硬脂酸、丁二酸、硫酸、丹宁酸和d-酒石酸或l-酒石酸。

将增溶剂以足以从包涵体增溶具有生物质降解活性的多肽的浓度,例如以约0.01-10m、约0.05-10m、约0.1-10m、约0.2-10m、约0.5-10m、约1-10m、约2-10m、约5-10m、约8-10m、约0.01-6m、约0.05-6m、约0.1-6m、约0.2-6m、约0.5-6m、约1-6m、约2-6m、约4-6m或约5-6m的浓度添加至包涵体或含有包涵体的部分中。在一个实施方案中,将增溶剂以约0.01m、约0.02m、约0.05m、约0.1m、约0.2m、约0.5m、约1m、约2m、约3m、约4m、约5m、约6m、约7m、约8m、约9m或约10m的浓度添加至包涵体或含有包涵体的部分中。

在一个优选实施方案中,增溶剂是尿素,并且以约0.01-10m、约0.05-10m、约0.1-10m、约0.2-10m、约0.5-10m、约1-10m、约2-10m、约5-10m、约8-10m、约0.01-6m、约0.05-6m、约0.1-6m、约0.2-6m、约0.5-6m、约1-6m、约2-6m、约4-6m或约5-6m的浓度添加至包涵体或含有包涵体的部分中。在一个实施方案中,将尿素以约0.01m、约0.02m、约0.05m、约0.1m、约0.2m、约0.5m、约1m、约2m、约3m、约4m、约5m、约6m、约7m、约8m、约9m或约10m的浓度添加至包涵体或含有包涵体的部分中。在一个优选实施方案中,将尿素以6m的浓度添加至包涵体或含有包涵体的部分中。

在使用增溶剂进行增溶之后,所得混合物含有如本文所述的具有生物质降解活性的被增溶多肽。所得混合物可直接用于酶促过程,诸如用于产生产物的反应例如糖化反应中,如在题为″使用被增溶酶产生产物的方法″的章节中进一步详细所述。在这个实施方案中,混合物可含有包涵体的其它组分,诸如其它宿主细胞其它内源性蛋白质、核糖体组分、核酸(例如rna和/或dna)和细胞碎片(例如细胞壁碎片、脂质、代谢物)。

在其它实施方案中,进一步处理含有具有生物质降解活性的被增溶多肽的所得混合物以从包涵体的其它被增溶组分纯化或分离具有生物质降解活性的所述被增溶多肽。适于分离或纯化具有生物质降解活性的被增溶多肽的方法包括亲和纯化技术。举例来说,具有生物质降解活性的多肽优选含有可用于亲和纯化的标签或融合肽。在一个实施方案中,具有生物质降解活性的多肽含有his标签,例如8xhis标签(seqidno:21),并且可使用镍亲和色谱法例如固定化金属离子亲和色谱法(imac)系统纯化具有生物质降解活性的被增溶多肽。在一个实施方案中,所有纯化步骤都在用于从包涵体增溶多肽的增溶剂存在下发生,包括在纯化过程的洗涤和洗脱步骤中。因此,在一个实施方案中,所得具有生物质降解活性的纯化被增溶多肽也含有增溶剂。

本发明提供一种包含具有生物质降解活性的多肽和增溶剂的混合物。混合物是通过如上所述使包涵体增溶来获得。所得混合物也可进一步包含一种或多种与包涵体相关的蛋白质。具有生物质降解活性的被增溶多肽也可通过亲和纯化技术纯化。在这种情况下,所得混合物不包含一种或多种与包涵体相关的蛋白质。混合物可包含见于包涵体中的其它组分,诸如其它宿主细胞内源性蛋白质、核糖体组分、核酸(例如rna和/或dna)和细胞碎片(例如细胞壁碎片、脂质、代谢物)。

在一个实施方案中,具有生物质降解活性的被增溶多肽可为部分未折叠的,部分错误折叠的,或部分变性的。在一个实施方案中,相较于具有生物质降解活性的天然多肽,具有生物质降解活性的被增溶多肽具有至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少8-10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%生物质降解活性。在一个实施方案中,相较于具有生物质降解活性的天然多肽,具有生物质降解活性的被增溶多肽具有约1-10%、1-20%、1-30%、1-40%、1-50%、1-60%、1-70%、1-80%、1-90%、1-100%、10-20%、10-30%、10-40%、10-50%、10-60%、10-70%、10-80%、10-90%、10-100%、20-30%、20-40%、20-50%、20-60%、20-70%、20-80%、20-90%、20-100%、30-40%、30-50%、30-60%、30-/0%、30-80%、30-90%、30-100%、40-50%、40-60%、40-70%、40-80%、40-90%、40-100%、50-60%、50-70%、50-80%、50-90%、50-100%、60-70%、60-80%、60-90%、60-100%、70-80%、70-90%、70-100%、80-90%、80-100%或90-100%的生物质降解活性。在一个优选实施方案中,具有生物质降解活性的被增溶多肽具有至少8-10%的天然多肽的活性。具有生物质降解活性的天然多肽是指例如从可溶性部分分离的具有生物质降解活性的相应多肽、以它的天然形式适当折叠(由此具有100%生物质降解活性)的具有生物质降解活性的相应多肽、或由多肽所源于的微生物内源性表达的具有生物质降解活性的相应多肽。生物质降解活性可通过任何本文所述的测定来测定,例如木质素酶活性测定、内切葡聚糖酶活性测定、纤维二糖水解酶活性测定、纤维二糖酶活性测定或木聚糖酶活性测定。

在一个方面,混合物包含具有纤维二糖酶活性的多肽,例如来自里氏木霉的cel3a或其功能性变体,例如与seqidno:1具有至少90%同一性的多肽;以及例如尿素的增溶剂。在一个实施方案中,混合物包含与seqidno:1具有至少90%同一性的多肽和例如尿素的增溶剂,其中相较于天然多肽例如seqidno:1或来自里氏木霉的cel3a,所述多肽具有至少20%的纤维二糖酶活性。混合物是通过如上所述使包涵体增溶来获得。所得混合物也可进一步包含一种或多种与包涵体相关的蛋白质。具有纤维二糖酶活性的被增溶多肽,例如与seqidno:1具有至少90%同一性的多肽也可通过亲和纯化技术纯化。在这种情况下,所得混合物不包含一种或多种与包涵体相关的蛋白质。混合物可包含见于包涵体中的其它组分,诸如其它宿主细胞内源性蛋白质、核糖体组分、核酸(例如rna和/或dna)和细胞碎片(例如细胞壁碎片、脂质、代谢物)。在一个实施方案中,增溶剂是尿素,并且尿素以0.2-6m存在。

在一个实施方案中,具有纤维二糖酶活性或与seqidno:1具有至少90%同一性的被增溶多肽可为部分未折叠的,部分错误折叠的,或部分变性的。在一个实施方案中,相较于天然多肽,具有纤维二糖酶活性或与seqidno:1具有至少90%同一性的被增溶多肽具有至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少8-10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%纤维二糖酶活性。在一个实施方案中,相较于天然多肽,具有纤维二糖酶活性或与seqidno:1具有至少90%同一性的被增溶多肽具有约1-10%、1-20%、1-30%、1-40%、1-50%、1-60%、1-70%、1-80%、1-90%、1-100%、10-20%、10-30%、10-40%、10-50%、10-60%、10-70%、10-80%、10-90%、10-100%、20-30%、20-40%、20-50%、20-60%、20-70%、20-80%、20-90%、20-100%、30-40%、30-50%、30-60%、30-70%、30-80%、30-90%、30-100%、40-50%、40-60%、40-70%、40-80%、40-90%、40-100%、50-60%、50-70%、50-80%、50-90%、50-100%、60-70%、60-80%、60-90%、60-100%、70-80%、70-90%、70-100%、80-90%、80-100%或90-100%的纤维二糖酶活性。天然多肽是例如适当折叠(例如100%折叠)的seqidno:1、从里氏木霉分离的cel3a或其功能性变体。纤维二糖酶活性可使用本文所述的测定来测量,并且可定量为在30分钟之后释放的葡萄糖的浓度(g/l)或在30分钟内转化成葡萄糖的纤维二糖的%。

用于产生无糖基化多肽的方法

本发明进一步提供用于在宿主细胞中产生具有生物质降解活性的无糖基化多肽的方法,其中如本文所述用增溶剂以适于增溶所述无糖基化多肽的浓度处理所述宿主细胞或其溶解产物。方法包括在适于表达多肽的条件下培养表达具有生物质降解活性的多肽的宿主细胞。方法也可包括从宿主细胞回收具有生物质降解活性的无糖基化多肽。在以下进一步详细描述的方法中,具有生物质降解活性的多肽具有例如木质素酶活性、内切葡聚糖酶活性、纤维二糖水解酶活性、纤维二糖酶活性或木聚糖酶活性。在一个实施方案中,具有纤维二糖酶活性的多肽包括来自里氏木霉的cel3a或其功能性片段。在另一实施方案中,具有纤维二糖酶活性的多肽包括seqidno:1。

使用在糖基化方面缺陷的宿主细胞

在各实施方案中,表达载体包含编码可操作地连接于融合标签的本文所述的具有生物质降解活性的多肽的核酸序列,所述表达载体被引入不使在细胞中表达的蛋白质显著糖基化的所述细胞(例如细菌宿主细胞)中,并且在所述细胞中表达。在用于表达多肽的条件下培养重组宿主细胞,从而导致产生具有生物质降解活性的无糖基化多肽。可使用针对如本文所述的融合标签的亲和色谱方法从宿主细胞纯化或分离无糖基化多肽。

举例来说,在这个实施方案中,表达载体在编码具有生物质降解活性的多肽的核酸序列的上游含有lac操纵子和t7启动子,并且宿主细胞能够表达t7rna聚合酶。通过添加iptg来诱导具有生物质降解活性的多肽的表达。优选地,宿主细胞是大肠杆菌细胞,优选是大肠杆菌origami细胞。在这个实施方案中,融合标签是his标签,并且对所表达无糖基化多肽的纯化包括镍亲和色谱法。

使用具有糖基化能力的宿主细胞

在另一实施方案中,在宿主细胞中表达包含编码如本文所述的多肽的核酸序列的表达载体,所述多肽包含一个或多个糖基化位点突变以使所述多肽不被糖基化,其中所述宿主细胞能够使在所述细胞内表达的蛋白质糖基化,例如酵母或真菌宿主细胞。或者,宿主细胞不能够使在所述细胞例如细菌宿主细胞内表达的蛋白质糖基化。在这个实施方案中,使多肽可操作地连接于融合标签。可使用针对如本文所述的融合标签的亲和色谱方法从细菌宿主细胞纯化或分离无糖基化多肽。

在另一实施方案中,在宿主细胞中表达包含编码本文所述的具有生物质降解活性的多肽的核酸序列的表达载体,其中所述宿主细胞能够使在所述细胞内表达的蛋白质糖基化。在足以达成多肽的表达和糖基化的条件下培养细胞。在这个实施方案中,使多肽可操作地连接于融合标签。可使用针对如本文所述的融合标签的亲和色谱方法从细菌宿主细胞纯化或分离糖基化多肽。在从宿主细胞和其它内源性宿主酶(例如糖基化酶)纯化之后,可通过与去糖基化酶一起孵育来移除所分离的糖基化多肽的聚糖。去糖基化酶包括pngasef、pngasea、endoh(内切糖苷酶h)、endos(内切糖苷酶s)、endod(内切糖苷酶d)、endof(内切糖苷酶f)、endof1(内切糖苷酶f1)或endof2(内切糖苷酶f2)。含有足以完全移除聚糖的酶的蛋白质去糖基化混合物可例如从newenglandbiolabs商购获得。使所分离多肽与一种或多种去糖基化酶在足以从多肽移除所有聚糖的条件下一起孵育。本领域中已知用于从多肽移除聚糖的其它方法,例如用弱碱进行β消除或温和肼解。可使用本领域中已知的用于染色和观察聚糖的方法或质谱测定法来确定对多肽的糖基化状态的评估。

在另一实施方案中,在宿主细胞中表达包含编码本文所述的具有生物质降解活性的多肽的核酸序列的表达载体,其中所述宿主细胞能够使在所述细胞内表达的蛋白质糖基化。在足以表达多肽的条件下,但在糖基化抑制剂存在下培养细胞。糖基化抑制剂以使得所表达多肽呈无糖基化的浓度并持续足够时间存在。在这个实施方案中,使多肽可操作地连接于融合标签。可使用针对如本文所述的融合标签的亲和色谱方法从细菌宿主细胞纯化或分离所得无糖基化多肽。

适用于这个实施方案中的糖基化抑制剂的实例包括衣霉素、苯甲基-galnac(苯甲基2-乙酰胺基-2-脱氧-α-d-吡喃半乳糖苷)、2-氟-2-脱氧-d-葡萄糖和5'cdp(5’二磷酸胞苷)。在一些实施方案中,使用糖基化抑制剂的组合。优选地,用于这个实施方案中的糖基化抑制剂的浓度足以抑制多肽的糖基化,但不导致细胞毒性或对宿主细胞的蛋白质表达的抑制。

使生物质转化成产物的方法

本发明提供用于使用如本文所述的具有纤维二糖酶活性的无糖基化多肽将生物质转化或加工成产物的方法和组合物。用于使生物质转化成诸如糖产物的产物的方法在本领域中是已知的,例如如美国专利申请2014/0011258中所述,所述专利的内容以引用的方式整体并入本文。简要来说,将生物质进行最优预处理例如以降低不顺应性,并且通过涉及使所处理生物质与生物质降解酶或纤维素分解酶一起孵育以产生糖(例如葡萄糖和/或木糖)的糖化过程来糖化。可接着例如通过发酵或蒸馏来进一步加工糖产物以产生最终产物。最终产物包括醇(例如乙醇、异丁醇或正丁醇)、糖醇(例如赤藻糖醇、木糖醇或山梨糖醇)或有机酸(例如乳酸、丙酮酸、丁二酸)。

使用本文所述的方法,可使生物质材料转化成一种或多种产物,诸如能量、燃料、食物和材料。产物的具体实例包括但不限于氢气、糖(例如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖、果糖、纤维二糖、二糖、寡糖和多糖)、醇(例如一元醇或二元醇,诸如乙醇、正丙醇、异丁醇、仲丁醇、叔丁醇或正丁醇)、水合醇或含水醇(例如含有大于10%、20%、30%或甚至大于40%水)、生物柴油、有机酸、烃(例如甲烷、乙烷、丙烷、异丁烯、戊烷、正己烷、生物柴油、生物汽油及其混合物)、副产物(例如蛋白质,诸如纤维素分解蛋白质(酶)或单细胞蛋白)、以及呈任何组合或相对浓度,并且任选地与任何添加剂(例如燃料添加剂)组合的任何这些产物的混合物。其它实例包括羧酸、羧酸的盐、羧酸和羧酸的盐和羧酸的酯(例如甲酯、乙酯和正丙酯)的混合物、酮(例如丙酮)、醛(例如乙醛)、α和β不饱和酸(例如丙烯酸)和烯烃(例如乙烯)。其它醇和醇衍生物包括丙醇、丙二醇、1,4-丁二醇、1,3-丙二醇、糖醇和多元醇(例如二醇、甘油、赤藻糖醇、苏糖醇、阿糖醇、木糖醇、核糖醇、甘露糖醇、山梨糖醇、半乳糖醇、艾杜糖醇、肌醇、庚七醇、异麦芽酮糖醇、麦芽糖醇、乳糖醇、麦芽三糖醇、麦芽四糖醇和聚糖醇(polyglycitol)以及其它多元醇)、以及任何这些醇的甲酯或乙酯。其它产物包括丙烯酸甲酯、甲基丙烯酸甲酯、乳酸、柠檬酸、甲酸、乙酸、丙酸、丁酸、丁二酸、戊酸、己酸、3-羟基丙酸、棕榈酸、硬脂酸、草酸、丙二酸、戊二酸、油酸、亚油酸、乙醇酸、γ-羟基丁酸及其混合物、任何这些酸的盐、任何酸和它们的相应盐的混合物。

生物质

待使用本文所述的方法加工的生物质是包含纤维素的淀粉材料和/或纤维素材料,例如木质纤维素材料。生物质也可包含半纤维素和/或木质素。生物质可包括以下中的一种或多种:农业产品或废弃物、纸产品或废弃物、林业产品或一般性废弃物或其任何组合。农业产品或废弃物包括可被栽培、收获或加工以供例如由人或动物使用或消耗的材料;或由栽培、收获或加工方法产生的任何中间体、副产品或废弃物。农业产品或废弃物包括但不限于甘蔗、黄麻、大麻、亚麻、竹子、剑麻、苜蓿、干草、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆、草、柳枝稷、芒草、绳草、草芦、谷物残渣、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、玉米穗轴、玉米秸杆、玉米纤维、椰子毛、甜菜浆、甘蔗渣、大豆秸杆、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳或细麸或其组合。纸产品或废弃物包括用于制造纸产品的材料;任何纸产品;或由制造或分解纸产品产生的任何中间体、副产品或废弃物。纸产品或废弃物包括但不限于纸、着色纸、装料纸、涂覆纸、瓦楞纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板或纸浆或其组合。林业产品或废弃物包括通过栽培、收获或加工木材产生的材料;或由栽培、收获或加工木材产生的任何中间体、副产品或废弃物。林业产品或废弃物包括但不限于白杨木、来自任何树属或树种的木材、创花板、木片或锯屑或其组合。一般性废弃物包括但不限于粪肥、污水或垃圾或其组合。

生物质可包括但不限于淀粉材料、甘蔗、农业废弃物、纸、纸产品、纸废弃物、纸浆、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板、棉花、木材、创花板、林业废弃物、锯屑、白杨木、木片、草、柳枝稷、芒草、绳草、草芦、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳、农业废弃物、青贮饲料、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、黄麻、大麻、亚麻、竹子、剑麻、蕉麻、玉米穗轴、玉米秸杆、大豆秸杆、玉米纤维、苜蓿、干草、椰子毛、糖加工残渣、甘蔗渣、甜菜浆、龙舌兰渣、海藻、海草、浮游生物粪肥、污水、垃圾、农业或工业废弃物、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆或任何这些的混合物。在一个优选实施方案中,生物质包括农业废弃物,诸如玉米穗轴,例如玉米秸杆。在另一实施方案中,生物质包括草。

在一个实施方案中,在与本文所述的组合物接触之前处理生物质。举例来说,处理生物质以降低生物质的不顺应性,降低它的堆密度,和/或增加它的表面积。适合生物质处理方法可包括但不限于:用电子进行轰击、声波处理、氧化、热解、蒸汽爆炸、化学处理、机械处理和冷冻研磨。优选地,处理方法是用电子进行轰击。

在一些实施方案中,进行电子轰击直至生物质接受至少0.5mrad,例如至少5、10、20、30或至少40mrad的总剂量。在一些实施方案中,进行处理直至生物质接受约0.5mrad至约150mrad、约1mrad至约100mrad、约5mrad至约75mrad、约2mrad至约75mrad、约10mrad至约50mrad,例如约5mrad至约50mrad、约20mrad至约40mrad、约10mrad至约35mrad、或约20mrad至约30mrad的剂量。在一些执行中,25至35mrad的总剂量是优选的,在理想情况下历经几秒进行施加,例如在每次穿过5mrad下,其中各次穿过被施加约1秒。在一些情况下,施加每次穿过大于7至9mrad的剂量可导致原料材料的热降解。

生物质材料(例如植物生物质、动物生物质、纸和城市废弃物生物质)可用作原料以产生有用中间体和产物,诸如有机酸、有机酸的盐、酸酐、有机酸的酯和燃料,例如用于内燃机的燃料或用于燃料电池的原料。本文描述可使用可易于获得,但常常可难以加工的纤维素和/或木质纤维素材料作为原料的系统和方法,所述材料例如城市废弃物物流和废纸物流,诸如包括报纸、牛皮纸(kraftpaper)、瓦楞纸或这些的混合物的物流。

为了将原料转化成可被容易加工的形式,可通过糖化剂(例如酶或酸)将原料中的含有葡聚糖或木聚糖的纤维素水解成低分子量碳水化合物诸如糖,所过过程被称为糖化。然后,低分子量碳水化合物可用于例如现有制造厂中,如单细胞蛋白质厂、酶制造厂或燃料厂,例如乙醇制造设施。

可使用酶,例如通过使材料和所述酶在溶剂中,例如在水溶液中组合来水解原料。可根据本文所述的方法制备/诱导酶。

具体来说,酶可由能够分解生物质(诸如生物质的纤维素和/或木质素部分),或含有或制造各种纤维素分解酶(纤维素酶)、木质素酶或各种小分子生物质降解代谢物的生物体供给。这些酶可为协同作用降解生物质的结晶纤维素或木质素部分的酶复合物。纤维素分解酶的实例包括:内切葡聚糖酶、纤维二糖水解酶和纤维二糖酶(β-葡萄糖苷酶)。

在糖化期间,纤维素底物可通过内切葡聚糖酶在随机位置初步水解,从而产生低聚中间体。这些中间体随后被作为外切葡聚糖酶诸如纤维二糖水解酶的底物,以从纤维素聚合物的末端产生纤维二糖。纤维二糖是水溶性的1,4-连接的葡萄糖二聚体。最后,纤维二糖酶裂解纤维二糖以得到葡萄糖。此过程的效率(例如水解时间和/或水解完全性)取决于纤维素材料的不顺应性。

糖化

通常通过使不顺应性降低的生物质和生物质降解酶在例如水溶液的流体介质中组合来用以上讨论的生物质降解酶处理不顺应性降低的生物质。在一些情况下,在糖化之前在热水中煮沸、浸渍或蒸煮原料,如2012年4月26日公开的由medoff和masterman完成的美国专利申请公布2012/0100577a1中所述,所述美国专利申请公布的整个内容被并入本文。

本文提供用于本文所述的糖化过程中的能够降解生物质的酶的混合物,例如生物质降解酶的酶混合物。

糖化过程可在制造厂中的储罐(例如具有至少4000l、40,000l、500,000l、2,000,000l、4,000,000l或6,000,000l或更大体积的储罐)中部分或完全地进行,和/或可在转运中,例如在轨道车、油罐卡车中或在高级油轮或船舱中部分或完全地进行。完全糖化所需要的时间将取决于工艺条件和所使用的生物质材料和酶。如果糖化是在受控的条件下在制造厂中进行,那么纤维素可在约12-96小时内大致上完全转化成糖,例如葡萄糖。如果糖化是在转运中部分或完全地进行,那么糖化可能花费较长时间。

在一个优选实施方案中,在对于发生酶促反应最优的ph下,例如在对于生物质降解酶的活性最优的ph下发生糖化反应。优选地,糖化反应的ph在ph4-4.5下。在一个优选实施方案中,在对于发生酶促反应最优的温度下,例如在对于生物质降解酶的活性最优的温度下发生糖化反应。优选地,糖化反应的温度在42℃-52℃下。

通常优选在糖化期间例如使用喷射混合对储罐内含物进行混合,如在2010年5月18日提交的国际申请号pct/us2010/035331中所描述,所述申请以英语公布为wo2010/135380并且指定美国,所述申请的全部公开内容以引用的方式并入本文。

表面活性剂的添加可提高糖化速率。表面活性剂的实例包括非离子型表面活性剂(诸如20或80聚乙二醇表面活性剂)、离子型表面活性剂或两性表面活性剂。

通常优选的是由糖化得到的糖溶液的浓度相对较高,例如大于5重量%、7.5重量%、10重量%、10.5重量%,或大于40重量%,或大于50重量%、60重量%、70重量%,或甚至大于80重量%。可例如通过蒸发去除水以增加糖溶液的浓度。这减小了待装运的体积并且还抑制了溶液中的微生物生长。

或者,可使用较低浓度的糖溶液,在这种情况下,可能希望以低浓度(例如50至150ppm)添加抗微生物添加剂,例如广谱抗生素。其它适合抗生素包括两性霉素b、氨苄青霉素、氯霉素、环丙沙星、庆大霉素、潮霉素b、卡那霉素、新霉素、青霉素、嘌呤霉素、链霉素。抗生素将在运输和储存期间抑制微生物的生长,并且可以适当浓度(例如按重量计在15与10,000ppm之间,例如在25与500ppm之间,或在50与150ppm之间)使用。如果希望,则即使糖浓度相对较高也可包括抗生素。或者,可使用具有抗微生物防腐性质的其它添加剂。优选地,抗微生物添加剂是食品级的。

可通过限制与酶一起添加到生物质材料中的水量来获得相对较高浓度的溶液。可例如通过控制糖化发生到何种程度来控制浓度。举例来说,可通过向溶液中添加更多生物质材料来增加浓度。为保持所产生的糖处于溶解状态,可添加表面活性剂,例如以上讨论的那些中的一种。也可通过增加溶液的温度来增加溶解性。举例来说,可将溶液维持在40℃-50℃、60℃-80℃或甚至更高的温度下。

在本文所述的方法中,例如在糖化之后,可分离糖(例如葡萄糖和木糖)。举例来说,可通过沉淀、结晶、色谱法(例如模拟移动床色谱法、高压色谱法)、离心、提取、本领域中已知的任何其它分离方法及其组合来分离糖。

用于糖化中的混合物

在一方面,本发明的特征在于一种用于糖化中的混合物,其包含如本文所述的已从包涵体增溶的具有生物质降解活性的多肽、一种或多种与包涵体相关的蛋白质、和增溶剂。在一个实施方案中,混合物可含有包涵体的其它组分,诸如其它宿主细胞内源性蛋白质、核糖体组分、核酸(例如rna和/或dna)和细胞碎片(例如细胞壁碎片、脂质、代谢物)。具有生物质降解活性的多肽可为糖基化的或无糖基化的。

在一个实施方案中,混合物包含具有纤维二糖酶活性的多肽和尿素。在一个实施方案中,尿素以0.2-6m存在。在一个实施方案中,混合物包含来自里氏木霉的cel3a或其功能性变体或片段。在一个实施方案中,混合物包含以下多肽:所述多肽包含与来自里氏木霉的cel3a的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。在另一实施方案中,混合物包含以下多肽:所述多肽包含与seqidno:1的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性。具有纤维二糖酶活性的多肽可为糖基化的或无糖基化的。

在各实施方案中,本文所述的混合物进一步包含至少一种源于微生物的额外酶,其中所述额外酶具有生物质或纤维素基材料降解活性。举例来说,额外酶是木质素酶、内切葡聚糖酶、纤维二糖水解酶、木聚糖酶或纤维二糖酶。在一个实施方案中,混合物进一步包含一种或多种木质素酶、一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种木聚糖酶或一种或多种纤维二糖酶。在各实施方案中,额外生物质降解酶是糖基化的。在各实施方案中,酶混合物进一步包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种或至少20种或更多种本文所述的额外生物质降解酶。以下显示若干生物质降解酶的典型一级氨基酸序列。

举例来说,混合物进一步包含由微生物产生的额外生物质降解酶的混合物,所述微生物例如真菌细胞,诸如野生型里氏木霉或其突变体,例如里氏木霉rutc30。在一个实施方案中,从微生物分离额外生物质降解酶。在一个实施方案中,混合物包含一种或多种以下生物质降解酶:b2af03、cip1、cip2、cella、cel3a、cel5a、cel6a、cel7a、cel7b、cel12a、cel45a、cel74a、paman5a、paman26a或膨胀蛋白或其任何组合。例如以上所列的额外生物质降解酶可从酶所源于的微生物(例如真菌细胞)内源性表达和分离(以下列于表1中)。或者,可使用类似表达方法在本文所述的宿主细胞中异源性表达例如以上所列的额外生物质降解酶,并且从所述宿主细胞分离。在一个实施方案中,异源性表达的额外生物质降解酶在酶的c末端或n末端用his标签进行标记,并且使用本领域中已知的镍亲和色谱法技术进行分离。举例来说,额外生物质降解酶选自以下表1。

表1.额外生物质降解酶的实例

以下提供表1中所列的生物质降解酶的氨基酸序列。

b2af03(鹅柄孢壳菌)

mkssvfwgasltsavvraidlpfqfypncvddllstnqvcnttlspperaaalvaaltpeeklqnivskslgapriglpaynwwsealhgvayapgtqfwqgdgpfnsstsfpmpllmaatfddellekiaevigiegrafgnagfsgldywtpnvnpfkdprwgrgsetpgedvllvkryaaamikglegpvpekerrvvatckhyaandfedwngatrhnfnakislqdmaeyyfmpfqqcvrdsrvgsimcaynavngvpscaspyllqtilrehwnwtehnnyitsdceavldvslnhkyaatnaegtaisfeagmdtsceyegssdipgawsqgllkestvdrallrlyegivragyfdgkqslysslgwadvnkpsaqklslqaavdgtvllkndgtlplsdlldksrpkkvamigfwsdakdklrggysgtaaylhtpayaasqlgipfstasgpilhsdlasnqswtdnamaaakdadyilyfggidtsaagetkdrydldwpgaqlslinllttlskplivlqmgdqldntpllsnpkinailwanwpgqdggtavmelvtglkspagrlpvtqypsnftelvpmtdmalrpsagnsqlgrtyrwyktpvqafgfglhyttfspkfgkkfpavidvdevlegcddkyldtcplpdlpvvvenrgnrtsdyvalafvsapgvgpgpwpiktlgaftrlrgvkggekregglkwnlgnlarhdeegntvvypgkyevsldeppkarlrfeivrggkgkgkvkgkgkaaqkggvvldrwpkppkgqeppaierv(seqidno:6)

cip1(里氏木霉)

mvrrtallalgalstlsmaqisddfesgwdqtkwpisapdcnqggtvsldttvahsgsnsmkvvggpngycghiffgttqvptgdvyvrawirlqtalgsnhvtfiimpdtaqggkhlriggqsqvldynresddatlpdlspngiastvtlptgafqcfeyhlgtdgtietwlngslipgmtvgpgvdnpndagwtrasyipeitgvnfgweaysgdvntvwfddisiastrvgcgpgspggpgssttgrsstsgptstsrpsttippptsrtttatgptqthygqcggigysgptvcasgttcqvlnpyysqcl(seqidno:7)

cip2(里氏木霉)

masrffallllaipiqaqspvwgqcggigwsgpttcvggatcvsynpyysqcipstqasssiasttlvtsfttttatrtsastppasstgaggatcsalpgsitlrsnaklndlftmfngdkvttkdkfscrqaemseliqryelgtlpgrpstltasfsgntltincgeagksisftvtitypssgtapypaiigygggslpapagvaminfnndniaaqvntgsrgqgkfydlygsshsagamtawawgvsrvidalelvpgaridttkigvtgcsrngkgamvagafekrivltlpqesgaggsacwrisdylksqganiqtaseiigedpwfsttfnsyvnqvpvlpfdhhslaaliaprglfvidnnidwlgpqscfgcmtaahmawqalgvsdhmgysqigahahcafpsnqqsqltafvqkfllgqstntaifqsdfsanqsqwidwttptls(seqidno:8)

cel1a(里氏木霉)

mlpkdfqwgfataayqiegavdqdgrgpsiwdtfcaqpgkiadgssgvtacdsynrtaediallkslgaksyrfsiswsriipeggrgdavnqagidhyvkfvddlldagitpfitlfhwdlpeglhqryggllnrtefpldfenyarvmfralpkvrnwitfneplcsaipgygsgtfapgrqstsepwtvghnilvahgravkayrddfkpasgdgqigivlngdftypwdaadpadkeaaerrlefftawfadpiylgdypasmrkqlgdrlptftpeeralvhgsndfygmnhytsnyirhrsspasaddtvgnvdvlftnkqgncigpetqspwlrpcaagfrdflvwiskrygyppiyvtengtsikgesdlpkekileddfrvkyyneyiramvtaveldgvnvkgyfawslmdnfewadgyvtrfgvtyvdyengqkrfpkksakslkplfdeliaaa(seqidno:9)

cel3a(里氏木霉)

mryrtaaalalatgpfaradshstsgasaeavvppagtpwgtaydkakaalaklnlqdkvgivsgvgwnggpcvgntspaskisypslclqdgplgvrystgstaftpgvqaastwdvnlirergqfigeevkasgihvilgpvagplgktpqggrnwegfgvdpyltgiamgqtingiqsvgvqatakhyilneqelnretissnpddrtlhelytwpfadavqanvasvmcsynkvnttwacedqytlqtvlkdqlgfpgyvmtdwnaqhttvqsansgldmsmpgtdfngnnrlwgpaltnavnsnqvptsrvddmvtrilaawyltgqdqagypsfnisrnvqgnhktnvraiardgivllkndanilplkkpasiavvgsaaiignharnspscndkgcddgalgmgwgsgavnypyfvapydaintrassqgtqvtlsntdntssgasaargkdvaivfitadsgegyitvegnagdrnnldpwhngnalvqavagansnvivvvhsvgaiileqilalpqvkavvwaglpsqesgnalvdvlwgdvspsgklvytiakspndyntrivsggsdsfseglfidykhfddanitpryefgyglsytkfnysrlsvlstaksgpatgavvpggpsdlfqnvatvtvdiansgqvtgaevaqlyitypssaprtppkqlrgfaklnltpgqsgtatfnirrrdlsywdtasqkwvvpsgsfgisvgassrdirltstlsva(seqidno:10)

cel5a(里氏木霉)

mnksvaplllaasilyggaaaqqtvwgqcggigwsgptncapgsacstlnpyyaqcipgattittstrppsgpttttratstssstpptssgvrfagvniagfdfgcttdgtcvtskvypplknftgsnnypdgigqmqhfvnddgmtifrlpvgwqylvnnnlggnldstsiskydqlvqgclslgaycivdihnyarwnggiigqggptnaqftslwsqlaskyasqsrvwfgimnephdvnintwaatvqevvtairnagatsqfislpgndwqsagafisdgsaaalsqvtnpdgsttnlifdvhkyldsdnsgthaecttnnidgafsplatwlrqnnrqailtetgggnvqsciqdmcqqiqylnqnsdvylgyvgwgagsfdstyvltetptgsgnswtdtslvssclark(seqidno:11)

cel6a(里氏木霉)

mivgilttlatlatlaasvpleerqacssvwgqcggqnwsgptccasgstcvysndyysqclpgaassssstraasttsrvspttsrsssatpppgstttrvppvgsgtatysgnpfvgvtpwanayyasevsslaipsltgamataaaavakvpsfmwldtldktplmeqtladirtanknggnyagqfvvydlpdrdcaalasngeysiadggvakyknyidtirqivveysdirtllviepdslanlvtnlgtpkcanaqsaylecinyavtqlnlpnvamyldaghagwlgwpanqdpaaqlfanvyknasspralrglatnvanyngwnitsppsytqgnavyneklyihaigpllanhgwsnaffitdqgrsgkqptgqqqwgdwcnvigtgfgirpsantgdslldsfvwvkpggecdgtsdssaprfdshcalpdalqpapqagawfqayfvqlltnanpsfl(seqidno:12)

cel7a(里氏木霉)

myrklavisaflataraqsactlqsethppltwqkcssggtctqqtgsvvidanwrwthatnsstncydgntwsstlcpdnetcaknccldgaayastygvttsgnslsigfvtqsaqknvgarlylmasdttyqeftllgnefsfdvdvsqlpcglngalyfvsmdadggvskyptntagakygtgycdsqcprdlkfingqanvegwepssnnantgigghgsccsemdiweansisealtphpcttvgqeicegdgcggtysdnryggtcdpdgcdwnpyrlgntsfygpgssftldttkkltvvtqfetsgainryyvqngvtfqqpnaelgsysgnelnddyctaeeaefggssfsdkggltqfkkatsggmvlvmslwddyyanmlwldstyptnetsstpgavrgscstssgvpaqvesqspnakvtfsnikfgpigstgnpsggnppggnppgttttrrpatttgsspgptqshygqcggigysgptvcasgttcqvlnpyysqcl(seqidno:13)

cel7b(里氏木霉)

mapsvtlplttailaiarlvaaqqpgtstpevhpklttykctksggcvaqdtsvvldwnyrwmhdanynsctvnggvnttlcpdeatcgkncfiegvdyaasgvttsgssltmnqympsssggyssvsprlylldsdgeyvmlklngqelsfdvdlsalpcgengslylsqmdengganqyntaganygsgycdaqcpvqtwrngtlntshqgfccnemdilegnsranaltphsctatacdsagcgfnpygsgyksyygpgdtvdtsktftiitqfntdngspsgnlvsitrkyqqngvdipsaqpggdtisscpsasaygglatmgkalssgmvlvfsiwndnsqymnwldsgnagpcsstegnpsnilannpnthvvfsnirwgdigsttnstapppppassttfsttrrssttssspsctqthwgqcggigysgcktctsgttcqysndyysqcl(seqidno:14)

cel12a(里氏木霉)

mkflqvlpalipaalaqtscdqwatftgngytvsnnlwgasagsgfgcvtavslsggaswhadwqwsggqnnvksyqnsqiaipqkrtvnsissmpttaswsysgsniranvaydlftaanpnhvtysgdyelmiwlgkygdigpigssqgtvnvggqswtlyygyngamqvysfvaqtnttnysgdvknffnylrdnkgynaagqyvlsyqfgtepftgsgtlnvaswtasin(seqidno:15)

cel45a(里氏木霉)

mkatlvlgslivgavsaykatttryydgqegacgcgsssgafpwqlgigngvytaagsqalfdtagaswcgagcgkcyqltstgqapcsscgtggaagqsiivmvtnlcpnngnaqwcpvvggtnqygysyhfdimaqneifgdnvvvdfepiacpgqaasdwgtclcvgqqetdptpvlgndtgstppgssppatsssppsgggqqtlygqcggagwtgpttcqapgtckvqnqwysqclp(seqidno:16)

cel74a(里氏木霉)

mkvsrvlalvlgavipahaafswknvklgggggfvpgiifhpktkgvayartdigglyrlnaddswtavtdgiadnagwhnwgidavaldpqddqkvyaavgmytnswdpsngaiirssdrgatwsftnlpfkvggnmpgrgagerlavdpansniiyfgarsgnglwkstdggvtfskvssftatgtyipdpsdsngynsdkqglmwvtfdstssttggatsrifvgtadnitasvyvstnagstwsavpgqpgkyfphkaklqpaekalyltysdgtgpydgtlgsvwrydiaggtwkditpvsgsdlyfgfgglgldlqkpgtlvvaslnswwpdaqlfrstdsgttwspiwawasyptetyyysistpkapwiknnfidvtsespsdglikrlgwmiesleidptdsnhwlygtgmtifgghdltnwdtrhnvsiqsladgieefsvqdlasapggsellaavgddngftfasrndlgtspqtvwatptwatstsvdyagnsvksvvrvgntagtqqvaissdggatwsidyaadtsmnggtvaysadgdtilwstassgvqrsqfqgsfasvsslpagaviasdkktnsvfyagsgstfyvskdtgssftrgpklgsagtirdiaahpttagtlyvstdvgifrstdsgttfgqvstaltntyqialgvgsgsnwnlyafgtgpsgarlyasgdsgaswtdiqgsqgfgsidstkvagsgstagqvyvgtngrgvfyaqgtvgggtggtssstkqsssstssasssttlrssvvsttrastvtssrtssaagptgsgvaghyaqcggigwtgptqcvapyvcqkqndyyyqcv(seqidno:17)

paman5a(鹅柄孢壳菌)

mkglfafglgllslvnalpqaqgggaaasakvsgtrfvidgktgyfagtnsywigfltnnrdvdttldhiassglkilrvwgfndvnnqpsgntvwfqrlassgsqintgpnglqrldylvrsaetrgikliialvnywddfggmkayvnafggtkeswytnaraqeqykryiqavvsryvnspaifawelaneprckgcntnvifnwatqisdyirsldkdhlitlgdegfglpgqttypyqygegtdfvknlqiknldfgtfhmypghwgvptsfgpgwikdhaaacraagkpclleeygyesdrcnvqkgwqqasrelsrdgmsgdlfwqwgdqlstgqthndgftiyygsslatclvtdhvrainalpa(seqidno:18)

paman26a(鹅柄孢壳菌)

mvklldiglfalalassavakpckprdgpvtyeaedailtgttvdtaqvgytgrgyvtgfdegsdkitfqissattklydlsiryaaiygdkrtnvvlnngavsevffpagdsftsvaagqvllnagqntidivnnwgwylidsitltpsaprpphdinpnlnnpnadtnakklysylrsvygnkiisgqqelhhaewirqqtgktpalvavdlmdyspsrvergttshavedaiahhnaggivsvlwhwnapvglydteenkwwsgfytratdfdiaatlanpqganytllirdidaiavqlkrleaagvpvlwrplheaeggwfwwgakgpepakqlwdilyerltvhhgldnliwvwnsiledwypgddtvdilsadvyaqgngpmstqynelialgrdkkmiaaaevgaaplpgllqayqanwlwfavwgddfinnpswntvavlneiynsdyvltldeiqgwrs(seqidno:19)

膨胀蛋白(里氏木霉)

magklilvalaslvslsiqqncaalfgqcggigwsgttccvagaqcsfvndwysqclastggnppngttssslvsrtssasssvgssspggnsptgsastytttdtatvaphsqspypsiaasscgswtlvdnvccpsycanddtsescsgcgtcttppsadcksgtmypevhhvssneswhysrsthfgltsggacgfglyglctkgsvtaswtdpmlgatcdafctaypllckdptgttlrgnfaapngdyytqfwsslpgaldnylscgecieliqtkpdgtdyavgeagytdpitleivdscpcsanskwccgpgadhcgeidfkygcplpadsihldlsdiamgrlqgngsltngviptryrrvqcpkvgnayiwlrngggpyyfaltavntngpgsvtkieikgadtdnwvalvhdpnytssrpqerygswvipqgsgpfnlpvgirltsptgeqivneqaiktftppatgdpnfyyidigvqfsqn(seqidno:20)

适用于本发明的酶混合物中的生物质降解酶的其它实例包括来自芽孢杆菌属、鬼伞属、毁丝霉属、头孢霉属、柱顶孢霉属、青霉属、曲霉属、假单胞菌属、腐质霉属、镰刀菌属、梭孢壳属、枝顶孢属、金孢子菌属和木霉属中的种的酶,特别是由选自以下种的菌株产生的那些:曲霉属(参见例如欧洲公布号0458162)、特异腐质霉(重新分类为嗜热柱顶孢霉,参见例如美国专利号4,435,307)、灰盖鬼伞、尖孢镰刀菌、嗜热毁丝霉、大型亚灰树花菌、太瑞斯梭孢壳霉、枝顶孢属种(包括但不限于桃色枝顶孢、a.acremonium、a.brachypenium、a.dichromosporum、a.obclavatum、a.pinkertoniae、灰粉枝顶孢、a.incoloratum和棕色枝顶孢)。优选菌株包括特异腐质霉dsm1800、尖孢镰刀菌dsm2672、嗜热毁丝霉cbs117.65、头孢霉属种rym-202、枝顶孢属种cbs478.94、枝顶孢属种cbs265.95、桃色枝顶孢cbs169.65、acremoniumacremoniumahu9519、头孢霉属种cbs535.71、acremoniumbrachypeniumcbs866.73、acremoniumdichromosporumcbs683.73、acremoniumobclavatumcbs311.74、acremoniumpinkertoniaecbs157.70、灰粉枝顶孢cbs134.56、acremoniumincoloratumcbs146.62和棕色枝顶孢cbs299.70h。生物质降解酶也可从金孢子菌属,优选chrysosporiumlucknowense菌株获得。可使用的额外菌株包括但不限于木霉属(特别是绿色木霉、里氏木霉和康宁木霉)、嗜碱性芽孢杆菌属(alkalophilicbacillus)(参见例如美国专利号3,844,890和欧洲公布号0458162)和链霉菌属(参见例如欧洲公布号0458162)。

在各实施方案中,在相较于未诱导微生物,适于使生物质降解酶的产生增加的条件下诱导微生物来产生本文所述的生物质降解酶。举例来说,使包含如本文所述的生物质的诱导生物质样品与微生物一起孵育以增加生物质降解酶的产生。对诱导过程的进一步描述可见于us2014/0011258中,所述专利的内容据此以引用的方式整体并入。

由以上提及的微生物产生和/或分泌的生物质降解酶可被分离并添加至本发明的混合物中,或直接添加至糖化反应中。或者,在一个实施方案中,在添加至糖化反应中之前,不使以上提及的表达本文和以上所述的生物质降解酶的微生物或宿主细胞溶解。

在一个实施方案中,包含表达一种或多种如本文所述的额外生物质降解酶的宿主细胞的酶混合物可与包含本文所述的具有生物质降解活性的被增溶多肽的混合物一起使用。

相较于不添加被增溶多肽的糖化,本文所述的包含从包涵体增溶的具有生物质降解活性的多肽和增溶剂的混合物的使用不抑制、妨碍或降低由糖化获得的糖产物的产率。在一些实施方案中,在使用本文所述的包含从包涵体增溶的具有生物质降解活性的多肽和增溶剂的混合物后,糖产物的产率增加。相较于当将生物质降解酶的标准混合物添加至糖化中而无含有被增溶多肽和被增溶试剂的混合物时,糖产物的产率增加至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%。

进一步加工

可对由糖化产生的糖进行进一步加工步骤以产生替代性产物。举例来说,糖可被氢化、发酵或用其它化学物质处理以产生其它产物。

葡萄糖可被氢化成山梨糖醇。木糖可被氢化成木糖醇。氢化可通过使用催化剂(例如pt/γ-al2o3、ru/c、雷尼镍(raneynickel)或本领域中已知的其它催化剂)与h2组合在高压(例如10至12000psi)下来实现。可使用本领域中已知的方法分离和纯化山梨糖醇和/或木糖醇产物。

由糖化获得的糖产物也可被发酵以产生醇;糖醇,诸如赤藻糖醇;或有机酸,例如乳酸、谷氨酸或柠檬酸或氨基酸。

酵母和发酵单胞菌属(zymomonas)细菌,例如可用于将一种或多种糖发酵或转化成一种或多种醇。其它微生物在以下进行讨论。最优发酵ph是约ph4至7。举例来说,对于酵母最优的ph是约ph4至5,而对于发酵单胞菌属最优的ph是约ph5至6。典型发酵时间是约24至168小时(例如24至96小时),其中温度在20℃至40℃(例如26℃至40℃)的范围内,然而,嗜热微生物偏好较高温度。

在一些实施方案中,例如当使用厌氧生物体时,至少一部分发酵是在不存在氧的情况下,例如在惰性气体诸如n2、ar、he、co2或其混合物的覆盖层下进行。另外,混合物可具有在部分或全部发酵期间流经储罐的惰性气体的恒定吹扫。在一些情况下,可通过发酵期间的二氧化碳产生来实现或维持厌氧条件而不需要额外惰性气体。

在一些实施方案中,可在低分子量糖完全转化成产物(例如乙醇)之前中断全部或部分发酵过程。中间体发酵产物包括高浓度的糖和碳水化合物。糖和碳水化合物可通过本领域中已知的任何手段进行分离。这些中间体发酵产物可用于制备用于人或动物消耗的食品。另外或可替代地,可在不锈钢实验室磨机中将中间体发酵产物研磨成细小粒子尺寸以产生面粉状物质。

可在发酵期间使用射流混合,并且在一些情况下在同一储罐中进行糖化和发酵。

可在糖化和/或发酵期间添加微生物的营养物,例如在2011年7月15日提交的美国专利申请公布2012/0052536中所述的基于食品的营养物包,所述专利申请公布的完整公开内容以引用的方式并入本文。

″发酵″包括2012年12月22日提交的美国临时申请号61/579,559和2012年12月22日提交的美国临时申请号61/579,576中公开的方法和产物,所述美国临时申请两者的内容均以引用的方式整体并入本文。

可利用移动发酵罐,如在国际申请号pct/us2007/074028(其在2007年7月20日提交,以英语公布为wo2008/011598并且指定美国)中所描述,所述申请的内容以引用的方式整体并入本文。类似地,糖化设备可为移动的。此外,糖化和/或发酵可在转运期间部分或完全地进行。

用于发酵中的微生物可为天然存在的微生物和/或工程改造的微生物。举例来说,微生物可为细菌(包括但不限于例如纤维素分解细菌)、真菌(包括但不限于例如酵母)、植物、原生生物例如原虫或真菌样原生生物(包括但不限于例如粘液霉菌)、或海藻。当生物体可相容时,可利用生物体的混合物。

适合发酵微生物能够使碳水化合物(诸如葡萄糖、果糖、木糖、阿拉伯糖、甘露糖、半乳糖、寡糖或多糖)转化成发酵产物。发酵微生物包括以下种属的菌株:酵母属菌种(saccharomycesspp.)(包括但不限于酿酒酵母(s.cerevisiae)(面包酵母)、糖化酵母(s.distaticus)、葡萄汁酵母(s.uvarum))、克鲁维酵母(kluyveromyces)属(包括但不限于马克斯克鲁维酵母(k.marxianus)、脆壁克鲁维酵母(k.fragilis))、假丝酵母(candida)属(包括但不限于假热带假丝酵母(c.pseudotropicalis)和芸薹假丝酵母(c.brassicae))、树干毕赤酵母(pichiastipitis)(休哈塔假丝酵母(candidashehatae)的亲缘菌)、棒孢酵母(clavispora)属(包括但不限于葡萄牙棒孢酵母(c.lusitaniae)和仙人掌棒孢酵母(c.opuntiae))、管囊酵母(pachysolen)属(包括但不限于嗜鞣管囊酵母(p.tannophilus))、酒香酵母(bretannomyces)属(包括但不限于,例如铁红梅氏酒香酵母(b.clausenii)(handbookonbioethanol:productionandutilization,wyman,c.e.编,taylor&francis,washington,d.c.,179-212中的philippidis,g.p.,1996,cellulosebioconversiontechnology))。其它适合微生物包括例如运动发酵单胞菌(zymomonasmobilis)、梭菌属菌种(clostridiumspp.)(包括但不限于热纤维梭菌(c.thermocellum)(philippidis,1996,同上)、糖丁基丙酮梭菌(c.saccharobutylacetonicum)、糖丁酸梭菌(c.saccharobutylicum)、略紫色梭菌(c.puniceum)、拜氏梭菌(c.beijernckii)以及丙酮丁醇梭菌(c.acetobutylicum))、丛梗孢酵母(moniliellapollinis)、moniliellamegachiliensis、乳酸杆菌属种(lactobacillusspp.)、解脂耶氏酵母(yarrowialipolytica)、短梗霉属菌种(aureobasidiumsp.)、三型孢菌属菌种(trichosporonoidessp.)、变异三角酵母(trigonopsisvariabilis)、毛孢子菌属菌种(trichosporonsp.)、丛梗孢酵母属菌种(moniliellaacetoabutanssp.)、变异核瑚菌(typhulavariabilis)、木兰假丝酵母(candidamagnoliae)、黑粉菌纲属菌种(ustilaginomycetessp.)、筑波拟酵母(pseudozymatsukubaensis)、接合酵母属(zygosaccharomyces)的酵母种、德巴利酵母属(debaryomyces)、汉逊酵母属(hansenula)和毕赤酵母属(pichia)、以及暗丛梗孢形圆酵母属(torula)的真菌。

举例来说,梭菌属种可用于产生乙醇、丁醇、丁酸、乙酸和丙酮。乳酸杆菌属种可用于产生乳酸。

许多所述微生物菌株可公开商购获得抑或通过储藏所获得,所述储藏所如诸如atcc(美国典型培养物保藏中心(americantypeculturecollection),manassas,va.,usa)、nrrl(农业研究服务培养物保藏中心(agriculturalresearchserviceculturecollection),peoria,ill.,usa)或dsmz(德意志微生物保藏中心(deutschesammlungvonmikroorganismenandzellkulturengmbh),braunschweig,germany)。

可商购获得的酵母包括例如red/乐斯福乙醇红(lesaffreethanolred)(可从redstar/lesaffre,usa获得)、(可从fleischmann′syeast(bumsphilipfoodinc.的部门),usa获得)、(可从alltech,现在的lalemand获得)、gert(可从gertstrandab,sweden获得)以及(可从dsmspecialties获得)。

可用于糖化生物质材料和产生糖的许多微生物也可用于使那些糖发酵和转化成有用产物。

在发酵之后,可使用例如″醪塔″蒸馏所得流体以使乙醇和其它醇与大部分水和残余固体分离。出醪塔的蒸汽可为例如35重量%乙醇并且可被供应至精馏塔中。可使用汽相分子筛将来自精馏塔的接近共沸的(92.5%)乙醇与水的混合物纯化为纯(99.5%)乙醇。可将醪塔底部物传送至三效蒸发器的第一效。精馏塔回流冷凝器可为这个第一效提供热量。在第一效之后,可使用离心机分离固体并且在旋转干燥器中干燥。可将离心机流出液的一部分(25%)再循环至发酵,并且将其余部分传送至第二效蒸发器和第三效蒸发器中。大部分蒸发器冷凝液可作为相当干净的冷凝液返回所述过程中,其中分离一小部分至废水处理以防止低沸点化合物的积聚。

可使用由本文所述的方法获得的产物的其它类型的化学转化,例如产生有机糖衍生产物(例如糠醛和糠醛衍生产物)。糖衍生产物的化学转化描述于2012年7月3日提交的美国临时申请号61/667,481中,所述美国临时申请的公开内容以引用的方式整体并入本文。

实施例

通过参照以下实验实施例来进一步详述本发明。除非另外规定,否则这些实施例仅出于说明的目的提供,并且不意图具有限制性。因此,本发明决不应解释为限于以下实施例,而是应解释为涵盖由于本文提供的教义而变得明显的任何和所有变化形式。

在不进一步描述的情况下,据信本领域普通技术人员可使用先前描述和以下说明性实施例制备和利用本发明化合物以及实施要求保护的方法。以下操作实施例明确指出本发明的各个方面,并且不应解释为以任何方式限制本公开的其余部分。

实施例1:在大肠杆菌中表达cel3a-c'his

成熟cel3a序列(氨基酸20-744)由genewiz合成并针对大肠杆菌表达进行密码子优化。在以下实施例中提及的cel3a-c'his是指在c末端具有8xhis(seqidno:21)标签的密码子优化的成熟cel3a序列(aa20-744)。以下引物用于将cel3a-c'his克隆至pet-duet(novagen,目录号71146)中:

正向5'-catgccggcgatagtcacagtaccagc(seqidno:4)

反向3'-cccaagctggcaacactcagggtgc(seqidno:5)

(ncoi和hindiii位点被加下划线;起始密码子和终止密码子用粗体表示;聚组氨酸(8-his(seqidno:21)标签;和甘氨酸-丝氨酸(gsgs(seqidno:23))接头用斜体表示。)

使用pfuultraiifusionhs聚合酶(agilent,目录号600672)进行扩增反应。

通过使用ncoi限制酶(newenglandbiolabs,r3193)和hindiii限制酶(newenglandbiolabs,r3104)在由制造商建议的条件下进行限制消化来克隆扩增的dna。使用t4dna连接酶(newenglandbiolabs,m0202)将消化的扩增dna连接至petduet载体中的ncoi-hindiii位点中,随后转化大肠杆菌克隆宿主top10oneshot(invitrogen)。使用qiagen的质粒纯化试剂盒进行质粒纯化。

将cel3a-c'his构建体转化至大肠杆菌表达宿主origamib(de3)(emdmillipore,目录号70837)中,并且在含有lb培养基和100μg/ml氨苄青霉素(fisherscientific,目录号bp1760)、15μg/ml卡那霉素(kanamysin)(fisherscientific,目录号bp906)和12.5μg/ml四环素(fisherscientified,目录号bp912)的板上划线。从板挑选携带重组dna的菌落以接种2ml起子培养物(starterculture),并且在37℃下生长过夜,接着随后用于接种100ml含有适当抗生素的lb培养基。使培养物在37℃下生长直至od600达到0.8。

为诱导蛋白质表达,添加500μmiptg(异丙基-b-d-硫代半乳糖吡喃糖苷;fisherscientific,目录号bp1755)。使表达培养物在37℃下进一步再生长4小时。通过使用sorvallst16转子tx400,在室温(rt)下在4200下离心30分钟来收集细胞。

实施例2:从不溶性部分增溶cel3a

培养表达具有生物质降解活性的酶cel3a的大肠杆菌培养物,并且诱导酶表达,如实施例1中所述。如下进行从可溶性部分和不溶性部分分离在c末端用his标签标记的cel3a(cel3a-c'his)。在4200rpm下离心细胞培养物30分钟。丢弃上清液,并且将细胞沉淀再混悬于具有1mg/ml溶菌酶的溶解缓冲液中。添加溶解酶,例如每克细胞糊状物10μl溶解酶生物处理试剂(lysonasebioprocessingreagent)(emdmillipore71320),并且在环境温度下孵育样品1小时。在1小时之后,以30秒间隔对样品进行声波处理总计2分钟。在声波处理之后,在10000rpm下离心样品30分钟。上清液或可溶性部分含有被增溶cel3a,而剩余沉淀或不溶性部分含有包涵体和不溶性cel3a。

将不溶性部分再混悬于含有增溶剂的缓冲液中持续15分钟,并且在室温下涡旋,所述缓冲液具体来说是含6m尿素的ph8imac结合缓冲液。接着将样品经0.45μm膜过滤以为imac纯化做准备。添加的含6m尿素的ph8imac结合缓冲液的量与细胞团块的量成比例,例如2或3体积的缓冲液对1体积的细胞团块。结合缓冲液的量随着细胞团块增加而增加以使得对样品的过滤是可能的。

实施例3:cel3a的纯化

可溶性cel3a的纯化

将来自实施例2的可溶性部分转移至含有100ul预平衡bio-scaletmprofinity(biorad)ni装料imac树脂浆液(biorad,目录号732-4614)的新管中。非变性结合缓冲液含有50mmtrishcl(ph7.5)、150mmnacl、0.1%曲通x-100和5μm咪唑。使蛋白质在室温(rt)下分批结合1小时,接着用含有25μm咪唑的非变性缓冲液洗涤。将蛋白质洗脱于300ul含有200μm咪唑的非变性缓冲液中。

不溶性cel3a的纯化

用5个柱体积的含6m尿素的ph8imac结合缓冲液以5ml/min的流速使5mlbio-scaletm小型profinityimac柱筒(biorad,目录号732-4614)平衡。在柱平衡之后,将来自实施例2的再混悬不溶性部分以1ml/min的流速上样。柱接着接受15个柱体积的含6m尿素的ph8imac结合缓冲液在5ml/min的流速下洗涤。接着用10个柱体积的含6m尿素的ph4imac洗脱缓冲液以5ml/min的流速从柱洗脱被增溶cel3a。所得被增溶cel3a样品含有6m尿素。

进行imac色谱分析(使用imac柱,5mlbio-scaletm小型profinitytmimac柱筒,目录号732-4614),并且如图1中所示,检测纯化的被增溶cel3a。

进行sds-page分析以评估以下各部分中由上述纯化获得的cel3a的量:纯化的可溶性cel3a(图2中的泳道2);由对不溶性部分的imac纯化获得的流过物(图2中的泳道3);和来自不溶性部分的纯化cel3a(被增溶cel3a)(图2中的泳道4)。如图2中所示,使用上述方法从不溶性部分的包涵体成功分离cel3a。

实施例4:分析被增溶cel3a的纤维二糖酶活性

如实施例3中所述,使用imac技术纯化cel3a。在进行活性测定之前,使用布拉德福德测定和/或nanodrop测定纯化cel3a的量(效价)。对于nanodrop定量,通过将目标形式的cel3a的氨基酸序列插入expasyprotparam在线工具中来估计摩尔消光系数。

对于活性测定,使用50mm柠檬酸钠,ph5.0naoh作为缓冲液制备含有纯化cel3a的样品的两倍连续稀释液。跨越96孔板的一行来等分稀释液。使稀释液与d-(+)-纤维二糖(fluka)底物溶液一起在48℃下在50mm柠檬酸二氢钠缓冲液中在ph5.0下孵育30分钟。使用粘性板密封膜(adhesiveplateseal)将板立刻密封,并且放置在设置在48℃、700rpm下的微板孵育振荡器上。在30分钟之后,在加热干燥浴上在100℃下加热样品5分钟以终止反应。接着将板经96孔形式0.45μmdurapore膜过滤。使用ysi生物化学分析仪(ysilifesciences)和/或hplc(uplc)方法分析滤液样品中的葡萄糖和纤维二糖。将来自可溶性部分和不溶性部分的纯化cel3a的稀释液的纤维二糖酶活性绘制在图上,并且结果显示于图3中。图3显示即使在尿素存在下,被增溶cel3a具有纤维二糖酶活性。

也评估尚未通过实施例3中所述的imac纯化方法纯化的被增溶cel3a的纤维二糖酶活性。用溶解缓冲液洗涤表达cel3a的细胞的细胞沉淀,随后用含有6m尿素的增溶缓冲液增溶。通过上述纤维二糖酶测定来测定于6m尿素缓冲液中含有被增溶cel3a的粗制溶解产物样品的纤维二糖酶活性。在可溶性cel3a、可溶性洗涤物和来自粗制溶解产物的被增溶cel3a之间比较在30分钟内转化成葡萄糖的纤维二糖的百分比(图4)。未经纯化的被增溶cel3a也具有纤维二糖酶活性。

等效案

本文引用的各个和每个专利、专利申请和公布的公开内容都据此以引用的方式整体并入本文。尽管已参照特定方面来公开本发明,但明显的是本发明的其它方面和变化形式可由本领域其它技术人员在不脱离本发明的真实精神和范围下进行设计。随附权利要求意图解释为包括所有所述方面和等效变化形式。

序列表

<110>xyleco,inc.

<120>被增溶酶及其用途

<130>x2002-7003wo

<140>

<141>

<150>62/055,702

<151>2014-09-26

<160>23

<170>patentin3.5版

<210>1

<211>731

<212>prt

<213>里氏木霉

<400>1

metglyaspserhisserthrserglyalaseralaglualavalval

151015

proproalaglythrprotrpglythralatyrasplysalalysala

202530

alaleualalysleuasnleuglnasplysvalglyilevalsergly

354045

valglytrpasnglyglyprocysvalglyasnthrserproalaser

505560

lysilesertyrproserleucysleuglnaspglyproleuglyval

65707580

argtyrserthrglyserthralaphethrproglyvalglnalaala

859095

serthrtrpaspvalasnleuilearggluargglyglnpheilegly

100105110

glugluvallysalaserglyilehisvalileleuglyprovalala

115120125

glyproleuglylysthrproglnglyglyargasntrpgluglyphe

130135140

glyvalaspprotyrleuthrglyilealametglyglnthrileasn

145150155160

glyileglnservalglyvalglnalathralalyshistyrileleu

165170175

asngluglngluleuasnarggluthrileserserasnproaspasp

180185190

argthrleuhisgluleutyrthrtrpprophealaaspalavalgln

195200205

alaasnvalalaservalmetcyssertyrasnlysvalasnthrthr

210215220

trpalacysgluaspglntyrthrleuglnthrvalleulysaspgln

225230235240

leuglypheproglytyrvalmetthrasptrpasnalaglnhisthr

245250255

thrvalglnseralaasnserglyleuaspmetsermetproglythr

260265270

asppheasnglyasnasnargleutrpglyproalaleuthrasnala

275280285

valasnserasnglnvalprothrserargvalaspaspmetvalthr

290295300

argileleualaalatrptyrleuthrglyglnaspglnalaglytyr

305310315320

proserpheasnileserargasnvalglnglyasnhislysthrasn

325330335

valargalailealaargaspglyilevalleuleulysasnaspala

340345350

asnileleuproleulyslysproalaserilealavalvalglyser

355360365

alaalaileileglyasnhisalaargasnserprosercysasnasp

370375380

lysglycysaspaspglyalaleuglymetglytrpglyserglyala

385390395400

valasntyrprotyrphevalalaprotyraspalaileasnthrarg

405410415

alaserserglnglythrglnvalthrleuserasnthraspasnthr

420425430

serserglyalaseralaalaargglylysaspvalalailevalphe

435440445

ilethralaaspserglygluglytyrilethrvalgluglyasnala

450455460

glyaspargasnasnleuaspprotrphisasnglyasnalaleuval

465470475480

glnalavalalaglyalaasnserasnvalilevalvalvalhisser

485490495

valglyalaileileleugluglnileleualaleuproglnvallys

500505510

alavalvaltrpalaglyleuproserglngluserglyasnalaleu

515520525

valaspvalleutrpglyaspvalserproserglylysleuvaltyr

530535540

thrilealalysserproasnasptyrasnthrargilevalsergly

545550555560

glyseraspserphesergluglyleupheileasptyrlyshisphe

565570575

aspaspalaasnilethrproargtyrglupheglytyrglyleuser

580585590

tyrthrlyspheasntyrserargleuservalleuserthralalys

595600605

serglyproalathrglyalavalvalproglyglyproseraspleu

610615620

pheglnasnvalalathrvalthrvalaspilealaasnserglygln

625630635640

valthrglyalagluvalalaglnleutyrilethrtyrproserser

645650655

alaproargthrproprolysglnleuargglyphealalysleuasn

660665670

leuthrproglyglnserglythralathrpheasnileargargarg

675680685

aspleusertyrtrpaspthralaserglnlystrpvalvalproser

690695700

glyserpheglyileservalglyalaserserargaspileargleu

705710715720

thrserthrleuservalalaglyserglyser

725730

<210>2

<211>2232

<212>dna

<213>里氏木霉

<400>2

atgcgttaccgaacagcagctgcgctggcacttgccactgggccctttgctagggcagac60

agtcactcaacatcgggggcctcggctgaggcagttgtacctcctgcagggactccatgg120

ggaaccgcgtacgacaaggcgaaggccgcattggcaaagctcaatctccaagataaggtc180

ggcatcgtgagcggtgtcggctggaacggcggtccttgcgttggaaacacatctccggcc240

tccaagatcagctatccatcgctatgccttcaagacggacccctcggtgttcgatactcg300

acaggcagcacagcctttacgccgggcgttcaagcggcctcgacgtgggatgtcaatttg360

atccgcgaacgtggacagttcatcggtgaggaggtgaaggcctcggggattcatgtcata420

cttggtcctgtggctgggccgctgggaaagactccgcagggcggtcgcaactgggagggc480

ttcggtgtcgatccatatctcacgggcattgccatgggtcaaaccatcaacggcatccag540

tcggtaggcgtgcaggcgacagcgaagcactatatcctcaacgagcaggagctcaatcga600

gaaaccatttcgagcaacccagatgaccgaactctccatgagctgtatacttggccattt660

gccgacgcggttcaggccaatgtcgcttctgtcatgtgctcgtacaacaaggtcaatacc720

acctgggcctgcgaggatcagtacacgctgcagactgtgctgaaagaccagctggggttc780

ccaggctatgtcatgacggactggaacgcacagcacacgactgtccaaagcgcgaattct840

gggcttgacatgtcaatgcctggcacagacttcaacggtaacaatcggctctggggtcca900

gctctcaccaatgcggtaaatagcaatcaggtccccacgagcagagtcgacgatatggtg960

actcgtatcctcgccgcatggtacttgacaggccaggaccaggcaggctatccgtcgttc1020

aacatcagcagaaatgttcaaggaaaccacaagaccaatgtcagggcaattgccagggac1080

ggcatcgttctgctcaagaatgacgccaacatcctgccgctcaagaagcccgctagcatt1140

gccgtcgttggatctgccgcaatcattggtaaccacgccagaaactcgccctcgtgcaac1200

gacaaaggctgcgacgacggggccttgggcatgggttggggttccggcgccgtcaactat1260

ccgtacttcgtcgcgccctacgatgccatcaataccagagcgtcttcgcagggcacccag1320

gttaccttgagcaacaccgacaacacgtcctcaggcgcatctgcagcaagaggaaaggac1380

gtcgccatcgtcttcatcaccgccgactcgggtgaaggctacatcaccgtggagggcaac1440

gcgggcgatcgcaacaacctggatccgtggcacaacggcaatgccctggtccaggcggtg1500

gccggtgccaacagcaacgtcattgttgttgtccactccgttggcgccatcattctggag1560

cagattcttgctcttccgcaggtcaaggccgttgtctgggcgggtcttccttctcaggag1620

agcggcaatgcgctcgtcgacgtgctgtggggagatgtcagcccttctggcaagctggtg1680

tacaccattgcgaagagccccaatgactataacactcgcatcgtttccggcggcagtgac1740

agcttcagcgagggactgttcatcgactataagcacttcgacgacgccaatatcacgccg1800

cggtacgagttcggctatggactgtcttacaccaagttcaactactcacgcctctccgtc1860

ttgtcgaccgccaagtctggtcctgcgactggggccgttgtgccgggaggcccgagtgat1920

ctgttccagaatgtcgcgacagtcaccgttgacatcgcaaactctggccaagtgactggt1980

gccgaggtagcccagctgtacatcacctacccatcttcagcacccaggacccctccgaag2040

cagctgcgaggctttgccaagctgaacctcacgcctggtcagagcggaacagcaacgttc2100

aacatccgacgacgagatctcagctactgggacacggcttcgcagaaatgggtggtgccg2160

tcggggtcgtttggcatcagcgtgggagcgagcagccgggatatcaggctgacgagcact2220

ctgtcggtagcg2232

<210>3

<211>2232

<212>dna

<213>人工序列

<220>

<223>人工序列的描述:合成

多核苷酸

<400>3

atgcgttatcgtacagccgcagccctggcactggccacaggtccgttcgcacgtgccgat60

agtcacagtaccagcggtgccagcgcagaagccgtggttccgccggcaggcacaccgtgg120

ggcacagcctatgataaagccaaagccgccctggccaagctgaatctgcaggataaagtg180

ggcatcgtgagtggcgtgggctggaacggtggtccgtgcgttggcaacaccagcccggca240

agcaagatcagctatccgagcttatgcctgcaggatggtccgctgggcgtgcgctatagc300

accggtagtaccgcctttacacctggtgtgcaggccgccagtacctgggacgttaacctg360

atccgcgaacgtggccaatttatcggcgaagaagttaaagccagcggcattcatgttatt420

ctgggtccggtggccggtcctctgggtaaaaccccgcagggcggccgtaattgggaaggc480

ttcggcgttgatccgtatttaaccggcatcgcaatgggccagaccattaatggcatccag540

agcgtgggtgttcaagccaccgccaaacactacatattaaacgaacaggaactgaatcgt600

gaaaccatcagcagcaatccggatgatcgcaccctgcatgagctgtatacatggcctttt660

gccgacgcagttcaggccaacgtggcaagtgtgatgtgtagctataacaaggtgaacacc720

acctgggcctgcgaagaccagtacaccctgcagaccgttttaaaagaccaactgggcttc780

cctggttacgtgatgacagattggaatgcccagcacacaaccgttcagagcgcaaacagt840

ggcctggatatgagcatgccgggcaccgacttcaacggcaataatcgtctgtggggtccg900

gcactgaccaatgccgttaacagcaaccaggtgccgaccagtcgtgtggacgatatggtt960

acccgtattctggccgcctggtacctgacaggtcaagaccaggccggctacccgagcttc1020

aacatcagccgcaacgtgcagggtaatcacaagaccaacgttcgcgcaatcgcacgcgat1080

ggtatcgtgctgttaaagaacgatgccaacattctgccgctgaaaaaaccggccagcatc1140

gccgttgttggtagcgcagccatcattggcaaccacgcccgtaacagtccgagctgcaat1200

gataaaggctgtgacgacggtgccctgggcatgggttggggtagtggtgccgtgaactac1260

ccgtatttcgtggccccgtacgacgccattaacacccgtgcaagtagccagggtacccag1320

gttaccctgagcaacaccgacaacacaagcagcggtgccagtgcagcacgtggtaaggat1380

gtggccatcgtgttcatcaccgccgacagcggcgaaggctacattaccgtggagggtaat1440

gccggtgatcgcaataatctggacccgtggcataacggcaacgccctggttcaggcagtg1500

gcaggcgcaaatagcaacgtgatcgttgtggtgcatagcgtgggtgccatcattctggag1560

cagatcctggccctgccgcaagttaaggcagttgtgtgggcaggtctgccgagccaagaa1620

agtggcaatgccctggtggacgttctgtggggcgatgttagtccgagcggcaagctggtg1680

tatacaatcgccaagagcccgaacgactataacacccgcatcgttagcggcggcagtgat1740

agcttcagcgagggcctgtttatcgactacaagcatttcgatgatgccaatattaccccg1800

cgctacgaatttggttatggcctgagctataccaagttcaactacagccgcctgagcgtt1860

ttaagtaccgccaagagtggtccggcaacaggtgccgtggttcctggtggtccgagtgat1920

ctgtttcagaatgtggccaccgtgaccgtggatatcgccaacagtggtcaggttaccggc1980

gccgaagtggcacagctgtacatcacctatccgagcagtgcaccgcgcaccccgccgaaa2040

cagctgcgtggcttcgccaaattaaacctgaccccgggccagagcggtacagcaaccttc2100

aatattcgccgccgtgatctgagctattgggacaccgccagccaaaaatgggtggtgccg2160

agcggcagctttggcattagtgtgggtgcaagtagccgcgacattcgcttaacaagcacc2220

ctgagtgttgcc2232

<210>4

<211>30

<212>dna

<213>人工序列

<220>

<223>人工序列的描述:合成

引物

<400>4

catgccatgggcgatagtcacagtaccagc30

<210>5

<211>68

<212>dna

<213>人工序列

<220>

<223>人工序列的描述:合成

引物

<400>5

cgtgggactcacaacggccgtcgccgtcggtagtagtagtagtagtagtagtgattactt60

tcgaaccc68

<210>6

<211>800

<212>prt

<213>鹅柄孢壳菌

<400>6

metlysserservalphetrpglyalaserleuthrseralavalval

151015

argalaileaspleupropheglnphetyrproasncysvalaspasp

202530

leuleuserthrasnglnvalcysasnthrthrleuserproproglu

354045

argalaalaalaleuvalalaalaleuthrprogluglulysleugln

505560

asnilevalserlysserleuglyalaproargileglyleuproala

65707580

tyrasntrptrpserglualaleuhisglyvalalatyralaprogly

859095

thrglnphetrpglnglyaspglypropheasnserserthrserphe

100105110

prometproleuleumetalaalathrpheaspaspgluleuleuglu

115120125

lysilealagluvalileglyilegluglyargalapheglyasnala

130135140

glypheserglyleuasptyrtrpthrproasnvalasnprophelys

145150155160

aspproargtrpglyargglysergluthrproglygluaspvalleu

165170175

leuvallysargtyralaalaalametilelysglyleugluglypro

180185190

valproglulysgluargargvalvalalathrcyslyshistyrala

195200205

alaasnaspphegluasptrpasnglyalathrarghisasnpheasn

210215220

alalysileserleuglnaspmetalaglutyrtyrphemetprophe

225230235240

glnglncysvalargaspserargvalglyserilemetcysalatyr

245250255

asnalavalasnglyvalprosercysalaserprotyrleuleugln

260265270

thrileleuarggluhistrpasntrpthrgluhisasnasntyrile

275280285

thrseraspcysglualavalleuaspvalserleuasnhislystyr

290295300

alaalathrasnalagluglythralaileserpheglualaglymet

305310315320

aspthrsercysglutyrgluglyserseraspileproglyalatrp

325330335

serglnglyleuleulysgluserthrvalaspargalaleuleuarg

340345350

leutyrgluglyilevalargalaglytyrpheaspglylysglnser

355360365

leutyrserserleuglytrpalaaspvalasnlysproseralagln

370375380

lysleuserleuglnalaalavalaspglythrvalleuleulysasn

385390395400

aspglythrleuproleuseraspleuleuasplysserargprolys

405410415

lysvalalametileglyphetrpseraspalalysasplysleuarg

420425430

glyglytyrserglythralaalatyrleuhisthrproalatyrala

435440445

alaserglnleuglyilepropheserthralaserglyproileleu

450455460

hisseraspleualaserasnglnsertrpthraspasnalametala

465470475480

alaalalysaspalaasptyrileleutyrpheglyglyileaspthr

485490495

seralaalaglygluthrlysaspargtyraspleuasptrpprogly

500505510

alaglnleuserleuileasnleuleuthrthrleuserlysproleu

515520525

ilevalleuglnmetglyaspglnleuaspasnthrproleuleuser

530535540

asnprolysileasnalaileleutrpalaasntrpproglyglnasp

545550555560

glyglythralavalmetgluleuvalthrglyleulysserproala

565570575

glyargleuprovalthrglntyrproserasnphethrgluleuval

580585590

prometthraspmetalaleuargproseralaglyasnserglnleu

595600605

glyargthrtyrargtrptyrlysthrprovalglnalapheglyphe

610615620

glyleuhistyrthrthrpheserprolyspheglylyslysphepro

625630635640

alavalileaspvalaspgluvalleugluglycysaspasplystyr

645650655

leuaspthrcysproleuproaspleuprovalvalvalgluasnarg

660665670

glyasnargthrserasptyrvalalaleualaphevalseralapro

675680685

glyvalglyproglyprotrpproilelysthrleuglyalaphethr

690695700

argleuargglyvallysglyglyglulysarggluglyglyleulys

705710715720

trpasnleuglyasnleualaarghisaspglugluglyasnthrval

725730735

valtyrproglylystyrgluvalserleuaspgluproprolysala

740745750

argleuargphegluilevalargglyglylysglylysglylysval

755760765

lysglylysglylysalaalaglnlysglyglyvalvalleuasparg

770775780

trpprolysproprolysglyglngluproproalailegluargval

785790795800

<210>7

<211>316

<212>prt

<213>里氏木霉

<400>7

metvalargargthralaleuleualaleuglyalaleuserthrleu

151015

sermetalaglnileseraspaspphegluserglytrpaspglnthr

202530

lystrpproileseralaproaspcysasnglnglyglythrvalser

354045

leuaspthrthrvalalahisserglyserasnsermetlysvalval

505560

glyglyproasnglytyrcysglyhisilephepheglythrthrgln

65707580

valprothrglyaspvaltyrvalargalatrpileargleuglnthr

859095

alaleuglyserasnhisvalthrpheileilemetproaspthrala

100105110

glnglyglylyshisleuargileglyglyglnserglnvalleuasp

115120125

tyrasnarggluseraspaspalathrleuproaspleuserproasn

130135140

glyilealaserthrvalthrleuprothrglyalapheglncysphe

145150155160

glutyrhisleuglythraspglythrilegluthrtrpleuasngly

165170175

serleuileproglymetthrvalglyproglyvalaspasnproasn

180185190

aspalaglytrpthrargalasertyrileprogluilethrglyval

195200205

asnpheglytrpglualatyrserglyaspvalasnthrvaltrpphe

210215220

aspaspileserilealaserthrargvalglycysglyproglyser

225230235240

proglyglyproglyserserthrthrglyargserserthrsergly

245250255

prothrserthrserargproserthrthrileproproprothrser

260265270

argthrthrthralathrglyprothrglnthrhistyrglyglncys

275280285

glyglyileglytyrserglyprothrvalcysalaserglythrthr

290295300

cysglnvalleuasnprotyrtyrserglncysleu

305310315

<210>8

<211>460

<212>prt

<213>里氏木霉

<400>8

metalaserargphephealaleuleuleuleualaileproilegln

151015

alaglnserprovaltrpglyglncysglyglyileglytrpsergly

202530

prothrthrcysvalglyglyalathrcysvalsertyrasnprotyr

354045

tyrserglncysileproserthrglnalaserserserilealaser

505560

thrthrleuvalthrserphethrthrthrthralathrargthrser

65707580

alaserthrproproalaserserthrglyalaglyglyalathrcys

859095

seralaleuproglyserilethrleuargserasnalalysleuasn

100105110

aspleuphethrmetpheasnglyasplysvalthrthrlysasplys

115120125

phesercysargglnalaglumetsergluleuileglnargtyrglu

130135140

leuglythrleuproglyargproserthrleuthralaserpheser

145150155160

glyasnthrleuthrileasncysglyglualaglylysserileser

165170175

phethrvalthrilethrtyrproserserglythralaprotyrpro

180185190

alaileileglytyrglyglyglyserleuproalaproalaglyval

195200205

alametileasnpheasnasnaspasnilealaalaglnvalasnthr

210215220

glyserargglyglnglylysphetyraspleutyrglyserserhis

225230235240

seralaglyalametthralatrpalatrpglyvalserargvalile

245250255

aspalaleugluleuvalproglyalaargileaspthrthrlysile

260265270

glyvalthrglycysserargasnglylysglyalametvalalagly

275280285

alapheglulysargilevalleuthrleuproglngluserglyala

290295300

glyglyseralacystrpargileserasptyrleulysserglngly

305310315320

alaasnileglnthralasergluileileglygluaspprotrpphe

325330335

serthrthrpheasnsertyrvalasnglnvalprovalleuprophe

340345350

asphishisserleualaalaleuilealaproargglyleupheval

355360365

ileaspasnasnileasptrpleuglyproglnsercyspheglycys

370375380

metthralaalahismetalatrpglnalaleuglyvalserasphis

385390395400

metglytyrserglnileglyalahisalahiscysalapheproser

405410415

asnglnglnserglnleuthralaphevalglnlyspheleuleugly

420425430

glnserthrasnthralailepheglnserasppheseralaasngln

435440445

serglntrpileasptrpthrthrprothrleuser

450455460

<210>9

<211>466

<212>prt

<213>里氏木霉

<400>9

metleuprolysasppheglntrpglyphealathralaalatyrgln

151015

ilegluglyalavalaspglnaspglyargglyproseriletrpasp

202530

thrphecysalaglnproglylysilealaaspglyserserglyval

354045

thralacysaspsertyrasnargthralagluaspilealaleuleu

505560

lysserleuglyalalyssertyrargpheserilesertrpserarg

65707580

ileileprogluglyglyargglyaspalavalasnglnalaglyile

859095

asphistyrvallysphevalaspaspleuleuaspalaglyilethr

100105110

propheilethrleuphehistrpaspleuprogluglyleuhisgln

115120125

argtyrglyglyleuleuasnargthrglupheproleuasppheglu

130135140

asntyralaargvalmetpheargalaleuprolysvalargasntrp

145150155160

ilethrpheasngluproleucysseralaileproglytyrglyser

165170175

glythrphealaproglyargglnserthrsergluprotrpthrval

180185190

glyhisasnileleuvalalahisglyargalavallysalatyrarg

195200205

aspaspphelysproalaserglyaspglyglnileglyilevalleu

210215220

asnglyaspphethrtyrprotrpaspalaalaaspproalaasplys

225230235240

glualaalagluargargleugluphephethralatrpphealaasp

245250255

proiletyrleuglyasptyrproalasermetarglysglnleugly

260265270

aspargleuprothrphethrproglugluargalaleuvalhisgly

275280285

serasnaspphetyrglymetasnhistyrthrserasntyrilearg

290295300

hisargserserproalaseralaaspaspthrvalglyasnvalasp

305310315320

valleuphethrasnlysglnglyasncysileglyprogluthrgln

325330335

serprotrpleuargprocysalaalaglypheargasppheleuval

340345350

trpileserlysargtyrglytyrproproiletyrvalthrgluasn

355360365

glythrserilelysglygluseraspleuprolysglulysileleu

370375380

gluaspasppheargvallystyrtyrasnglutyrileargalamet

385390395400

valthralavalgluleuaspglyvalasnvallysglytyrpheala

405410415

trpserleumetaspasnpheglutrpalaaspglytyrvalthrarg

420425430

pheglyvalthrtyrvalasptyrgluasnglyglnlysargphepro

435440445

lyslysseralalysserleulysproleupheaspgluleuileala

450455460

alaala

465

<210>10

<211>744

<212>prt

<213>里氏木霉

<400>10

metargtyrargthralaalaalaleualaleualathrglyprophe

151015

alaargalaaspserhisserthrserglyalaseralaglualaval

202530

valproproalaglythrprotrpglythralatyrasplysalalys

354045

alaalaleualalysleuasnleuglnasplysvalglyilevalser

505560

glyvalglytrpasnglyglyprocysvalglyasnthrserproala

65707580

serlysilesertyrproserleucysleuglnaspglyproleugly

859095

valargtyrserthrglyserthralaphethrproglyvalglnala

100105110

alaserthrtrpaspvalasnleuilearggluargglyglnpheile

115120125

glyglugluvallysalaserglyilehisvalileleuglyproval

130135140

alaglyproleuglylysthrproglnglyglyargasntrpglugly

145150155160

pheglyvalaspprotyrleuthrglyilealametglyglnthrile

165170175

asnglyileglnservalglyvalglnalathralalyshistyrile

180185190

leuasngluglngluleuasnarggluthrileserserasnproasp

195200205

aspargthrleuhisgluleutyrthrtrpprophealaaspalaval

210215220

glnalaasnvalalaservalmetcyssertyrasnlysvalasnthr

225230235240

thrtrpalacysgluaspglntyrthrleuglnthrvalleulysasp

245250255

glnleuglypheproglytyrvalmetthrasptrpasnalaglnhis

260265270

thrthrvalglnseralaasnserglyleuaspmetsermetprogly

275280285

thrasppheasnglyasnasnargleutrpglyproalaleuthrasn

290295300

alavalasnserasnglnvalprothrserargvalaspaspmetval

305310315320

thrargileleualaalatrptyrleuthrglyglnaspglnalagly

325330335

tyrproserpheasnileserargasnvalglnglyasnhislysthr

340345350

asnvalargalailealaargaspglyilevalleuleulysasnasp

355360365

alaasnileleuproleulyslysproalaserilealavalvalgly

370375380

seralaalaileileglyasnhisalaargasnserprosercysasn

385390395400

asplysglycysaspaspglyalaleuglymetglytrpglysergly

405410415

alavalasntyrprotyrphevalalaprotyraspalaileasnthr

420425430

argalaserserglnglythrglnvalthrleuserasnthraspasn

435440445

thrserserglyalaseralaalaargglylysaspvalalaileval

450455460

pheilethralaaspserglygluglytyrilethrvalgluglyasn

465470475480

alaglyaspargasnasnleuaspprotrphisasnglyasnalaleu

485490495

valglnalavalalaglyalaasnserasnvalilevalvalvalhis

500505510

servalglyalaileileleugluglnileleualaleuproglnval

515520525

lysalavalvaltrpalaglyleuproserglngluserglyasnala

530535540

leuvalaspvalleutrpglyaspvalserproserglylysleuval

545550555560

tyrthrilealalysserproasnasptyrasnthrargilevalser

565570575

glyglyseraspserphesergluglyleupheileasptyrlyshis

580585590

pheaspaspalaasnilethrproargtyrglupheglytyrglyleu

595600605

sertyrthrlyspheasntyrserargleuservalleuserthrala

610615620

lysserglyproalathrglyalavalvalproglyglyproserasp

625630635640

leupheglnasnvalalathrvalthrvalaspilealaasnsergly

645650655

glnvalthrglyalagluvalalaglnleutyrilethrtyrproser

660665670

seralaproargthrproprolysglnleuargglyphealalysleu

675680685

asnleuthrproglyglnserglythralathrpheasnileargarg

690695700

argaspleusertyrtrpaspthralaserglnlystrpvalvalpro

705710715720

serglyserpheglyileservalglyalaserserargaspilearg

725730735

leuthrserthrleuservalala

740

<210>11

<211>418

<212>prt

<213>里氏木霉

<400>11

metasnlysservalalaproleuleuleualaalaserileleutyr

151015

glyglyalaalaalaglnglnthrvaltrpglyglncysglyglyile

202530

glytrpserglyprothrasncysalaproglyseralacysserthr

354045

leuasnprotyrtyralaglncysileproglyalathrthrilethr

505560

thrserthrargproproserglyprothrthrthrthrargalathr

65707580

serthrserserserthrproprothrserserglyvalargpheala

859095

glyvalasnilealaglypheasppheglycysthrthraspglythr

100105110

cysvalthrserlysvaltyrproproleulysasnphethrglyser

115120125

asnasntyrproaspglyileglyglnmetglnhisphevalasnasp

130135140

aspglymetthrilepheargleuprovalglytrpglntyrleuval

145150155160

asnasnasnleuglyglyasnleuaspserthrserileserlystyr

165170175

aspglnleuvalglnglycysleuserleuglyalatyrcysileval

180185190

aspilehisasntyralaargtrpasnglyglyileileglyglngly

195200205

glyprothrasnalaglnphethrserleutrpserglnleualaser

210215220

lystyralaserglnserargvaltrppheglyilemetasnglupro

225230235240

hisaspvalasnileasnthrtrpalaalathrvalglngluvalval

245250255

thralaileargasnalaglyalathrserglnpheileserleupro

260265270

glyasnasptrpglnseralaglyalapheileseraspglyserala

275280285

alaalaleuserglnvalthrasnproaspglyserthrthrasnleu

290295300

ilepheaspvalhislystyrleuaspseraspasnserglythrhis

305310315320

alaglucysthrthrasnasnileaspglyalapheserproleuala

325330335

thrtrpleuargglnasnasnargglnalaileleuthrgluthrgly

340345350

glyglyasnvalglnsercysileglnaspmetcysglnglnilegln

355360365

tyrleuasnglnasnseraspvaltyrleuglytyrvalglytrpgly

370375380

alaglyserpheaspserthrtyrvalleuthrgluthrprothrgly

385390395400

serglyasnsertrpthraspthrserleuvalsersercysleuala

405410415

arglys

<210>12

<211>471

<212>prt

<213>里氏木霉

<400>12

metilevalglyileleuthrthrleualathrleualathrleuala

151015

alaservalproleuglugluargglnalacysserservaltrpgly

202530

glncysglyglyglnasntrpserglyprothrcyscysalasergly

354045

serthrcysvaltyrserasnasptyrtyrserglncysleuprogly

505560

alaalaserserserserserthrargalaalaserthrthrserarg

65707580

valserprothrthrserargserserseralathrproproprogly

859095

serthrthrthrargvalproprovalglyserglythralathrtyr

100105110

serglyasnprophevalglyvalthrprotrpalaasnalatyrtyr

115120125

alasergluvalserserleualaileproserleuthrglyalamet

130135140

alathralaalaalaalavalalalysvalproserphemettrpleu

145150155160

aspthrleuasplysthrproleumetgluglnthrleualaaspile

165170175

argthralaasnlysasnglyglyasntyralaglyglnphevalval

180185190

tyraspleuproaspargaspcysalaalaleualaserasnglyglu

195200205

tyrserilealaaspglyglyvalalalystyrlysasntyrileasp

210215220

thrileargglnilevalvalglutyrseraspileargthrleuleu

225230235240

valilegluproaspserleualaasnleuvalthrasnleuglythr

245250255

prolyscysalaasnalaglnseralatyrleuglucysileasntyr

260265270

alavalthrglnleuasnleuproasnvalalamettyrleuaspala

275280285

glyhisalaglytrpleuglytrpproalaasnglnaspproalaala

290295300

glnleuphealaasnvaltyrlysasnalaserserproargalaleu

305310315320

argglyleualathrasnvalalaasntyrasnglytrpasnilethr

325330335

serproprosertyrthrglnglyasnalavaltyrasnglulysleu

340345350

tyrilehisalaileglyproleuleualaasnhisglytrpserasn

355360365

alaphepheilethraspglnglyargserglylysglnprothrgly

370375380

glnglnglntrpglyasptrpcysasnvalileglythrglyphegly

385390395400

ileargproseralaasnthrglyaspserleuleuaspserpheval

405410415

trpvallysproglyglyglucysaspglythrseraspserserala

420425430

proargpheaspserhiscysalaleuproaspalaleuglnproala

435440445

proglnalaglyalatrppheglnalatyrphevalglnleuleuthr

450455460

asnalaasnproserpheleu

465470

<210>13

<211>514

<212>prt

<213>里氏木霉

<400>13

mettyrarglysleualavalileseralapheleualathralaarg

151015

alaglnseralacysthrleuglnsergluthrhisproproleuthr

202530

trpglnlyscysserserglyglythrcysthrglnglnthrglyser

354045

valvalileaspalaasntrpargtrpthrhisalathrasnserser

505560

thrasncystyraspglyasnthrtrpserserthrleucysproasp

65707580

asngluthrcysalalysasncyscysleuaspglyalaalatyrala

859095

serthrtyrglyvalthrthrserglyasnserleuserileglyphe

100105110

valthrglnseralaglnlysasnvalglyalaargleutyrleumet

115120125

alaseraspthrthrtyrglngluphethrleuleuglyasngluphe

130135140

serpheaspvalaspvalserglnleuprocysglyleuasnglyala

145150155160

leutyrphevalsermetaspalaaspglyglyvalserlystyrpro

165170175

thrasnthralaglyalalystyrglythrglytyrcysaspsergln

180185190

cysproargaspleulyspheileasnglyglnalaasnvalglugly

195200205

trpgluproserserasnasnalaasnthrglyileglyglyhisgly

210215220

sercyscysserglumetaspiletrpglualaasnserileserglu

225230235240

alaleuthrprohisprocysthrthrvalglyglngluilecysglu

245250255

glyaspglycysglyglythrtyrseraspasnargtyrglyglythr

260265270

cysaspproaspglycysasptrpasnprotyrargleuglyasnthr

275280285

serphetyrglyproglyserserphethrleuaspthrthrlyslys

290295300

leuthrvalvalthrglnphegluthrserglyalaileasnargtyr

305310315320

tyrvalglnasnglyvalthrpheglnglnproasnalagluleugly

325330335

sertyrserglyasngluleuasnaspasptyrcysthralagluglu

340345350

alaglupheglyglyserserpheserasplysglyglyleuthrgln

355360365

phelyslysalathrserglyglymetvalleuvalmetserleutrp

370375380

aspasptyrtyralaasnmetleutrpleuaspserthrtyrprothr

385390395400

asngluthrserserthrproglyalavalargglysercysserthr

405410415

serserglyvalproalaglnvalgluserglnserproasnalalys

420425430

valthrpheserasnilelyspheglyproileglyserthrglyasn

435440445

proserglyglyasnproproglyglyasnproproglythrthrthr

450455460

thrargargproalathrthrthrglyserserproglyprothrgln

465470475480

serhistyrglyglncysglyglyileglytyrserglyprothrval

485490495

cysalaserglythrthrcysglnvalleuasnprotyrtyrsergln

500505510

cysleu

<210>14

<211>459

<212>prt

<213>里氏木霉

<400>14

metalaproservalthrleuproleuthrthralaileleualaile

151015

alaargleuvalalaalaglnglnproglythrserthrprogluval

202530

hisprolysleuthrthrtyrlyscysthrlysserglyglycysval

354045

alaglnaspthrservalvalleuasptrpasntyrargtrpmethis

505560

aspalaasntyrasnsercysthrvalasnglyglyvalasnthrthr

65707580

leucysproaspglualathrcysglylysasncyspheileglugly

859095

valasptyralaalaserglyvalthrthrserglyserserleuthr

100105110

metasnglntyrmetproserserserglyglytyrserservalser

115120125

proargleutyrleuleuaspseraspglyglutyrvalmetleulys

130135140

leuasnglyglngluleuserpheaspvalaspleuseralaleupro

145150155160

cysglygluasnglyserleutyrleuserglnmetaspgluasngly

165170175

glyalaasnglntyrasnthralaglyalaasntyrglyserglytyr

180185190

cysaspalaglncysprovalglnthrtrpargasnglythrleuasn

195200205

thrserhisglnglyphecyscysasnglumetaspileleuglugly

210215220

asnserargalaasnalaleuthrprohissercysthralathrala

225230235240

cysaspseralaglycysglypheasnprotyrglyserglytyrlys

245250255

sertyrtyrglyproglyaspthrvalaspthrserlysthrphethr

260265270

ileilethrglnpheasnthraspasnglyserproserglyasnleu

275280285

valserilethrarglystyrglnglnasnglyvalaspileproser

290295300

alaglnproglyglyaspthrilesersercysproseralaserala

305310315320

tyrglyglyleualathrmetglylysalaleuserserglymetval

325330335

leuvalpheseriletrpasnaspasnserglntyrmetasntrpleu

340345350

aspserglyasnalaglyprocysserserthrgluglyasnproser

355360365

asnileleualaasnasnproasnthrhisvalvalpheserasnile

370375380

argtrpglyaspileglyserthrthrasnserthralapropropro

385390395400

proproalaserserthrthrpheserthrthrargargserserthr

405410415

thrserserserprosercysthrglnthrhistrpglyglncysgly

420425430

glyileglytyrserglycyslysthrcysthrserglythrthrcys

435440445

glntyrserasnasptyrtyrserglncysleu

450455

<210>15

<211>234

<212>prt

<213>里氏木霉

<400>15

metlyspheleuglnvalleuproalaleuileproalaalaleuala

151015

glnthrsercysaspglntrpalathrphethrglyasnglytyrthr

202530

valserasnasnleutrpglyalaseralaglyserglypheglycys

354045

valthralavalserleuserglyglyalasertrphisalaasptrp

505560

glntrpserglyglyglnasnasnvallyssertyrglnasnsergln

65707580

ilealaileproglnlysargthrvalasnserilesersermetpro

859095

thrthralasertrpsertyrserglyserasnileargalaasnval

100105110

alatyraspleuphethralaalaasnproasnhisvalthrtyrser

115120125

glyasptyrgluleumetiletrpleuglylystyrglyaspilegly

130135140

proileglyserserglnglythrvalasnvalglyglyglnsertrp

145150155160

thrleutyrtyrglytyrasnglyalametglnvaltyrserpheval

165170175

alaglnthrasnthrthrasntyrserglyaspvallysasnphephe

180185190

asntyrleuargaspasnlysglytyrasnalaalaglyglntyrval

195200205

leusertyrglnpheglythrgluprophethrglyserglythrleu

210215220

asnvalalasertrpthralaserileasn

225230

<210>16

<211>242

<212>prt

<213>里氏木霉

<400>16

metlysalathrleuvalleuglyserleuilevalglyalavalser

151015

alatyrlysalathrthrthrargtyrtyraspglyglngluglyala

202530

cysglycysglyserserserglyalapheprotrpglnleuglyile

354045

glyasnglyvaltyrthralaalaglyserglnalaleupheaspthr

505560

alaglyalasertrpcysglyalaglycysglylyscystyrglnleu

65707580

thrserthrglyglnalaprocyssersercysglythrglyglyala

859095

alaglyglnserileilevalmetvalthrasnleucysproasnasn

100105110

glyasnalaglntrpcysprovalvalglyglythrasnglntyrgly

115120125

tyrsertyrhispheaspilemetalaglnasngluilepheglyasp

130135140

asnvalvalvalaspphegluproilealacysproglyglnalaala

145150155160

serasptrpglythrcysleucysvalglyglnglngluthrasppro

165170175

thrprovalleuglyasnaspthrglyserthrproproglyserser

180185190

proproalathrserserserproproserglyglyglyglnglnthr

195200205

leutyrglyglncysglyglyalaglytrpthrglyprothrthrcys

210215220

glnalaproglythrcyslysvalglnasnglntrptyrserglncys

225230235240

leupro

<210>17

<211>838

<212>prt

<213>里氏木霉

<400>17

metlysvalserargvalleualaleuvalleuglyalavalilepro

151015

alahisalaalaphesertrplysasnvallysleuglyglyglygly

202530

glyphevalproglyileilephehisprolysthrlysglyvalala

354045

tyralaargthraspileglyglyleutyrargleuasnalaaspasp

505560

sertrpthralavalthraspglyilealaaspasnalaglytrphis

65707580

asntrpglyileaspalavalalaleuaspproglnaspaspglnlys

859095

valtyralaalavalglymettyrthrasnsertrpaspproserasn

100105110

glyalaileileargserseraspargglyalathrtrpserphethr

115120125

asnleuprophelysvalglyglyasnmetproglyargglyalagly

130135140

gluargleualavalaspproalaasnserasnileiletyrphegly

145150155160

alaargserglyasnglyleutrplysserthraspglyglyvalthr

165170175

pheserlysvalserserphethralathrglythrtyrileproasp

180185190

proseraspserasnglytyrasnserasplysglnglyleumettrp

195200205

valthrpheaspserthrserserthrthrglyglyalathrserarg

210215220

ilephevalglythralaaspasnilethralaservaltyrvalser

225230235240

thrasnalaglyserthrtrpseralavalproglyglnproglylys

245250255

tyrpheprohislysalalysleuglnproalaglulysalaleutyr

260265270

leuthrtyrseraspglythrglyprotyraspglythrleuglyser

275280285

valtrpargtyraspilealaglyglythrtrplysaspilethrpro

290295300

valserglyseraspleutyrpheglypheglyglyleuglyleuasp

305310315320

leuglnlysproglythrleuvalvalalaserleuasnsertrptrp

325330335

proaspalaglnleupheargserthraspserglythrthrtrpser

340345350

proiletrpalatrpalasertyrprothrgluthrtyrtyrtyrser

355360365

ileserthrprolysalaprotrpilelysasnasnpheileaspval

370375380

thrsergluserproseraspglyleuilelysargleuglytrpmet

385390395400

ilegluserleugluileaspprothraspserasnhistrpleutyr

405410415

glythrglymetthrilepheglyglyhisaspleuthrasntrpasp

420425430

thrarghisasnvalserileglnserleualaaspglyilegluglu

435440445

pheservalglnaspleualaseralaproglyglysergluleuleu

450455460

alaalavalglyaspaspasnglyphethrphealaserargasnasp

465470475480

leuglythrserproglnthrvaltrpalathrprothrtrpalathr

485490495

serthrservalasptyralaglyasnservallysservalvalarg

500505510

valglyasnthralaglythrglnglnvalalaileserseraspgly

515520525

glyalathrtrpserileasptyralaalaaspthrsermetasngly

530535540

glythrvalalatyrseralaaspglyaspthrileleutrpserthr

545550555560

alaserserglyvalglnargserglnpheglnglyserphealaser

565570575

valserserleuproalaglyalavalilealaserasplyslysthr

580585590

asnservalphetyralaglyserglyserthrphetyrvalserlys

595600605

aspthrglyserserphethrargglyprolysleuglyseralagly

610615620

thrileargaspilealaalahisprothrthralaglythrleutyr

625630635640

valserthraspvalglyilepheargserthraspserglythrthr

645650655

pheglyglnvalserthralaleuthrasnthrtyrglnilealaleu

660665670

glyvalglyserglyserasntrpasnleutyralapheglythrgly

675680685

proserglyalaargleutyralaserglyaspserglyalasertrp

690695700

thraspileglnglyserglnglypheglyserileaspserthrlys

705710715720

valalaglyserglyserthralaglyglnvaltyrvalglythrasn

725730735

glyargglyvalphetyralaglnglythrvalglyglyglythrgly

740745750

glythrserserserthrlysglnserserserserthrserserala

755760765

serserserthrthrleuargserservalvalserthrthrargala

770775780

serthrvalthrserserargthrserseralaalaglyprothrgly

785790795800

serglyvalalaglyhistyralaglncysglyglyileglytrpthr

805810815

glyprothrglncysvalalaprotyrvalcysglnlysglnasnasp

820825830

tyrtyrtyrglncysval

835

<210>18

<211>373

<212>prt

<213>鹅柄孢壳菌

<400>18

metlysglyleuphealapheglyleuglyleuleuserleuvalasn

151015

alaleuproglnalaglnglyglyglyalaalaalaseralalysval

202530

serglythrargphevalileaspglylysthrglytyrphealagly

354045

thrasnsertyrtrpileglypheleuthrasnasnargaspvalasp

505560

thrthrleuasphisilealaserserglyleulysileleuargval

65707580

trpglypheasnaspvalasnasnglnproserglyasnthrvaltrp

859095

pheglnargleualaserserglyserglnileasnthrglyproasn

100105110

glyleuglnargleuasptyrleuvalargseralagluthrarggly

115120125

ilelysleuileilealaleuvalasntyrtrpaspasppheglygly

130135140

metlysalatyrvalasnalapheglyglythrlysglusertrptyr

145150155160

thrasnalaargalaglngluglntyrlysargtyrileglnalaval

165170175

valserargtyrvalasnserproalailephealatrpgluleuala

180185190

asngluproargcyslysglycysasnthrasnvalilepheasntrp

195200205

alathrglnileserasptyrileargserleuasplysasphisleu

210215220

ilethrleuglyaspgluglypheglyleuproglyglnthrthrtyr

225230235240

protyrglntyrglygluglythraspphevallysasnleuglnile

245250255

lysasnleuasppheglythrphehismettyrproglyhistrpgly

260265270

valprothrserpheglyproglytrpilelysasphisalaalaala

275280285

cysargalaalaglylysprocysleuleugluglutyrglytyrglu

290295300

seraspargcysasnvalglnlysglytrpglnglnalaserargglu

305310315320

leuserargaspglymetserglyaspleuphetrpglntrpglyasp

325330335

glnleuserthrglyglnthrhisasnaspglyphethriletyrtyr

340345350

glyserserleualathrcysleuvalthrasphisvalargalaile

355360365

asnalaleuproala

370

<210>19

<211>469

<212>prt

<213>鹅柄孢壳菌

<400>19

metvallysleuleuaspileglyleuphealaleualaleualaser

151015

seralavalalalysprocyslysproargaspglyprovalthrtyr

202530

glualagluaspalaileleuthrglythrthrvalaspthralagln

354045

valglytyrthrglyargglytyrvalthrglypheaspgluglyser

505560

asplysilethrpheglnileserseralathrthrlysleutyrasp

65707580

leuserileargtyralaalailetyrglyasplysargthrasnval

859095

valleuasnasnglyalavalsergluvalphepheproalaglyasp

100105110

serphethrservalalaalaglyglnvalleuleuasnalaglygln

115120125

asnthrileaspilevalasnasntrpglytrptyrleuileaspser

130135140

ilethrleuthrproseralaproargproprohisaspileasnpro

145150155160

asnleuasnasnproasnalaaspthrasnalalyslysleutyrser

165170175

tyrleuargservaltyrglyasnlysileileserglyglnglnglu

180185190

leuhishisalaglutrpileargglnglnthrglylysthrproala

195200205

leuvalalavalaspleumetasptyrserproserargvalgluarg

210215220

glythrthrserhisalavalgluaspalailealahishisasnala

225230235240

glyglyilevalservalleutrphistrpasnalaprovalglyleu

245250255

tyraspthrglugluasnlystrptrpserglyphetyrthrargala

260265270

thrasppheaspilealaalathrleualaasnproglnglyalaasn

275280285

tyrthrleuleuileargaspileaspalailealavalglnleulys

290295300

argleuglualaalaglyvalprovalleutrpargproleuhisglu

305310315320

alagluglyglytrpphetrptrpglyalalysglyprogluproala

325330335

lysglnleutrpaspileleutyrgluargleuthrvalhishisgly

340345350

leuaspasnleuiletrpvaltrpasnserileleugluasptrptyr

355360365

proglyaspaspthrvalaspileleuseralaaspvaltyralagln

370375380

glyasnglyprometserthrglntyrasngluleuilealaleugly

385390395400

argasplyslysmetilealaalaalagluvalglyalaalaproleu

405410415

proglyleuleuglnalatyrglnalaasntrpleutrpphealaval

420425430

trpglyaspasppheileasnasnprosertrpasnthrvalalaval

435440445

leuasngluiletyrasnserasptyrvalleuthrleuaspgluile

450455460

glnglytrpargser

465

<210>20

<211>493

<212>prt

<213>里氏木霉

<400>20

metalaglylysleuileleuvalalaleualaserleuvalserleu

151015

serileglnglnasncysalaalaleupheglyglncysglyglyile

202530

glytrpserglythrthrcyscysvalalaglyalaglncysserphe

354045

valasnasptrptyrserglncysleualaserthrglyglyasnpro

505560

proasnglythrthrserserserleuvalserargthrserserala

65707580

serserservalglyserserserproglyglyasnserprothrgly

859095

seralaserthrtyrthrthrthraspthralathrvalalaprohis

100105110

serglnserprotyrproserilealaalasersercysglysertrp

115120125

thrleuvalaspasnvalcyscysprosertyrcysalaasnaspasp

130135140

thrserglusercysserglycysglythrcysthrthrproproser

145150155160

alaaspcyslysserglythrmettyrprogluvalhishisvalser

165170175

serasnglusertrphistyrserargserthrhispheglyleuthr

180185190

serglyglyalacysglypheglyleutyrglyleucysthrlysgly

195200205

servalthralasertrpthraspprometleuglyalathrcysasp

210215220

alaphecysthralatyrproleuleucyslysaspprothrglythr

225230235240

thrleuargglyasnphealaalaproasnglyasptyrtyrthrgln

245250255

phetrpserserleuproglyalaleuaspasntyrleusercysgly

260265270

glucysilegluleuileglnthrlysproaspglythrasptyrala

275280285

valglyglualaglytyrthraspproilethrleugluilevalasp

290295300

sercysprocysseralaasnserlystrpcyscysglyproglyala

305310315320

asphiscysglygluileaspphelystyrglycysproleuproala

325330335

aspserilehisleuaspleuseraspilealametglyargleugln

340345350

glyasnglyserleuthrasnglyvalileprothrargtyrargarg

355360365

valglncysprolysvalglyasnalatyriletrpleuargasngly

370375380

glyglyprotyrtyrphealaleuthralavalasnthrasnglypro

385390395400

glyservalthrlysilegluilelysglyalaaspthraspasntrp

405410415

valalaleuvalhisaspproasntyrthrserserargproglnglu

420425430

argtyrglysertrpvalileproglnglyserglypropheasnleu

435440445

provalglyileargleuthrserprothrglygluglnilevalasn

450455460

gluglnalailelysthrphethrproproalathrglyaspproasn

465470475480

phetyrtyrileaspileglyvalglnpheserglnasn

485490

<210>21

<211>8

<212>prt

<213>人工序列

<220>

<223>人工序列的描述:合成

8xhis标签

<400>21

hishishishishishishishis

15

<210>22

<211>6

<212>prt

<213>人工序列

<220>

<223>人工序列的描述:合成

6xhis标签

<400>22

hishishishishishis

15

<210>23

<211>4

<212>prt

<213>人工序列

<220>

<223>人工序列的描述:合成

<400>23

glyserglyser

1

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1