新家族的碳水化合物结合组件的制作方法

文档序号:551570阅读:921来源:国知局
专利名称:新家族的碳水化合物结合组件的制作方法
技术领域
本发明涉及属于CBM新家族的非催化性碳水化合物结合组件(CBM)。发现本发明的CBM附着于糖基水解酶家族61(GH61)多肽并显示与已知的CBM几乎没有同源性,这表示它是CBM新家族的第一个已知成员。本发明还涉及优选对纤维素显示出亲和力的CBM;产生该CBM的方法;以及在纺织品、洗涤剂和纤维素纤维生产工业中、纯化多肽、活性酶固定、焙烤、制造生物燃料、改变植物细胞壁中使用该CBM的方法。
背景技术
碳水化合物结合组件(CBM)被定义为带有具碳水化合物结合活性的不连续折叠的碳水化合物活性酶中的连续氨基酸序列。CBM在较大的酶中作为组件存在的需要将该类碳水化合物结合蛋白质与其他非催化性糖结合蛋白质(如凝集素和糖转运蛋白)区别开来。
根据一些结合纤维素组件的最初发现(Tomme等(1989)FEBS Lett.243,239-243;Gilkes等(1988)J.Biol.Chem.263,10401-10407),CBM曾经被归类为纤维素结合结构域(CBD)。然而,持续发现碳水化合物活性酶中结合非纤维素外的碳水化合物并符合CBM标准的组件。
之前对纤维素结合结构域的归类基于氨基酸相似性。CBD分组被称为“型”并以罗马数字编号(例如I型或II型CBD)。为了与糖苷水解酶分类一致,现在将这些分组称为家族并用阿拉伯数字编号。家族1到13与I到XIII型相同(Tomme等(1995)in Enzymatic Degradation of InsolublePolysaccharides(Saddler & Penner编)142-163,American ChemicalSociety,Washington)。
最近,已知的CBM被分类在家族1-6和8-33中。大部分分类的CBM是细菌来源的,且已知的真菌碳水化合物结合组件主要被归类于CBM1家族。然而,在CBM13、CBM18、CBM19、CBM20和CBM24中也发现典型的真菌CBM。迄今为止,只有来自CBM1的真菌碳水化合物结合组件已知与微晶纤维素结合。来自CBM13、CBM18、CBM19、CBM20和CBM24家族的真菌CBM已经显示与底物例如壳多糖、淀粉和齿斑葡聚糖结合。然而,来自CBM1的真菌碳水化合物结合组件也与壳多糖很好的结合。
大量真菌纤维素酶已经显示含有CBM1家族的由36个氨基酸残基组成的CBD。已知含有该结构域的酶实例为来自瑞氏木霉(Trichoderma reesei)的内切葡聚糖酶I(基因egl1),来自瑞氏木霉的内切葡聚糖酶II(基因egl2),来自瑞氏木霉的内切葡聚糖酶V(基因egl5),来自灰腐质酶(Humicola grisea)、粗糙脉孢菌(Neurospora crassa)、黄孢原毛平革菌(Phanerochaete chrysosporium)、瑞氏木霉和绿色木霉(Trichoderma viride)的外切纤维二糖水解酶I(基因CBHI),来自瑞氏木霉的外切纤维二糖水解酶II(基因CBHII),来自二孢蘑菇(Agaricus bisporus)的外切纤维二糖水解酶3(基因cel3),来自尖孢镰孢(Fusarium oxysporum)的内切葡聚糖酶B、C2、F和K,在这些酶的N端(Cbh-II或egl2)或C端末端(Cbh-I、egl1或egl5)均发现CBD结构域。在该类型CBD结构域中有四个保守的半胱氨酸残基,它们均与二硫键有关(Prosite,Swiss Institute of Bioinformatics)。
可使用PCR技术并根据现有知识常规获得来自给定生物的编码CBD的DNA序列;可能从其他生物找到同源序列。
设想通过克隆纤维素酶、木聚糖酶或其他植物细胞壁降解酶并测量与(例如)纤维素的结合来发现新的CBD。如果酶在下文描述的标准条件下结合Avicel,可假设基因的部分编码结合结构域。
可从植物获得的CBM样多肽的实例为扩展蛋白。扩展蛋白本质上不是CBM,因为未发现它们由具有酶活性的同样的氨基酸序列编码。然而,观察到分离的CBM结构域可具有对纤维素的扩展蛋白样活性(Levy和Shoseyov,2002,见上文)。Din等(Bio/Technology 9(1991)1096-1099)报道来自粪肥纤维单胞菌(Cellulomonas fimi)内切葡聚糖酶A的CBDCenA能够非水解性破坏引起小颗粒释放的纤维素纤维活性。另外,显示CBD CenA能够阻止微晶细菌纤维素的絮凝(Gilkes等(1993)Int.J.Biol.Macromol.15347-351)。在其他CBD中观察到类似的现象(Krull等(1988)Biotechnol.Bioeng.31321-327;Banka等(1998)World J.Microbiol.Biotechnol.14551-558;Gao等(2001)Acta Biochim.Biophys.Sin.3313-18)。
已知使用CBM广泛应用于洗涤、纺织品处理、牙菌斑去除、多肽纯化、活性酶固定、纤维质材料修饰、焙烤、生物燃料制造、植物细胞壁修饰。
发明概述本发明者目前发现可从真菌假黑盘菌(Pseudoplectania nigrella)(保藏号CBS 444.97)中获得的具有纤维素亲和力的碳水化合物结合组件(CBM),发现新的CBM与属于糖基水解酶家族61(GH61)的酶结合。新的CBM(称为CBMX)显示对Avicel具有亲和力并与已知的CBM不具有可见的同源性(小于20%)。并且,本发明CBM中发现没有一个半胱氨酸残基位置与上述CBM1家族中很保守的半胱氨酸残基位置对应。这指示本发明的CBM为CBM新家族的第一个已知成员。
除具有纤维素亲和力的CBM1家族的真菌CBM外,本发明CBM为第一个显示具有纤维素亲和力的已知真菌CBM。本发明者成功克隆并表达了与GH61酶家族结合的CBM。此外,发明者表达了不带有GH61酶的结构域并证明CBM可独自结合纤维素(例如Avicel)。
所述CBM结构域由SEQ ID NO1的109-531位置DNA序列编码并具有SEQ ID NO2的34-174位置氨基酸序列。SEQ ID NO2的位置1-33组成了GH61酶的信号肽和N端区域。
因此,本发明涉及新CBM家族的CBM,其中CBM为
(a)SEQ ID NO1位置109-531的DNA序列或与SEQ ID NO1同源的DNA序列编码的多肽,所述同源DNA序列与SEQ ID NO1位置109-531有至少40%同一性,优选至少50%同一性,更优选至少60%同一性,更优选至少70%同一性,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%同一性,更优选至少97%同一性,更优选至少98%同一性,特别优选与SEQ ID NO1位置109-531有至少99%的同一性;(b)通过在DNA序列表达的条件下培养包含SEQ ID NO1位置109-531的DNA序列的细胞所产生的多肽;(c)具有SEQ ID NO2位置34-174氨基酸序列的多肽,或与SEQID NO2同源的多肽,其中多肽与SEQ ID NO2位置34-174有至少40%同一性,优选至少50%同一性,更优选至少60%同一性,更优选至少70%同一性,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%同一性,更优选至少97%同一性,更优选至少98%同一性,特别优选与SEQ ID NO2位置34-174有至少99%的同一性;(d)由与SEQ ID NO1位置109-531的DNA序列优选在低严格条件下,更优选至少在中严格条件下,更优选至少在中/高严格条件下,更优选至少在高严格条件下,特别优选至少在非常高严格条件下杂交的DNA序列编码的多肽;(e)分离的多核苷酸分子编码的多肽,该多核苷酸分子与变性的双链DNA探针优选在低严格条件下,更优选至少在中严格条件下,更优选至少在中/高严格条件下,更优选至少在高严格条件下,特别优选至少在非常高严格条件下杂交,其中探针选自包含SEQ ID NO1位置109-531所示序列的DNA探针,以及包含SEQ ID NO1位置109-531的子序列的DNA探针,该子序列有至少大约100碱基对的长度,优选至少200碱基对,更优选至少300碱基对,更优选至少400碱基对,更优选至少440碱基对,甚至更优选至少450碱基对的长度;
(f)由可从假黑盘菌CBS 444.97中获得的DNA序列编码的CBM多肽。
在另外的方面,本发民提供了包含例如是本发明多核苷酸分子的DNA片段的表达载体;包含DNA片段或表达载体的细胞;以及产生CBM多肽的方法,该方法包括在允许CBM产生的条件下培养细胞,并从培养物中回收CBM。另外,可使用本领域众所周知的纯化方法从回收的CBM中去除杂质(如同源的杂质)。
另一方面,本发明提供了分离的CBM多肽,其特征在于(i)不含同源的杂质及(ii)由上述方法产生。
本发明的新CBM可用于洗涤、纺织品处理、多肽纯化、活性酶固定、纤维质材料修饰、焙烤、生物燃料制造、植物细胞壁修饰。
发明详述本发明涉及可从真菌假黑盘菌中获得并属于新家族真菌CBM的非催化性碳水化合物结合组件(CBM)。发现本发明CBM与属于糖基水解酶家族61的蛋白质相关联。本发明的CBM由SEQ ID NO1位置109-531的DNA序列编码并具有SEQ ID NO2位置34-174的氨基酸序列。所述CBM优选显示纤维素亲和力。本发明涉及产生该CBM的方法;并涉及在洗涤应用、纺织品处理、多肽纯化、活性酶固定、纤维质材料修饰、焙烤、生物燃料制造、植物细胞壁修饰中使用该CBM的方法。
本发明者成功克隆并表达了与GH61酶家族结合的CBM。此外,本发明者表达了不带有GH61酶的结构域并证明CBM可独自结合纤维素。因此,本发明涉及新CBM家族的CBM,其中CBM为(a)SEQ ID NO1位置109-531的DNA序列或与SEQ ID NO1同源的DNA序列编码的多肽,所述同源DNA序列与SEQ ID NO1位置109-531有至少40%同一性,优选至少50%同一性,更优选至少60%同一性,更优选至少70%同一性,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%同一性,更优选至少97%同一性,更优选至少98%同一性,特别优选与SEQ ID NO1位置109-531有至少99%的同一性;
(b)通过在DNA序列表达的条件下培养包含SEQ ID NO1位置109-531的DNA序列的细胞所产生的多肽;(c)具有SEQ ID NO2位置34-174氨基酸序列的多肽,或与SEQ IDNO2同源的多肽,其中多肽与SEQ ID NO2位置34-174有至少40%同一性,优选至少50%同一性,更优选至少60%同一性,更优选至少70%同一性,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%同一性,更优选至少97%同一性,更优选至少98%同一性,特别优选与SEQ ID NO2位置34-174有至少99%的同一性;(d)由与SEQ ID NO1位置109-531的DNA序列优选在低严格条件下,更优选至少在中严格条件下,更优选至少在中/高严格条件下,更优选至少在高严格条件下,特别优选至少在非常高严格条件下杂交的DNA序列编码的多肽;(e)分离的多核苷酸分子编码的多肽,该多核苷酸分子与变性的双链DNA探针优选在低严格条件下,更优选至少在中严格条件下,更优选至少在中/高严格条件下,更优选至少在高严格条件下,特别优选至少在非常高严格条件下杂交,其中探针选自包含SEQ ID NO1位置109-531所示序列的DNA探针,以及包含SEQ ID NO1位置109-531子序列的DNA探针,该子序列有至少大约100碱基对的长度,优选至少200碱基对,更优选至少300碱基对,更优选至少400碱基对,更优选至少440碱基对,甚至更优选至少450碱基对的长度;(f)由可从假黑盘菌CBS 444.97中获得的DNA序列编码的CBM多肽。
杂交确定核苷酸探针与同源的DNA或RNA序列之间在低到非常高严格下杂交的合适的实验条件包括将含有待杂交DNA片段或RNA的滤纸在5xSSC(氯化钠/柠檬酸钠,见述于如Sambrook等(1989)《MolecularCloningA Laboratory Manual》,冷泉港实验室,冷泉港,纽约)中预浸泡10分钟,并在5x SSC、5x Denhardt杂交溶液(Sambrook等,1989,如上文)、0.5%SDS和100μg/ml超声处理变性的鲑精DNA(Sambrook等,1989如上文)中与滤纸预杂交,然后在含有10ng/ml浓度随机引物(Feinberg和Vogelstein(1983)Anal.Biochem.132,6-13)、32P-dCTP-标记的探针(比活性>1×109cpm/μg)的相同溶液中在大约45℃杂交12小时。然后将滤纸在2x SSC,0.5%SDS中在至少55℃(低严格),更优选至少60℃(中度严格),更优选至少65℃(中/高度严格),特别更优选至少70℃(高度严格),以及甚至更优选至少75℃(非常高严格)下30分钟洗涤两次。
序列比对和同一性可使用Vector NTI Program Suite 7.0(Invitrogen Inc.子公司Informax)的AlignX应用程序,使用默认设置比对核苷酸序列,默认程序设置使用修饰的ClustalW算法(Thompson等,(1994)Nuc.Acid Res.224673-4680)、swgapdnarnt计分矩阵、缺口打开罚分为15,缺口延伸罚分为6.66。
可使用Vector NTI Program Suite v8(Invitrogen Inc.子公司Informax)的AlignX应用程序使用默认设置比对氨基酸序列,默认设置使用修饰的ClustalW算法(Thompson等,(1994),如上文)、blosum62mt2计分矩阵、缺口打开罚分为10,缺口延伸罚分为0.1。
在通常被认为非常灵敏的Smith-Waterman搜索(Smith和Waterman(1981)J.Mol.Biol.147195-197)中,两个蛋白质显示在氨基酸水平上一些相似性。第一个是酿酒酵母(Saccharomyces cerevisiae)FIG2(Swiss-Prot No.p25653)。Smith-Waterman分数为162,并在143碱基对的重叠中显示28.7%的同一性。同源性的解释本发明CBM和FIG2都高度富含丝氨酸-苏氨酸。两个蛋白质之间的相似区域被认为在FIG2中是高度糖基化的。可能该区域的相似性模式与糖基化识别更相关,而非实际上的功能相似性。第二个显示若干相似性的蛋白质为来自嗜烟碱节杆菌(Arthrobacternicotinovorans)的假定蛋白质(SPTREMBLQ8GAM3)。该蛋白质具有138的Smith-Waterman分数并在128个氨基酸重叠中有30.5%的同一性。整体同源性非常低。难以相信这两个蛋白质是进化或者功能性相关的。
大小和3D结构本发明的CBM有六个苯丙氨酸以可能将其置于同一高级结构(如β桶或α螺旋)表面的距离重复。CBM家族1-6、9和15典型成员的三维结构已通过x射线衍射晶体分析法和NMR确定,而且根据Levy和Shoseyov(Biotechnology Advances 20(2002)191-213),来自这些结构的数据指出来自不同家族的CBD是结构相似的,并且它们的纤维素结合能力可至少部分地归因于组成它们疏水表面的若干芳香族氨基酸。因此本发明发明者希望指出若干苯丙氨酸残基和它们对于本发明CBM结合纤维素能力的重要性。以下为残基被标记的CBM亚区VPNFTATDVPTFTATDIPTFTATDVPIFTKKPQQPS(SEQ ID NO2的位置64-99),并进一步指向C端SVSFVAKPSAFIPKPSA(SEQ ID NO2的位置110-126)。
本发明的表达的CBM或含有CBM的多肽具有与非糖基化形式相等或高出大约15kD的分子量(Mw)。大多数与Avicel结合的蛋白质显示分子量35-45kDa的宽谱带,远远大于碳水化合物结合组件蛋白质部分的15kDa。高且不均一的分子量可能是由于蛋白质N端O-糖基化和N-糖基化的不均一性。对于米曲霉(Aspergillus oryzae)中异源表达的CBMX,由于蛋白质糖基化的不均一性,CBMX的大小可由14kDa变化至几乎70kDa。此外,35-45kDa带的N端测序唯一地给出序列SFSSSGT(SEQ IDNO9的位置47-53),指出不存在N端氨基酸序列的不均一性。
优选的,非糖基化形式的本发明CBM的分子量等于或低于大约70kD,更优选等于或低于大约50kD,更优选等于或低于大约40kD或30kD,甚至更优选等于或低于大约25kD,甚至更优选等于或低于大约20kD,甚至更优选等于或低于15kD。
碳水化合物结合组件尽管专利和科学文献中已经描述了许多类型的碳水化合物结合组件,其中大部分(许多来自于纤维素分解酶)通常被称为纤维素结合结构域(CBD);因此典型的CBM应在纤维素酶中出现并优先结合纤维素和/或其多或寡糖片段。
纤维素结合(及其他碳水化合物结合)组件是多肽氨基酸序列,其作为大多肽或由两个或多个多肽氨基酸序列区域组成的蛋白质的完整部分存在,特别是在通常包含催化结构域(含有底物水解活性位点)和碳水化合物结合结构域(用于结合所述碳水化合物底物)的水解酶中。该酶可包含多于一个催化结构域以及一个、两个或三个碳水化合物结合结构域,并且它们可进一步包含一个或多个连接碳水化合物结合结构域和催化结构域的多肽氨基酸序列区域,后一类型的区域通常被称为“连接子”。
在蛋白质复合物(通常是水解酶)中,CBM位于N或C端或中间。单体CBM通常由大于大约30个并小于大约250个氨基酸残基组成。例如,归类于家族I的CBM由33-37个氨基酸残基组成;归类于家族IIa的CBM由95-108个氨基酸残基组成;以及归类于家族VI的CBM由85-92个氨基酸残基组成。因此,单体CBM的分子量通常位于从大约4kD到大约40kD的范围内,并通常低于大约35kD。
CBM可作为单结构域多肽或作为二聚体、三聚体或多聚体或作为蛋白质杂合体的部分使用。
包含碳水化合物结合组件的水解酶实例为纤维素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖酶、乙酰酯酶、淀粉酶、葡糖淀粉酶、齿斑葡聚糖酶和壳多糖酶。CBM已显示与碳水化合物(例如纤维素、木聚糖、淀粉、壳多糖、甘露聚糖、β-葡聚糖、齿斑葡聚糖和环糊精)结合。CBM已在植物和藻类中发现,例如在红藻Porpgyra purpurea中以非水解多糖结合蛋白的形式(见Tomme等(1996)《Cellulose-Binding Domains,Classification andProperties in Enzymatic Degradation of Insoluble Carbohydrates》,Saddler & Penner(编),ACS Symposium Series,No.618)。
洗涤因此本发明特别涉及除去或漂白纤维织物或纺织品上存在的污物或污质的方法,其中织物或纺织品与含有修饰酶(酶杂合体)的水性介质接触,该酶中含有与包含碳水化合物结合组件(如CBD)的氨基酸序列相连的非纤维素分解酶的催化(酶促)活性氨基酸序列。
污质可根据本发明除去的污物或污质包括上文已经提到的那些,即来自于例如淀粉、蛋白质、脂肪、红酒、水果(例如黑醋栗、樱桃、草莓或番茄,特别是番茄酱或意大利粉酱中的番茄)、蔬菜(例如胡萝卜或甜菜根)、茶、咖啡、香料(例如咖喱或辣椒)、体液、草或墨水(例如来自圆珠笔或自来水笔)的污物或污质。作为根据本发明去除或漂白的合适靶的其他类型的污物或污质包括皮脂、土壤(即泥土)、粘土、油和涂料。WO 97/28243描述了去除或漂白纤维织物上存在的污物或污质的方法。该方法包括将织物与包含修饰的酶的水性介质接触,该酶为与包含纤维素结合结构域的氨基酸序列连接的非分解纤维素酶的催化活性氨基酸序列。
本发明的目的之一为在去除或漂白WO 97/28243中所描述的纤维织物上存在的污物或污质的方法中使用SEQ ID NO2的CBM。
纤维织物术语“纤维织物”旨在指任意类型由含纤维素材料(如棉花)或来自纤维素的材料(由例如木质纸浆或棉花制备)制备的织物,特别是针织织物。
本发明上下文中,术语“织物”旨在包括衣物或其他类型的加工的织物,并可与术语“纺织品”互换使用。
由天然存在的纤维质纤维制造的纤维织物的实例为棉花、苎麻、黄麻和亚麻(亚麻线)纤维。由人造的纤维质纤维制造的纤维织物实例为纤维胶(人造丝)和lyocell(例如TencelTM)纤维;在本发明上下文中还涉及所有纤维质纤维(例如纤维胶、lyocell、棉花、苎麻、黄麻或亚麻)与其他纤维(例如织物毛发纤维,如羊毛、羊驼或骆驼毛)或与多聚纤维(如聚脂、聚丙烯酸、聚酰胺或聚乙烯纤维)的掺和物。
掺和的纤维织物具体实例为纤维胶/棉花掺和物、lyocell/棉花掺和物(例如TencelTM/棉花掺和物)、纤维胶/羊毛掺和物、lyocell/羊毛掺和物、棉花/羊毛掺和物、棉花/聚脂掺和物、纤维胶/棉花/聚脂掺和物、羊毛/棉花/聚脂掺和物和亚麻/棉花掺和物。
酶杂合体本发明专利申请书中涉及的酶分类编号(EC编号)根据《国际生化与分子生物学联合会命名委员会推荐(1992)》,Academic Press Inc.,1992。
根据本发明使用的修饰的酶(酶杂合体)包含与织物或纺织品清洁相关(特别是在洗涤过程中从织物或纺织品上去除或漂白污物或污质)的非纤维素分解酶的酶活性氨基酸序列(即除纤维素酶外的酶的酶活性氨基酸序列)。优选的酶选自与包含纤维素结合组件的氨基酸序列融合(连接)的淀粉酶(例如α-淀粉酶,EC 3.2.1.1)、蛋白酶(即肽酶,EC 3.4)、脂肪酶(例如三酰基甘油酯酶,EC 3.1.1.3)和氧化还原酶(例如过氧化物酶,EC1.11.1,例如分类为EC 1.11.1.7的那些;或酚氧化酶,如漆酶,EC 1.10.3.2,或其他分类为EC 1.10.3的酶)。所述催化活性氨基酸序列可包含或由整个或几乎整个所述成熟酶全长氨基酸序列组成,或其可由保留几乎与全长序列相同的酶性质的全长序列的部分组成。
所述类型的修饰的酶及其制备和纯化的详细说明为本领域公知(见例如WO 90/00609、WO 94/24158和WO 95/16782)。可通过将DNA构建体转化入宿主细胞,并培养转化的宿主细胞以表达融合基因来制备它们,所述DNA构建体至少包含与编码目的酶的DNA序列连接(有或没有连接子)的编码CBM的DNA片段。可由该途径获得的一种相关(但非仅此)类型的重组产物(酶杂合体,在本领域中通常称为“融合蛋白”)可由下面的通式之一描述A-CBM-MR-X-BA-X-MR-CBM-B后一式中CBM为至少包含碳水化合物结合组件本身的氨基酸序列。
MR(中间区域;连接子)可是键,或包含从1到大约100个氨基酸残基,特别是从2到40个氨基酸残基(例如从2到15个氨基酸残基)的连接基团。MR通常可另外为非氨基酸连接子。
X为氨基酸序列,其包含上述由编码目的非纤维素分解酶的DNA序列所编码的多肽的氨基酸残基的酶活性序列。
A和B部分为独立任选的。当存在时,A或B部分组成CBM或X部分的末端延长,并通常包含一个或多个氨基酸残基。
因此,根据上文,尤其显然所述类型酶杂合体中的CBM可置于酶杂合体的C端、N端或内部。相应的,所述类型酶杂合体的X部分可置于酶杂合体的N端、C端或内部。
本发明上下文中的目的酶杂合体包括包含多于一个通常由适当长度氨基酸残基序列组成的CBM(例如两个或多个CBM彼此直接相连,或通过间隔或连接子序列彼此分离)的酶杂合体。
构建所述类型酶杂合体的非常重要的问题在于对蛋白水解降解的稳定性。两个或多个结构域的蛋白质对连接结构域的连接子区的蛋白水解切割特别敏感。引起该切割的蛋白酶可为例如枯草杆菌蛋白酶,已知其通常显示广泛的底物特异性(见例如 等(1992)Biochemistry 316011-6018;Teplyakov等(1992)Protein Engineering 5413-420)。
真核生物中连接子残基的糖基化是阻止蛋白水解降解的天然途径之一。另一个是使用环境蛋白酶次偏好的氨基酸。连接子的长度也影响蛋白酶的趋近性。哪种“溶液”是最佳的取决于酶杂合体将被作用的环境。构建新的酶杂合体分子时,连接子稳定性因而成为非常重要的问题。
对制备CBM有用的纤维素酶(纤维素酶基因)适于分离纤维素酶基因的技术为本领域所熟知的。在本文上下文中,术语“纤维素酶”和“纤维素分解酶”是指催化纤维素降解为葡萄糖、纤维二糖、丙糖和/或其它细胞低聚糖的酶。
本文上下文中优选的纤维素酶(即包含优选的CBM的纤维素酶)为微生物纤维素酶,特别是细菌或真菌纤维素酶。内切葡聚糖酶,特别是内-1,4-β-葡聚糖酶(EC 3.2.1.4),特别是单组件(重组)内-1,4-β-葡聚糖酶为优选纤维素酶的种类。
有用的细菌纤维素酶实例为来自选自假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、纤维单胞菌属(Cellulomonas)、梭状芽胞杆菌(Clostridium)、微孢子门(Microspora)、栖热袍菌属(Thermotoga)、Caldocellum和放线菌如链霉菌属(Streptomyces)、高温单孢菌属(Termomonospora)和Acidothemus,特别是来自Pseudomonas cellulolyticus、灿烂芽胞杆菌(Bacillus lautus)、粪肥纤维单胞菌、热纤梭菌(Clostridiumthermocellum)、Microspora bispora、Termomonospora fusca、Termomonospora cellulolyticum和Acidothemus cellulolyticus的细菌或可由其生产的纤维素酶。
纤维素酶可是酸性的、中性的或碱性的纤维素酶,即分别在酸性、中性或碱性范围内表显最大纤维素水解活性。
有用的纤维素酶为酸性纤维素酶,优选来自选自木霉属(Trichoderma)、漆斑菌属(Myrothecium)、曲霉属(Aspergillus)、Phanaerochaete、脉孢菌(Neurospora)、Neocallimastix和葡萄孢属(Botrytis)的真菌的真菌酸性纤维素酶。
优选有用的纤维素酶来自选自绿色木霉、瑞氏木霉、Trichodermalongibrachiatum、粗糙脉孢菌、Neocallimastix partriciarum、假黑盘菌和灰葡萄孢(Botrytis cinerea)的真菌或可由其产生。
另一有用的纤维素酶为中性或碱性的纤维素酶,优选来自选自曲霉属(Aspergillus)、青霉属(Penicillium)、毁丝霉属(Myceliophthora)、腐质霉属(Humicola)、耙菌属(Irpex)、镰孢霉属(Fusarium)、葡萄穗霉属(Stachy-botrys)、帚霉属(Scopulariopsis)、毛壳菌属(Chaetomium)、疣孢霉属(Myco-gone)、轮枝孢属(Verticillium)、漆斑菌属(Myrothecium)、丝葚霉属(Papulo-spora)、粘帚霉属(Gliocladium)、头孢霉属(Cephalosporium)、假黑盘菌和产黄头孢霉属(Acremonium)的真菌或可由其产生的真菌中性或碱性纤维素酶。
优选的碱性纤维素酶来自选自Humicola insolens、尖孢镰孢、Myce-liopthora thermophila、微紫青霉(Penicillium janthinellum)和头孢霉属,优选选自Humicola insolens DSM 1800、尖孢镰孢DSM 2672、Myceliopthorathermophila CBS 117.65和头孢霉属RYM-202的真菌或可由其产生。
其他有用的纤维素酶的实例为真菌或细菌来源的亲本纤维素酶的变体,例如可来自真菌腐质霉属、木霉属或镰孢菌属之一的种的菌株的亲本纤维素酶变体。
淀粉酶适合作为本发明上下文中使用类型的酶杂合体主要成分的淀粉酶(例如α或β淀粉酶)包括细菌或真菌来源的那些。文中包括这些淀粉酶的化学或遗传修饰突变体。有关的α淀粉酶包括例如可从芽孢杆菌种(特别为地衣芽孢杆菌(B.licheniformis)特定菌株)获得的α淀粉酶,更详细描述于GB 1296839。有关的市售淀粉酶包括Duramyl、Termamyl、Fungamyl和BAN(均可获得自Novozymes A/S,Bagsvaerd,丹麦)和RapidaseTM和MaxamylTMP(可获得自DSM,荷兰)。
其他有用的淀粉酶为CGTases(环糊精葡萄糖转位酶,EC 2.4.1.19),例如可从芽孢杆菌、Thermoanaerobactor或高温厌氧芽孢杆菌属(Thermoanaerobacterium)的菌种种获得的那些。
蛋白水解酶适合作为本发明上下文中使用类型的酶杂合体合适主要成分的蛋白酶(肽酶)包括动物、植物或微生物来源的那些。优选微生物来源的蛋白酶。文中包括这些蛋白酶的化学或遗传修饰突变体。蛋白酶可为丝氨酸蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例为枯草杆菌蛋白酶,特别是来自于芽孢杆菌的那些,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(描述于WO 89/06279)。胰蛋白酶样蛋白酶的实例为胰蛋白酶(例如猪或牛来源)和WO 89/06270中描述的镰孢霉蛋白酶。
相关的市售蛋白酶包括Alcalase、Savinase和Esperase(均可获得自Novozymes A/S,Bagsvaerd,丹麦)、MaxataseTM、MaxacalTM、MaxapemTM和ProperaseTM(可获得自DSM,荷兰)、PurafectTM和PurafectTMOXP(可获得自Genencor International,USA)和OpticleanTM和OptimaseTM(可获得自Solvay Enzymes)。
脂肪分解酶适合作为本发明上下文中使用类型的酶杂合体主要成分的脂肪分解酶(脂肪酶)包括细菌或真菌来源的那些。文中包括这些脂肪酶的化学或遗传修饰突变体。
有用的脂肪酶的实例包括Humicola lanuginosa脂肪酶(例如EP 258068和EP 305 216中所述);米赫根毛霉(Rhizomucor miehei)脂肪酶(例如EP 238 023中所述);假丝酵母(Candida)脂肪酶,例如南极假丝酵母(C.Antarctica)脂肪酶(例如EP 214 761中所述的南极假丝酵母脂肪酶A或B);假单胞菌(Pseudomonas)脂肪酶,例如EP 721 981中(例如可获得自保藏号FERM BP-4772的假单胞菌属SD705菌株的脂肪酶)、PCT/JP96/00426中、PCT/JP96/00454中(例如P.solanacearum脂肪酶)、EP 571 982中或WO 95/14783中(例如P.mendocina脂肪酶)所述的那些之一、产碱假单胞菌(P.Alcaligenes)或类产碱假单胞菌(P.Pseudoalcaligenes)脂肪酶(例如EP 218 272中所述)、洋葱假单胞菌(P.Cepacia)脂肪酶(例如EP 331 376中所述)、施氏假单胞菌(P.stutzeri)脂肪酶(例如GB 1,372,034中所公开的)或荧光假单胞菌(P.Fluorescens)脂肪酶;芽孢杆菌脂肪酶(例如枯草芽孢杆菌脂肪酶(Dartois等(1993)Biochemica et Biophysica Acta1131253-260)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)脂肪酶(JP64/744992)和短小芽孢杆菌(Bacillus pumilus)脂肪酶(WO 91/16422))。
另外,可使用大量克隆到的脂肪酶,包括Yamaguchi等(1991)在Gene10361-67中所述的沙门柏干酪青霉(Penicillium camembertii)脂肪酶、白地霉(Geotricum candidum)脂肪酶(Schimada等(1989)J.Biochem.106383-388),以及多种根霉(Rhizopus)脂肪酶,如R.delemar脂肪酶(Hass等(1991)Gene 109117-113)、R.niveus脂肪酶(Kugimiya等(1992)Biosci.Biotech.Biochem.56716-719)和稻根霉(Rhizopus oryzae)脂肪酶。
其他可能有用的脂肪分解酶类型包括角质酶(cutinases),例如来自WO88/09367中所述门多萨假单胞菌(Pseudomonas mendocina)的角质酶或来自Fusarium solani f.pisi(例如WO 90/09446中所述)的角质酶。
合适的市售脂肪酶包括Lipolase和Lipolase Ultra(可获得自Novozymes A/S)、M1 LipaseTM、LumafastTM和LipomaxTM(可获得自DSM,荷兰)和Lipase P″Amano″(可获得自Amano Pharmaceutical Co.Ltd.)。
氧化还原酶适合作为本发明上下文中使用的酶杂合体主要成分的氧化还原酶包括过氧化物酶(EC 1.11.1)和氧化酶,例如漆酶(EC 1.10.3.2)和某些相关的酶。
过氧化物酶过氧化物酶(EC 1.11.1)为作为受体作用于过氧化物(例如过氧化氢)的酶。非常合适的过氧化物酶为分类于EC 1.11.1.7的那些,或来自它们的显示过氧化物酶活性的任何片段。其合成的或半合成的衍生物(例如含卟啉环系统,或微过氧化物酶,参见例如US 4,077,768,EP 537381,WO91/05858和WO 92/16634)在本发明上下文中也可是有用的。
非常合适的过氧化物酶为可从植物或微生物(如真菌或细菌)获得的过氧化物酶(植物中如辣根过氧化物酶或大豆过氧化物酶)。在这一方面,一些优选的真菌包括属于Deuteromycotina亚门,Hyphomycetes纲的菌株,例如镰孢霉、腐质霉、木霉属、漆斑菌、轮枝孢属、Arthromyces、卡尔黑霉属(Caldariomyces)、单格孢属(Ulocladium)、艾氏霉属(Embellisia)、枝孢属(Cladosporium)或Dreschlera,特别为尖孢镰孢(DSM 2672)、Humicola insolens、Trichoderma resii、疣孢漆斑菌(Myrotheciumverrucaria)(IFO 6113)、黄萎轮枝孢(Verticillium alboatrum)、大丽花轮枝孢(Verticillium dahlie)、Arthromyces ramosus(FERM P-7754)、Cal-dariomyces fumago、单格孢(Ulocladium chartarum)、Embellisia alli或Dreschlera halodes。
其他优选的真菌包括属于Basidiomycotina亚门,担子菌纲(Basidiomycetes)的菌株,例如鬼伞属(Coprinus)、Phanerochaete、革盖菌属(Coriolus)或栓菌属(Trametes),特别为Coprinus cinereus f. microsporus(IFO 8371)、长根鬼伞(Coprinus macrorhizus)、黄孢原毛平革菌(例如NA-12)或毛栓菌(Trametes versicolor)(例如PR428-A)。
其他优选的真菌包括属于接合菌亚门(Zygomycotina)Mycoraceae纲的菌株,例如根霉或毛霉,特别为冻土毛霉(Mucor hiemalis)。
一些优选的细菌包括放线菌目(Actinomycetales)的菌株,例如浑球链霉菌(Streptomyces spheroids)(ATTC 23965)、热紫链霉菌(Streptomycesthermoviolaceus)(IFO 12382)或Strepto Verticillium verticillium ssp.Verticillium。
其他优选的细菌包括短小芽胞杆菌(Bacillus pumilus)(ATCC 12905)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、球形红杆菌(Rhodobactersphaeroides)、Rhodomonas palustri、乳链球菌(Streptococcus lactis)、Pseudo-monas purrocinia(ATCC 15958)或萤光假单胞菌(Pseudomonas fluorescens)(NRRL B-11)。
其他优选的细菌包括属于粘球菌属(Myxococcus)的菌株,例如变绿粘球菌属(M.virescens)。
其他有用的具体过氧化物酶的可能来源见Saunders等(1964)Peroxidase,41-43 London中所列。
过氧化物酶还可为可通过包括在允许过氧化物酶表达的条件下在培养基中培养用重组体DNA载体转化的宿主细胞,所述载体带有编码所述过氧化物酶的DNA序列和编码允许编码过氧化物酶的DNA序列表达的功能DNA序列,并从培养物中回收过氧化物酶的方法产生的过氧化物酶。
合适的重组产生的过氧化物酶为来自鬼伞属(特别是根据WO92/16634的长根鬼伞或C.cinereus)的过氧化物酶或其变体,例如WO94/12621中所述变体。
氧化酶和相关的酶本发明上下文中优选的氧化酶为分类于EC 1.10.3的氧化酶,其为使用分子氧作为受体的氧化酶(即催化氧化反应的酶,反应中分子氧作为氧化剂作用)。
如上所指,漆酶(EC 1.10.3.2)在本发明上下文中为非常合适的氧化酶。本发明上下文中其他有用的氧化酶包括儿茶酚氧化酶(EC 1.10.3.1)和胆红素氧化酶(EC 1.3.3.5)。其他有用的相关酶包括单酚单氧酶(EC1.14.18.1)。
漆酶可获得自多种植物和微生物来源,特别是来自细菌和真菌(包括丝状真菌和酵母),并且合适的漆酶实例可见于可获得自真菌的那些,包括可获得自来自曲霉、脉孢霉(例如粗糙脉孢菌)、柄孢壳属(Podospora)、葡萄孢属、金钱菌属(Collybia)、层孔菌属(Fomes)、香菇属(Lentinus)、侧耳属(Pleurotus)、栓菌属(例如长绒毛栓菌(T.villosa)或毛栓菌[一些以多种名称已知的和/或之前被分类为其他属的栓菌属的种/菌株;例如长绒毛栓菌=T.pinsitus=Polyporus pinsitis(也被称为P.pinsitus或P.villosus)=Coriolus pinsitus]、多孔菌(Polyporus)、丝核菌属(Rhizoctonia)(例如立枯丝核菌(R.solani))、鬼伞属(例如褶纹鬼伞(C.plicatilis)或C.cinereus)、小脆柄菇属(Psatyrella)、毁丝霉属(例如嗜热毁丝霉)、Schytalidium、射脉菌属(Phlebia)(例如射脉菌(P.radita);见WO 92/01046)、革盖菌属(例如C.hirsutus;见JP 2-238885)、梨孢菌属(Pyricularia)或硬孔菌属(Rigidoporus)菌株的漆酶。
本发明上下文中优选的漆酶包括可获得自栓菌属(例如长绒毛栓菌),毁丝霉属(例如嗜热毁丝霉(M.thermophila))、Schytalidium或多孔菌属菌种/菌株的漆酶。
其他酶适合作为在本发明上下文中使用类型的酶杂合体主要成分的其他种类酶包括果胶酶(例如果胶酸裂合酶(EC 4.2.2.2)、果胶裂合酶(EC 4.2.2.10)、鼠李糖半乳糖醛酸聚糖裂合酶(EC未定义))、内-1,4-半乳聚糖酶(EC3.2.1.89)、木葡聚糖酶(EC未定义)、木聚糖酶(EC 3.2.1.8)、arabinanase(EC3.2.1.99)、α-L-阿拉伯呋喃糖酶(EC 3.2.1.55)、甘露聚糖内-1,4-甘露糖苷酶(EC 3.2.1.78)、β-甘露糖苷酶(EC 3.2.1.25)、β-1,3-1,4-葡聚糖酶(EC 3.2.1.73)、鼠李糖半乳糖醛酸聚糖水解酶、外多聚半乳糖醛酸酶(EC 3.2.1.67)、鼠李糖半乳糖醛酸聚糖酶(EC未定义)、纤维素酶(EC 3.2.1.4)、葡聚糖1,3-β-葡萄糖苷酶(EC 3.2.1.58)、Licheninase(EC 3.2.1.73)、葡聚糖内-1,6-β-葡糖苷酶(EC 3.2.1.75)、甘露内-1,4-β-甘露糖酶(EC 3.2.1.78)、内-1,4-β-木聚糖酶(EC 3.2.1.8)、纤维素1,4--纤维二糖糖苷酶(EC 3.2.1.91)、纤维二糖水解酶(EC 3.2.1.91)、多聚半乳糖醛酸酶(EC 3.2.1.15)、乙酰基和甲基酯酶,例如鼠李糖半乳糖醛酸聚糖甲基酯酶、鼠李糖半乳糖醛酸聚糖乙酰基酯酶、果胶甲酯酶(EC 3.1.1.11)、果胶乙酰酯酶(EC未定义)、木聚糖甲基酯酶、木聚糖乙酰基酯酶(EC 3.1.1.72)、阿魏酸酯酶(EC 3.1.1.73)、苯乙烯醛基酯酶(EC 3.1.1.73)。
去污剂可向用于洗涤织物的去污剂(例如洗衣房去污剂或用于洗涤硬表面的去污剂,如盘子洗涤剂)中添加本发明的CBM。包含本发明CBM的去污剂组合物还可包含一个或多个选自蛋白酶、纤维素酶(内切葡聚糖酶)、β-葡聚糖酶、半纤维素酶、脂肪酶、过氧化物酶、漆酶、α-淀粉酶、葡萄糖淀粉酶、角质酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质酶、支链淀粉酶、果胶酸裂合酶、木葡聚糖酶、木聚糖酶、果胶乙酰酯酶、多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、果胶裂合酶、其他甘露糖聚酶、果胶甲酯酶、纤维二糖水解酶、转谷氨酰胺酶的酶或其混合物。
另外,根据本发明的去污剂组合物可包含普通的去污剂成分例如如WO 99/27082中所述的表面活性剂、增效剂、漂白剂、抑泡剂。
纺织品处理编织纺织品时,纱线被置于可观的机械牵引力下。为了防止断裂,通常用叫做“浆”的胶状物质将其包被(上浆)。
最普遍的浆纱剂为天然或修饰形式的淀粉。然而浆中也可富含其他多聚体物质,如聚乙烯醇(PVA)、聚乙烯吡咯酮(PVP)、聚丙烯酸(PAA)或纤维素衍生物(如羧甲基纤维素(CMC)、羟乙基纤维素、羟丙纤维素或甲基纤维素)。还可以在浆中添加少量脂肪或油作为润滑剂。
由于浆的存在,织物纤维不能吸收足量的水、织物整理剂或其他组合物(例如漂白剂、染色或防皱组合物)。因此只有在从织物中去除浆后才能均匀和耐久的整理该织物,为该目的去除浆的方法称为“脱浆”方法。
在浆中含有淀粉的情况下,可以使用降解淀粉的酶(如淀粉酶)进行脱浆处理。在浆中含有脂肪和/或油的情况下,脱浆处理可以包括使用脂肪分解酶(脂肪酶)。在浆中含有大量羧甲基纤维素(CMC)或其他纤维素衍生物的情况下,可以用单独或与其他物质组合(任选地与其他酶(如淀粉酶和/或脂肪酶)组合)使用纤维素酶进行脱浆处理。
本发明的目的之一是通过修饰酶以改进酶在脱浆条件下的性能,从而改变(提高)酶对纤维质织物的亲和力,由此修饰的酶与目的浆纱计更紧密接触。
因此本发明尤其涉及脱浆纤维质织物或纺织品的方法,其中用含有酶(特别是非纤维素分解酶)的催化(酶)活性氨基酸序列的修饰酶(酶杂合体)处理了织物或纺织品,所述序列与含有碳水化合物结合组件的氨基酸序列(如SEQ ID NO2的CBM)连接。该方法更详细地描述于WO97/28256。
术语“脱浆”旨在按常规方式理解,即从织物中去除浆纱剂。
洗涤洗涤过程在漂白和染色织物前从棉纤维中去除非纤维素物质,特别是角质层(主要由蜡组成)和初生细胞壁(主要由果胶、蛋白质和木葡聚糖组成)。适当的蜡去除对于得到高可湿性(获得良好染色的指标)是必要的。去除初生细胞壁可改善蜡去除并保证更均匀的染色。另外它在漂白过程中提高白度。
CBM1家族的CBM已知可楔进微晶纤维素如扩展蛋白和swollenin,并协助从织物中释放非纤维素组分或污染物。可以通过用CBM处理织物提高可染色性。本发明的CBM具有与CBM1家族的CBM类似的特性。因此,在洗涤过程中可以使用本发明的CBM从棉纤维中去除非纤维素物质。
亲和标签与碳水化合物可逆结合的CBM可用于分离和纯化靶多肽。家族I的CBM与微晶纤维素可逆结合,并且是可用于亲和层析的标签。
如Terpe(2003)Appl.Microbiol.Biotechnol.60523-533和US5,670,623所述,通过使用CBM作为亲和标签改进靶多肽的分离和纯化是本发明的目的之一。
分子的固定一些CBM与纤维素不可逆结合并可用于固定分子,如金属硫蛋白、植物螯合肽或酶。这种固定可用于如从环境中去除重金属污染物,其中重金属离子与多肽生物吸附剂(如金属硫蛋白或植物螯合肽)结合,并通过将CBM与碳水化合物物质结合不可逆固定CBM-生物吸附剂-重金属复合物(Xu et al.(2002)Biomacromolecules 3462-465)。通过作为融合蛋白使用SEQ ID NO2的CBM固定分子(如金属硫蛋白、植物螯合肽或酶)是本发明的目的之一。另外,通过用CBM固定,从环境中去除污染物(如重金属)的方法是本发明的目的之一。
CBM缀合物碳水化合物结合结构域的缀合物(如CBD缀合物)含有附着于多糖的至少两个CBD。多糖可以能够结合纤维素并有利地为蝗虫豆角胶。CBD缀合物能够如Unilever的GB 2376017中所述通过交联纤维来提高纤维素物质(如织物)的强度。通过使用SEQ ID NO2的CBM交联纤维来提高织物的强度和耐久性是本发明的目的之一。
CBD缀合物还可以在洗烫过程中的任一阶段中作为织物表面沉积材料的递送载体使用。可以通过包被有益试剂实现后一应用,可以通过化学方法直接包被或通过与结合有益试剂的化合物(如Unilever的GB 2376017中所述的胶囊)间接包被。这些有益试剂的实例为软化剂、织物整理剂、保护剂、芳香剂(如香料)和漂白剂。
软化剂的实例为粘土、阳离子型表面活性剂或硅化合物。织物整理剂和保护剂的实例为多聚体润滑剂、拒污剂、去污剂(soil release agent)、光保护剂如遮光剂、抗静电剂、染料固定剂、抗菌剂和抗真菌剂。芳香剂或香料可以包裹于如乳胶或微粒体或基于明胶的团聚体中。使用SEQ ID NO2的CBM作为递送载体于洗烫过程中在织物上沉积材料是本发明的目的之一。
焙烤已知在木聚糖酶或淀粉酶或其他焙烤活性酶中加入CBM可能导致在焙烤实验中比无CBM的酶更好的性能。WO 98/16112中描述了如何将防腐酶(如淀粉分解酶)与CBD融合并用于延缓焙烤面包腐败和老化。如WO 98/16112中所述将SEQ ID NO2的CBM与淀粉分解酶融合并用其延缓焙烤面包的腐败和老化是本发明的目的之一。
使用CBM产生生物乙醇可以从农业废物或生物质(生物燃料)产生乙醇。许多类型生物质(例如玉米杆、木浆和麦杆)的可转化为乙醇的组分由大量微晶纤维素组成。由于纤维素原纤维紧密地填充在一起并因而对于纤维素降解酶造成了接近性问题,因此微晶纤维素对酶降解具有天然抗性。大量在生物质中打开微晶纤维素结构的方法正处于研究中用蒸汽爆发的酸预处理是一个被深入研究的方法(Bura等(2002)Appl Biochem Biotechnol.98-10059-72)。湿氧化法是Naito等(2001)Journal of Chemical Engineering of Japan,34(12)1545-1548描述的另一方法。
有明显的证据证明纤维素结合结构域可以单独改变微晶纤维素的特性(Shoseyov等(2002)Proceedings of the 223th American Chemical SocietyNational Meeting.Orlando,Florida,USA)。使用本发明的CBM破坏见于产生生物燃料的生物质中的纤维素原纤维的微晶性质以提高纤维素降解酶对生物质的可接近性是本发明的目的之一。
修饰植物细胞壁通过将编码CBM(如CBD)的基因引入植物或微生物,可以在微生物或植物组织的细胞壁内表达CBD蛋白。已经显示CBD蛋白在植物细胞壁中结合新合成的纤维素纤维,该物理-机械干扰通过纤维素合酶酶复合物的亚单位解偶联纤维素合成。这导致提高的纤维素多聚体合成率,提高的多聚体质量和增加的生物质。细胞壁内提高的纤维素合成率导致增强的纤维素产生、植物水平上更高的生物质、改进的纤维特性,并可能提高对生物和非生物胁迫的抗性。可以将CBD编码基因插入阔叶林物种并可随后显示出具有木密度和纤维质量改善的显著体积增加。这些改善将延续到制成的纸张中,表现出增强的抗拉性、抗撕裂性和耐破度指标(US6,184,440)。
如US 6,184,440中所述将编码CBM的SEQ ID NO1 DNA序列插入植物以改变所述植物的细胞壁,引起增大的生长和生物质、提高的纤维素产生、改善的纤维特性、改善的家畜消化率和提高的产率特性是本发明的目的之一。
CBM组合物用于上述应用时,本发明的CBM可以是为特定应用产生的组合物的部分。这些组合物中的其他组分包括载体化合物和一种或多种选自以下的酶蛋白酶、纤维素酶、β-葡聚糖酶、半纤维素酶、脂肪酶、过氧化物酶、漆酶、α-淀粉酶、葡萄糖淀粉酶、蜡酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质酶、支链淀粉酶、果胶酸裂合酶、木葡聚糖酶、木聚糖酶、果胶乙酯酶、多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、果胶裂合酶、其他甘露聚糖酶、果胶甲酯酶、纤维二糖水解酶、转谷氨酰胺酶或其混合物。
本发明CBM的表达含有核苷酸序列的核酸构建体本发明涉及含有与一个或多个控制序列有效连接的本发明核苷酸序列的核酸构建体,所述控制序列于合适的宿主细胞中在与控制序列相容的条件下指导编码序列表达。
可以以多种方式操作编码本发明CBM的核苷酸序列,以提供CBM的表达。取决于表达载体,在插入载体前操作核苷酸序列可能是需要的或必要的。利用重组DNA方法修饰核苷酸序列的技术为本领域所熟知。
控制序列可以是适当的启动子序列、被用于表达该核苷酸序列的宿主细胞所识别的核苷酸序列。启动子序列含有介导表达多肽的转录控制序列。启动子可以是在选定的宿主细胞中表现转录活性的任何核苷酸序列(包括突变的、截短的和杂合的启动子),并可从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
用于指导本发明核酸构建体(特别是在细菌宿主细胞中)转录的适合的启动子实例为,可获得自大肠杆菌乳糖操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂水解酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽胞杆菌maltogenic淀粉酶基因(amyM)、解淀粉芽胞杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因,和原核β-内酰胺酶基因(Villa-Kamaroff等(1978)Proceedings of theNational Academy of Sciences USA 753727-3731)的启动子以及tac启动子(DeBoer等(1983)Proceedings of the National Academy of Sciences USA8021-25)。更多的启动子描述于Scientific American(1980)24274-94中的″Useful proteins from recombinant bacteria″和上文Sambrook等(1989)中。
用于指导本发明核酸构建体(特别是在真菌宿主细胞中)转录的适合的启动子实例为可获得自米曲霉TAKA淀粉酶基因、米赫根毛霉天冬氨酸蛋白酶基因、黑曲霉(Aspergillus niger)中性α-淀粉酶基因、黑曲霉酸性稳定α-淀粉酶基因、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)基因、米赫根毛霉脂肪酶基因、米曲霉碱性蛋白酶基因、米曲霉磷酸丙糖异构酶基因、构巢曲霉(Aspergillus nidulans)乙酰胺酶基因、和尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787)基因的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因启动子和米曲霉磷酸丙糖异构酶启动子的杂合体)和它们突变的、截短的和杂合的启动子。
在酵母宿主中有用的启动子可获得自酿酒酵母烯醇酶(ENO-1)基因、酿酒酵母半乳糖激酶(GAL1)基因、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因和酿酒酵母3-磷酸甘油酸激酶基因。其他有用于酵母宿主细胞的启动子由Romanos等(1992)Yeast 8423-488描述。
控制序列也可为适合的转录终止子序列(可被宿主细胞识别以终止转录的序列)。终止子序列有效连接于编码CBM的核苷酸序列的3’末端。本发明可使用任何在选择的宿主细胞中有功能的终止子。丝状真菌宿主细胞优选的终止子可获得自米曲霉TAKA淀粉酶基因、黑曲霉葡萄糖淀粉酶基因、构巢曲霉邻氨基苯甲酸合酶基因、黑曲霉α-葡萄糖苷酶基因和尖孢镰孢胰蛋白酶样蛋白酶基因。
酵母宿主细胞优选的终止子可获得自酿酒酵母烯醇酶基因、酿酒酵母细胞色素C(CYC1)基因和酿酒酵母甘油醛-3-磷酸脱氢酶基因。其他有用的酵母宿主细胞终止子由上文Romanos等(1992)描述。
控制序列还可为适合的前导序列(对宿主细胞翻译重要的mRNA非翻译区)。前导序列有效连接于编码多肽的核苷酸序列的5’末端。本发明可使用任何在选择的宿主细胞中有功能的前导序列。丝状真菌宿主细胞优选的前导序列可获得自米曲霉TAKA淀粉酶基因和构巢曲霉磷酸丙糖异构酶基因。
适合于酵母宿主细胞的前导可获得自酿酒酵母烯醇酶(ENO-1)基因、酿酒酵母3-酸甘油酸酯激酶基因、酿酒酵母α-因子基因和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因。
控制序列还可是多腺苷酸化序列(有效连接于核苷酸序列3’末端,转录时被宿主细胞作为向转录的mRNA添加多腺苷酸残基的信号而识别的序列)。本发明可使用在选择的宿主细胞中有功能的任何多腺苷酸化序列。
丝状真菌宿主细胞优选的多腺苷酸化序列可获得自米曲霉TAKA淀粉酶基因、黑曲霉葡萄糖淀粉酶基因、构巢曲霉邻氨基苯甲酸合酶基因、尖孢镰孢胰蛋白酶样蛋白酶基因和黑曲霉α-葡萄糖苷酶基因。
对酵母宿主细胞有用的多腺苷酸化序列由Guo和Sherman(1995)Molecular Cellular Biology 155983-5990描述。
控制序列还可是编码与多肽氨基端相连并指导编码的CBM进入细胞分泌途径的氨基酸序列的信号肽编码区。核苷酸序列的编码序列5’端可固有地包含天然连接于翻译读码框的信号肽编码区,所述读码框具有编码分泌的CBM的编码区片段。另外,编码序列的5’末端可包含对编码序列而言是外源的信号肽编码区。编码区天然不包含信号肽编码区时需要外源的信号肽编码区。另外,外源信号肽编码区可替换天然信号肽编码区以加强CBM的分泌。然而,本发明可使用任何指导表达的CBM进入选择的宿主细胞分泌途径的信号肽编码区。本发明CBM的天然信号肽编码区为编码SEQ ID NO2的1到20氨基酸的SEQ ID NO110到69核苷酸。
细菌宿主细胞的有效的信号肽编码区为可获得自芽孢杆菌NCIB11837麦芽糖(maltogenic)淀粉酶基因、嗜热脂肪芽孢杆菌α-淀粉酶基因、地衣芽孢杆菌枯草杆菌蛋白酶基因、地衣芽孢杆菌β-内酰胺酶基因、嗜热脂肪芽胞杆菌中性蛋白酶(nprT,nprS,nprM)基因和枯草芽孢杆菌prsA基因的信号肽编码区。其他信号肽由Simonen和Palva(1993)Microbiological Reviews 57109-137中描述。
丝状真菌宿主细胞有效的信号肽编码区为可获得自米曲霉TAKA淀粉酶基因、黑曲霉中性淀粉酶基因、黑曲霉葡萄糖淀粉酶基因、米赫根毛霉aspartic蛋白酶基因、Humicola insolens纤维素酶基因、南极假丝酵母脂肪酶基因和Humicola lanuginosa脂肪酶基因的信号肽编码区。
对酵母宿主细胞有用的信号肽可获得自酿酒酵母α-因子和酿酒酵母转化酶基因。其他有用的信号肽编码区由上文Romanos等(1992)描述。
控制序列还可是编码位于CBM氨基端氨基酸序列的前肽编码区。产生的多肽可被称为前CBM或前多肽。前多肽通常是非活性的并通过从前多肽催化或自催化切割前肽而转变为成熟的活性多肽。前肽编码区可获得自枯草杆菌酶碱性蛋白酶(aprE)基因、枯草杆菌酶中性蛋白酶(nprT)基因、酿酒酵母α-因子基因、米赫根毛霉天冬氨酸蛋白酶基因和嗜热毁丝霉漆酶(WO 95/33836)基因。
当多肽氨基端同时存在信号肽和前肽区时,前肽区位于紧邻多肽氨基端且信号肽位于紧邻前肽区氨基端。
在酵母中,可使用ADH2体系或GAL1体系。在丝状真菌中,可使用TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖淀粉酶启动子作为调节序列。其他调节序列的实例为允许基因扩增的那些。在真核体系中,这包括在氨甲喋呤存在时扩增的二氢叶酸还原酶基因和有重金属时扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列应与调节序列有效连接。
包含核酸构建体的重组表达载体本发明还涉及包含本发明核酸构建体的重组表达载体。可连接上述的多种核苷酸和控制序列以产生重组表达载体,其可包含一个或多个合宜的限制性酶切位点以允许在该位点插入或替换编码多肽的核苷酸序列。另外,可通过向适合的表达载体中插入核苷酸序列或包含该序列的核酸构建体来表达本发明的核苷酸序列。构建表达载体时,编码序列置于载体中使得编码序列与适合的控制表达的序列有效连接。
重组表达载体可是可方便地经受重组DNA操作并可引起核苷酸序列表达的任何载体(例如质粒或病毒)。载体的选择通常基于载体与该载体被引入的宿主细胞之间的相容性。载体可是线性的或闭合环状质粒。
载体可为自主复制载体(即作为其复制不依赖于染色体复制的染色体外实体存在的载体),例如质粒、染色体外元件、微型染色体或人工染色体。
载体可包含任何确保自身复制的工具。另外,载体可是导入宿主细胞中后整合进基因组并与其整合进的染色体共同复制的载体。另外,可使用单个载体或质粒或共同包含将要导入宿主细胞基因组的总DNA的两个或多个载体或质粒,或可使用转座子。
本发明载体优选包含一个或多个使得转化的细胞易于选择的选择性标记物。选择性标记物为其产物提供杀虫剂或病毒抗性、重金属抗性、对营养缺陷型原养型等的基因。
细菌选择标记物为来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或给予抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记物。适合于酵母宿主细胞的标记物为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。丝状真菌宿主细胞使用的选择性标记物包括(但不限于)amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合酶)及它们的等价物。曲霉细胞中优选使用的为构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)bar基因。
本发明的载体优选包含允许载体稳定整合进宿主细胞基因组或载体在细胞中不依赖于基因组自主复制的元件。为了整合进宿主细胞基因组,载体可依赖于编码多肽或任何其他可通过同源或非同源重组将载体稳定整合进基因组的载体元件的核苷酸序列。另外,载体可包含用于通过同源重组指导整合进宿主细胞基因组的额外的核苷酸序列。额外的核苷酸序列使得载体能够在染色体上精确的位点整合进宿主细胞基因组。为了提高在精确位点整合的可能性,整合元件应优选地包含足够数量的核苷酸,例如100到1500碱基对,优选400到1500碱基对,并最优选800到1500碱基对,其与相应的靶序列有高度的同源性以加强同源重组的可能性。整合元件可是与宿主细胞基因组中靶序列同源的任何序列。另外,整合元件可是非编码或编码核苷酸序列。另一方面,载体可通过非同源重组被整合进宿主细胞基因组。
为了自主复制,载体还可包含使载体能够在所述宿主细胞中自主复制的复制起始区。细菌复制起始区为质粒pBR322、pUC19、pACYC177和允许大肠杆菌中复制的pACYC184,和pUB110、pE194、pTA1060和允许芽孢杆菌中复制的pAMB1的复制起始区。酵母宿主细胞中使用的复制起始区实例为两微米复制起始区ARS1、ARS4,ARS1和CEN3的组合,以及ARS4和CEN6的组合。复制起始区可为使其在宿主细胞中以温度敏感的方式发挥功能的突变复制起始区(见例如Ehrlich(1978)Proceedings of theNational Academy of Sciences USA 751433)。
可向宿主细胞中插入多于一个拷贝的本发明核苷酸序列以提高基因产物的产生。核苷酸序列拷贝数的提高可通过向宿主细胞中整合至少一个额外的序列拷贝或通过包含带有可扩增选择性标记物基因的核苷酸序列(其中细胞包含扩大拷贝的选择性标记基因,由此核苷酸序列的额外拷贝可通过在存在适合的选择剂时培养细胞来选择)来获得。
本领域技术人员熟知用于连接上述元件以构建本发明重组表达载体的方法(见例如上文Sambrook等(1989))。
包含核酸构建体的重组宿主细胞本发明还涉及包含本发明核酸构建体的重组宿主细胞,其有利地用于多肽的重组生产。包含本发明核苷酸序列的载体被导入宿主细胞使得载体作为染色体整合体或作为前述染色体外自主复制载体存在。
宿主细胞可为单细胞微生物(例如原核生物)或非单细胞微生物(例如真核生物)。有用的单细胞细胞为细菌细胞(例如革兰氏阳性菌),包括(但不限于)芽孢杆菌细胞,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens);短芽孢杆菌、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽胞杆菌、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌(Bacillus thuringiensis);或链霉菌细胞,例如变铅青链霉菌或鼠灰链霉菌,或革兰氏阴性菌例如大肠杆菌和假单胞菌。在优选的实施方案中,细菌宿主细胞为迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽胞杆菌或枯草芽孢杆菌细胞。在另一优选的实施方案中,芽孢杆菌细胞为嗜碱的芽孢杆菌。
可例如通过原生质体转化(见例如Chang和Cohen(1979)MolecularGeneral Genetics 168111-115)、使用感受态细胞(见例如Young和Spizizin(1961)Journal of Bacteriology 81823-829,或Dubnau和Davidoff-Abelson(1971)Journal of Molecular Biology 56209-221)、电穿孔法(见例如Shigekawa和Dower(1988)Biotechniques 6742-751)或接合(见例如Koehler和Thorne(1987)Journal of Bacteriology 1695771-5778)实现载体向细菌缩主细胞的导入。
宿主细胞可是真核生物(例如哺乳动物、昆虫、植物)或真菌细胞。在优选的实施方案中,宿主细胞为真菌细胞。文中使用“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、Chytridiomycota和结合菌门(Zygomycota)(如Hawksworth等(1995)在Ainsworth and Bisby’sDictionary of The Fungi,第8版,CAB International,University Press,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等(1995)上文中所引)和所有的有些分裂孢子真菌(Hawksworth等(1995)上文)。
在一更优选的实施方案中,真菌宿主细胞为酵母细胞。文中使用的“酵母”包括产子囊酵母(内孢霉目(Endomycetales))、basidiosporogenous酵母和属于不完全真菌(芽酵母属(Blastomycetes))的酵母。由于酵母的分类将来可能改变,就本发明而言,酵母应如《Biology and Activities of Yeast》(Skinner、Passmore和Davenport编(1980)Soc.App.Bacteriol.Symposium Series No.9)中所述被定义。
在一甚至更优选的实施方案中,酵母宿主细胞为假丝酵母(Candida)、汉逊酵母(Hansenula)、克鲁维酵母(Kluyveromyces)、毕赤酵母(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或亚罗(Yarrowia)属细胞。在最优选的实施方案中,酵母宿主细胞为卡尔酵母(saccharomyces carlsbergensis)、酿酒酵母(saccharomyces cerevisiae)、糖化酵母(saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗酵母(saccharomyces kluyveri)、诺地酵母(saccharomyces norbensis)或卵形酵母(saccharomyces oviformis)。在另一最优选的实施方案中,酵母宿主细胞为乳酸克鲁维酵母(kluyveromyces lactis)细胞。在另一最优选的实施方案中,酵母宿主细胞为解脂亚罗(Yarrowia lipolytica)细胞。
在另一更优选的实施方案中,真菌宿主细胞为丝状真菌细胞。“丝状真菌”包括真菌亚门和卵菌门(如上文Hawksworth等(1995)定义)的所有丝状形式。丝状真菌以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝壁为特征。营养性生长通过菌丝伸长并且碳代谢专性需氧。相反的,酵母(例如酿酒酵母)的营养生长通过单细胞叶状体的出芽并且碳代谢可以为发酵的。
在一个甚至更优选的实施方案中,丝状真菌宿主细胞属于(但不限于)枝顶孢霉(Acremonium)、曲霉、镰孢霉、腐质霉、毛霉、毁丝霉、脉孢霉、青霉、梭孢壳属(Thielavia)、Tolypocladium或木霉属的细胞。在最优选的实施方案中,丝状真菌宿主细胞为泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)细胞。在另一最优选的实施方案中,丝状真菌宿主细胞为杆孢状镰孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporium)、合欢木镰孢(Fusarium negundi)、尖孢镰孢、多枝镰孢(Fusarium reticulatum)、玫瑰色镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum细胞。在非常最优选的实施方案中,丝状真菌亲本细胞为Fusarium venenatum细胞(Nirenberg sp.nov.,例如CBS 458.93,CBS 127.95,CBS 128.95,CBS 148.95编号下保藏的Fusarium venenatum)。在另一最优选的实施方案中,丝状真菌宿主细胞为Humicola insolens、Humicola lanuginosa、米赫根毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌、产紫青霉(Penicillium purpurogenum)、Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、瑞氏木霉或绿色木霉细胞。
真菌细胞可通过包括原生质体形成、原生质体转化和细胞壁再生的方法,以本身已知的方式被转化。适合的曲霉宿主细胞转化方法描述于EP238023和Yelton等(1984)Proceedings of the National Academy of SciencesUSA 811470-1474。合适的转化镰孢霉种的方法由Malardier等(1989)Gene78147-156和WO 96/00787描述。可使用Abelson和Simon编《Guide to YeastGenetics and Molecular Biology,Methods in Enzymology》,卷194182-187,Academic Press,Inc.,New York中Becker和Guarente描述的方法,以及Ito等(1983)Journal of Bacteriology 153163和Hinnen等(1978)Proceedings ofthe National Academy of Sciences USA 751920中描述的方法转化酵母。
制备功能CBM的方法本发明还涉及产生本发明CBM的方法,其包括(a)培养在野生型形式中能够产生CBM的菌株;(b)回收CBM的菌株。优选该菌株为真菌,更优选腐质霉属(特别是Humicola insolens)或鬼伞属(例如灰盖鬼伞)或梭孢壳属(例如Thielavia terrestris)或曲霉(例如米曲霉)。
本发明还涉及产生CBM多肽的方法,该方法包括在过量产生CBM的条件下于营养培养基中培养用表达盒转化的曲霉宿主细胞,所述表达盒包含下述有效连接的组件(a)转录和翻译起始调节区;(b)编码CBM多肽的DNA序列;(c)在宿主中有功能转录和翻译终止调节区;和(d)用于选择转化的宿主细胞的选择标记物基因,并回收CBM多肽。
在本发明生产方法中,细胞在适于使用本领域已知方法产生CBM的培养基中培养。例如,可通过摇瓶培养、在实验室或工业发酵罐中在适合的培养基中和允许多肽表达和/或分离的条件下小规模或大规模发酵(包括连续的、批式、补料分批式或固态发酵)来培养细胞。培养在包含碳源和氮源以及无机盐的合适的营养培养基中,使用本领域已知的方法完成。合适的培养基可购买自供货商或可根据发表的组合物制备(例如在AmericanType Culture Collection产品目录中)。如果CBM分泌进入营养培养基,可直接从培养基中回收CBM。如果CBM不是分泌的,可从细胞溶解产物中回收。
可使用本领域已知方法和该CBM特异的修饰检测产生的CBM。这些检测方法可包括使用特异的抗体或测定与碳水化合物底物(例如Avicel)结合。
产生的CBM可使用本领域已知方法回收。例如,可从营养培养基中通过传统方法回收CBM,包括(但不限于)离心、过滤、抽提、喷雾干燥、蒸发或沉淀。本发明多肽可通过多种本领域已知方法纯化,包括(但不限于)层析法(例如粒子交换、亲和、疏水、层析聚焦法和大小排阻)、电泳方法(例如制备级等电位焦距法)、差异溶解度法(例如硫酸铵沉淀)、SDS-PAGE或抽提(见例如Protein Purification,Janson and Ryden,eds(1989)VCH Publishers,New York)。
材料和方法测定CBM活性可使用PCR技术常规地获得来自给定生物的编码CBM的DNA序列,而且基于现有知识可能发现来自其他生物的同源序列。
设想通过克隆碳水化合物降解酶(如纤维素酶、木聚糖酶)或其他细胞壁降解酶并测量与靶碳水化合物的结合来发现新的CBM。惯例上假设如果酶有结合微晶纤维素产物Avicel活性,则基因的一部分编码纤维素结合结构域。在下文描述的标准条件下测试对Avicel的结合。
可通过在500ml缓冲的填料(slurry)(缓冲液0.1磷酸钠,pH 7.5)中使用10g Avicel测量纤维素亲和力,填料用勺子缓慢搅动并使其在室温溶胀30分钟。然后按照每150份Avicel对1份纤维素结合结构域的比例添加酶。这在冰上完成,使得于5到10分钟内给予最佳结合。然后可洗涤Avicel并直接用于SDS-PAGE,以使结合的蛋白质显影(因为使用SDS和煮沸将释放结合的蛋白质)。另外,将填料装进柱中并洗涤。结合的蛋白质在离子化的水中或高pH缓冲液(如三乙胺(pH 11.2;1%溶液))中洗脱,pH洗脱的蛋白质很快调节为中性。
普通的分子生物学方法使用Sambrook等,《Molecular CloningA Laboratory Manual》,ColdSpring Harbor Lab.,Cold Spring Harbor,NY(1989);Ausubel等编,《Current Protocols in Molecular Biology》,John Wiley and Sons(1995);Harwood和Cutting编,《Molecular Biological Methods for Bacillus》,JohnWiley and Sons(1990)中所述的标准分子生物学方法完成DNA操作和转化。
用于DNA操作的酶根据供应商的说明书使用。
实施例1构建由GH61家族酶分泌的来自假黑盘菌的CBM结构域的曲霉表达载体通过两种不同的克隆方案产生SEQ ID NO1的表达构建体。第一种方案(A)使用反向PCR删除从假黑盘菌中获得的GH61家族酶的酶核。产物的连接产生含有与编码碳水化合物结合组件的DNA框内融合的GH61酶天然分泌信号。第二种方案(B)为了产生本发明CBM过表达重组体,将编码CBM结构域的DNA克隆进包含假丝酵母脂肪酶信号肽的载体中。
A-反向PCR引物NP887U1和NP887D1作为5’磷酸化引物合成。编码GH61家族酶的全长开放读码框(ORF)的质粒DNA扩增物作为模板使用。使用引物NP887U1和NP887D1,可从保藏菌株CBS 444.97获得OFR。使用引物A和B的PCR反应中使用大约100纳克DNA作为模板。
NP887U1(SEQ ID NO3)5′-GACATCGTTGACGGAGAGTCCGTAGACACGA-3′NP887D1(SEQ ID NO4)5′-ACATCCTCCGGCACCTCCAATGACAAGGCCGTCG-3′下面的流程为Stratagene(USA)使用手册产品目录号200502中所述Excite PCR诱变的基础流程。
成分dH2O 32.75μl10X PfuUltra缓冲液 5.0μldNTPs(10mM储备液)1.25μl
NP887U1(100pMol/μl) 5.0μlNP887D1(100pMol/μl) 5.0μl向反应中添1μl PfuUltra(Stratagene,USA)然后将样品在如下条件置于热循环仪中95摄氏度 2分钟然后是以下20个循环95摄氏度 2分钟55摄氏度 30妙72摄氏度 7分钟取出5μl PCR反应物用于琼脂糖凝胶分析以确认预期大小(约6Kb)条带的扩增。向剩余的45μl中加入40单位Dpnl限制酶。将样品置于热循环仪中并在37摄氏度孵育30分钟,接着65摄氏度30分钟。按照生产商的说明书通过GFX柱纯化试剂盒(Amersham Biosciences,USA)纯化处理过的样品。
处理过的PCR样品 9μl10×连接缓冲液 1μl0.5μl New England Biolabs T4DNA连接酶(约200NEB粘末端单位)在17摄氏度过夜进行连接然后按照生产商的说明书转化进TOP10化学感受态细胞中。将转化物涂到含有50mg/l青霉素的LB琼脂上。从长出的数百个菌落中的11个小量(Qiaspincolumns,Qiagen Ltd.)制备质粒并用EcoRI和NotI切割以释放插入片段。11个质粒中的8个具有正确大小(约700bp)的插入片段。对这些含有插入片段的质粒的插入片段进行测序。使用载体引物PNA2I(5′-GTT TCC AAC TCA ATT TAC CTC-3′SEQ ID NO5)测序菌落。证明没有因为PCR而在任何一条插入片段序列中引入错误。在8个质粒中选择pCBMX-K1从100μl LB青霉素培养的含质粒大肠杆菌细胞中中等规模JetStar(GENOMED,Germany)制备质粒。
SEQ ID NO1和SEQ ID NO2中分别显示了PCBMX-K1融合结构的DNA序列和相应的氨基酸序列。
将pCBMX-K1构建体转化进米曲霉将SEQ ID NO1的DNA转化进米曲霉菌株JAL355(公开于国际专利申请WO 01/98484A1)。于选择性和非诱导条件下在含有作为碳源的1M蔗糖和10mM硝酸盐的Cove最小平板(Cove(1966)Biochim.Biophys.Acta 13351-56)上再分离SEQ ID NO1的转化体两次。为测试SEQ IDNO1的表达,在含有10ml YPM(2%蛋白胨、1%酵母提取物、2%麦芽糖)的试管中将转化体于30摄氏度下培养3天和4天。如生产商所推荐,将上清液置于NuPage10%Bis-Tris SDS凝胶(Invitrogen,USA)上电泳。即使在诱导表达SEQ ID NO1的DNA时,所有曲霉分离物也生长良好。
B-使用南极假丝酵母脂肪酶信号肽的CBM的构建和表达重组过表达本发明CBM结构域所使用的第二种方法是将CBM结构域克隆进特别制备的载体中,所述载体含有必要的曲霉调节元件(启动子、终止子等)和具有来自南极假丝酵母的分泌脂肪酶基因的具有信号切割位点的信号肽。将含有CBM结构域的PCR产物克隆进载体,使CBM结构域和信号肽框内融合。由于存在提供的分泌信号和切割位点,在米曲霉中表达该构建体应引起该酶的高效分泌。所使用的载体pDau109是描述于WO 03/008575的pJAL721的衍生物。
质粒pDau109通过将氨苄青霉素抗性基因插入pyrG可选择标记物而区别于pJaL721。PDau109中的改进首先是用通过插入氨苄青霉素抗性基因大肠杆菌β-内酰胺酶而被破坏的URA3基因取代了选择标记物大肠杆菌URA3。该特征允许在通常使用的LB氨苄青霉素平板上温和选择使用市售且高感受态菌株的阳性重组大肠杆菌克隆。另外可以使用侧翼的两个NotI位点完全去除氨苄青霉素抗性基因而恢复功能性选择标记物URA3。此外,pDau109具有引入在真菌启动子之后的南极假丝酵母脂肪酶(SWALLLLIPB_CANAR)信号肽(SEQ ID NO9的氨基酸1-57)和切割位点,其中大量方便的克隆位点可用于使提供的编码区和南极假丝酵母分泌信号框内融合。具体而言,pDau109具有8个可用于插入cDNA的单限制位点(BstXI-FspI-SpeI-NruI-XcmI-HindIII-XhoI)。使用标准方法将pJaL724修饰成pDau109。
通过中等规模Qiagenmidi质粒制备试剂盒(Qiagen)从100ml于LB氨苄青霉素中生长的含有质粒的大肠杆菌细胞中制备Pdau109质粒。
产生具有HindIII位点的CBM结构域在标准PCR反应中使用以下引物,为克隆的目的引入的HindIII限制位点为下划线部分NP887Dau1(SEQ ID NO6)5′-CCAAAGCTTTTCATCCTCCGGCACCTCCAATG-3′NP887Dau2(SEQ ID NO7)5′-GCGAAGCTTAATCTTACTCCATCTCACCTCCC-3′使用编码GH61编码区的NP887-1质粒作为PCR模板。
pNP887DNA(100ng) 1μl10X ProofStart缓冲液 5μldNTP 20mM 0.75μlNP887Dau1(100pMol/μl) 0.5μlNP887Dau2(100pMol/μl) 0.5μlH2O 41.25μlProofStartDNA聚合酶(Qiagen Ltd)1μl将样品转移到热循环仪中并按以下程序运行95摄氏度 5分钟然后是以下20个循环94摄氏度 30秒60摄氏度 30秒72摄氏度 1分钟在琼脂糖凝胶上检测5μl PCR反应物并观察到了正确大小(约500bp)的条带。通过GFX纯化方法(Amersham Biosciences)纯化剩余的45μl样品。接着在标准条件(40单位/μg DNA、37摄氏度)下用HindIII限制性切割样品过夜。再次GFX纯化处理过的片段(NP887-CBM)并在进一步使用前保存于-20摄氏度。
制备pDau109在标准条件下用HindIII限制性切割pDau109质粒DNA 4小时。在反应物中加入10单位的虾碱性磷酸酶并继续在37摄氏度额外孵育2小时。然后在65摄氏度热处理样品20分钟以失活酶。GFX纯化处理过的质粒并在进一步使用前保存于-20摄氏度。
连接载体pDau109 HindIII*1μl(约90ng)NP887-CBM PCR frag-HindIII7μlT4 DNA连接酶缓冲液(NEB) 1μlNEB T4 DNA连接酶 0.3μl在16摄氏度下过夜完成连接,然后储存在-20摄氏度直到使用。
转化在16摄氏度过夜完成连接,然后根据制造商说明转化进TOP10化学感受态细胞。将转化产物涂布在含有50mg/L氨苄青霉素的LB琼脂上。从成百个长出的菌落中的12个中小量制备(Qiaspincolumns,QiagenLtd.)质粒并用HindIII酶切DNA以释放插入物。12种质粒中的4个具有正确大小的插入(约500bp)。使用载体引物PNA21测序(SEQ ID NO5)含有插入物的质粒以确定完整性和插入方向。确定了没有错误被引入任一PCR产生的插入序列中。发现质粒pCBMX-S1没有错误并且是正确方向,因此被选择用于从100μl在氨苄青霉素LB中生长的含质粒大肠杆菌细胞的培养基规模Qiagenmidi质粒制备(Qiagen)。融合构建体pCBMX-S1的DNA序列和相应的氨基酸序列分别示于SEQ ID NO8和SEQ ID NO9。
构建体pCBMX-S1向米曲霉的转化将融合构建体pCBMX-S1(SEQ ID NO8)转化入米曲霉菌株BECh2,其如WO 00/39322所述构建(BECh2来自米曲霉菌株JaL228,该菌株如WO 98/12300所述在保存菌株米曲霉IFO 4177基础上构建)。
转化培养基AMDS培养基琼脂糖20gCove盐20ml(Cove(1966)上文)蔗糖 342gdH2O 补足100ml121摄氏度高压灭菌20分钟,冷却后添加1M 乙酰唑胺 10ml1M CsCl 15ml用于再分离转化株的AMDS培养基与上文相同但不添加CsCl并且每1000ml培养基中添加100μl triton-X100。
在含有1M蔗糖作为碳源和10mM硝酸盐的Cove蔗糖培养基(Cove(1966)Biochim.Biophys.Acta 13351-56)上再分离pCBMX-S1转化株两次。为测试含有南极假丝酵母脂肪酶(SWALLLIPB_CANAR)信号序列和本发明的假黑盘菌CBM多肽(SEQ ID NO8)的融合构建体pCBMX-S1的表达,在含有10ml YPG(2%蛋白胨、1%酵母提取物、2%葡萄糖)的试管中将23个转化体于30摄氏度培养3天和4天。如生产商所推荐将上清液置于NuPage10%Bis-Tris SDS凝胶(Invitrogen,USA)上电泳。根据生产商的说明书(Molecular Probes,USA)使用SYPROOrange凝胶染色。三个分离物在SDS凝胶上显示出35-45kDa间的弥散条带。使用多个150ml摇瓶培养基发酵进行进一步分析这些。使用带侧板的1000ml锥形烧瓶和每种150ml的4种不同培养基YPM2%蛋白胨、1%酵母提取物、2%麦芽糖YPG2%蛋白胨、1%酵母提取物、2%葡萄糖DAP2CFor 1升培养基中MgSO4·7H2O(Merck 5886)11g、KH2PO4(Merck 4873)1g、柠檬酸(Merck 244)2g、麦芽糊精(Roquette)、K3PO4·H2O5.2g、酵母提取物(Difco 0127)0.5g,AMG孢子金属0.5mls(氯化锌Merck8816,6.8g、硫酸铜Merck 2790,2.5g、氯化镍Merck 6717,0.24g、硫酸铁Merck 3965,13.9g、硫酸锰Merck 5941,8.45g、柠檬酸Merck 0244,3g)、PluronicPE 6100(BASF)。
FG4P3%大豆粉(SFK 102-2458)、1.5%麦芽糊精(Roquette)、0.5%Peptone bacto(Difco 0118)、1.5%KH2PO4(Merck 4873)、0.2ml/升PluronicPE 6100(BASF)。
每种使用数千孢子的重接种物,并在30摄氏度下在定轨摇床上以150RPM振荡摇瓶。
在诱导表达本发明的CBM多肽时,曲霉分离物也生长良好。
实施例2从曲霉中表达SEQ ID NO8的表达纯化SEQ ID NO9在摇瓶中生长实施例1B中描述的表达带有南极假丝酵母脂肪酶信号肽的假黑盘菌CBM(CBMX)的米曲霉菌株。过滤除菌大约1升的液体培养基并将滤出液上样到含有50g Avicel的柱中。通过用Milli-Q水洗涤去除不结合或弱结合的蛋白质。用0.1M Tris(pH 11.5)洗脱对Avicel亲和的蛋白质。洗脱后立即将Avicel结合级分的pH调节至7.5,并使用具有6kDa截断膜的Amicon单元(cell)(Millipore,USA)浓缩级分。在SDS-PAGE中,结合Avicel的大部分蛋白质显示分子量35-45kDa的宽谱带,其远高于蛋白质碳水化合物结合组件部分的分子量。高及不均一的分子量可能是由于蛋白质N端部分的O-和N-糖基化的不均一性。35-45kDa带的N端测序产生唯一的序列SFSSSGT(SEQ ID NO9的位置47-53)表明不存在N端氨基酸序列不均一性。
实施例3纯化的CBMX的结合特异性进一步研究了具有Avicel亲和力并如实施例2(CBMX)中所述而纯化的的碳水化合物结合结构域。在Eppendorf管中将50μl纯化的CBMX与500μl包含不同数量Avicel(0-100mg/ml)的20mM Tris(pH 7.5)混合。室温搅动温育4小时后,离心样品。转移200μl上清液至微孔板(Costar,UV平板)孔中并在微孔板读数器(SpectraMaxPlus,Molecular Devices)上读出280nm处的吸光度。表1中的结果指出大部分蛋白质与最高浓度Avicel结合。
表1CBMX与Avicel的结合。A280微孔板中200μl上清液在280nm处的吸光度减去缓冲液和Avicel的吸光度。

较短孵育时间(15分钟至1小时)的实验产生较少的完全结合。
使用PASC(Phosphoric Acid Swollen Cellulose5g水合的Avicel添加150ml冰预冷的85正磷酸。1小时冰浴搅拌后,加入500ml冷丙酮。过滤悬浮液并先用丙酮再用水洗涤)进行了类似的结合研究。在Eppendorf管中混合50μl纯化的CBMX与500μl包含不同数量PASC(0-10mg/ml)的20mM Tris(pH 7.5)。样品在室温下搅动温育4小时。离心后,转移200μl上清液至微孔板孔中并读出280nm处的吸光度。表2中的结果显示PASC数量的提高降低了上清液中CBMX的吸光度数量,即CBMX对PASC有亲和力。
表2CBMX与PASC的结合。A280微孔板中200μl上清液在280nm处的吸光度减去缓冲液的吸光度。

通过混合100μl CBMX与Avicel(400μl 50mg/ml于20mM Tris,pH7.5)和可溶性碳水化合物(溶解于500μl 20mM Tris,pH 7.5),在竞争实验中测定CBMX与许多可溶性碳水化合物的亲和力。作为参照,使用不添加CBMX或可溶性碳水化合物的样品。如果CBMX与可溶性碳水化合物有亲和力,则应该能够将CBMX保持在溶液中,这可通过与未添加可溶性碳水化合物样品相比280nm处的吸光度增加来测量。室温搅动孵育4小时后离心样品并使用200μl上清液在微孔UV板中读出280nm处吸光度。
测试的可溶性碳水化合物为大麦B-葡聚糖(Megazyme,低粘度)、地衣多糖(Megazyme,冰岛苔藓)、CMC(羧甲基纤维素7LF,Hercules,USA)、木葡聚糖(Megazyme,淀粉状蛋白,来自罗晃子种子)、羽扇豆半乳聚糖(Megazyme)和豆角胶(Sigma,G-0753)。
根据表3中的结果,可见β-葡聚糖和CMC能够将几乎所有CBMX保持在溶液中。豆角胶也保持大部分CBMX在溶液中,而木葡聚糖和半乳聚糖引起大约一半的CBMX在溶液中。地衣多糖的添加不引起溶液中CBMX的任何增长。这些结果指出CBMX对β-葡聚糖、CMC和豆角胶有亲和力,以及某种程度对木葡聚糖和半乳聚糖亦有亲和力,而对地衣多糖则没有可检测到的亲和力。
表3与CBMX、Avicel(20mg/ml)和可溶性碳水化合物的竞争性结合实验。碳水化合物浓度与BMX和Avicel温育时的可溶性碳水化合物的浓度。A280差异添加或不添加CBMX的样品之间280nm吸光度的差异。

序列表<110>诺和酶股份有限公司<120>真菌碳水化合物结合组件<130>10499.000-DK<160>9<170>PatentIn版本3.2<210>1<211>629<212>DNA<213>假黑盘菌<220>
<221>CDS<222>(10)..(531)<400>1gaattcaaa atg gtc aac ttc acc acc ctc ctc ccg gtt ctt gcc gct ctt51Met Val Asn Phe Thr Thr Leu Leu Pro Val Leu Ala Ala Leu1 5 10att gga gct gcc aat gcc cac act cgt gtc tac gga ctc tcc gtc aac 99Ile Gly Ala Ala Asn Ala His Thr Arg Val Tyr Gly Leu Ser Val Asn15 20 25 30gat gtc aca tcc tcc ggc acc tcc aat gac aag gcc gtc gct tct tcc 147Asp Val Thr Ser Ser Gly Thr Ser Asn Asp Lys Ala Val Ala Ser Ser35 40 45agt att gcg gcc gtg gac cct gtg acc agc tcc gtc gta gcc tct gtt 195Ser Ile Ala Ala Val Asp Pro Val Thr Ser Ser Val Val Ala Ser Val50 55 60cag gte cct aac ttc act gcc act gac gtc ccc act ttt act gcc acc 243Gln Val Pro Asn Phe Thr Ala Thr Asp Val Pro Thr Phe Thr Ala Thr65 70 75
gac atc cct act ttc act gct act gat gtt cct atc ttc acc aag aag 291Asp Ile Pro Thr Phe Thr Ala Thr Asp Val Pro Ile Phe Thr Lys Lys80 85 90ccc caa cag ccc tca act tta ttg acc cgc acc cgt acc cat gcc tct 339Pro Gln Gln Pro Ser Thr Leu Leu Thr Arg Thr Arg Thr His Ala Ser95 100 105 110gtt tca ttc gtc gct aag ccc tcc gct ttt att ccc aag cct tcc gcg 387Val Ser Phe Val Ala Lys Pro Ser Ala Phe Ile Pro Lys Pro Ser Ala115 120 125agc aca atc ccg tca aag ccc aag act ccc gaa gag gtt aat aag tgc 435Ser Thr Ile Pro Ser Lys Pro Lys Thr Pro Glu Glu Val Asn Lys Cys130 135 140ctt gac gct gtc aac gcc tgt att aca cag gcc cag agc tcc att gga 483Leu Asp Ala Val Asn Ala Cys Ile Thr Gln Ala Gln Ser Ser Ile Gly145 150 155gga gtt gtc aac ttt gag cct tgc gag agc cag aga gct ctt tgc tat 531Gly Val Val Asn Phe Glu Pro Cys Glu Ser Gln Arg Ala Leu Cys Tyr160 165 170taggaactgc aaagaatctg gggggatggt agcgaggttg agaggtggag gagcggagga591gtaggggagg tgagatggag taagattaag cggccgca629<210>2<211>174<212>PRT<213>假黑盘菌<400>2Met Val Asn Phe Thr Thr Leu Leu Pro Val Leu Ala Ala Leu Ile Gly1 5 10 15Ala Ala Asn Ala His Thr Arg Val Tyr Gly Leu Ser Val Asn Asp Val20 25 30
Thr Ser Ser Gly Thr Ser Asn Asp Lys Ala Val Ala Ser Ser Ser Ile35 40 45Ala Ala Val Asp Pro Val Thr Ser Ser Val Val Ala Ser Val Gln Val50 55 60Pro Asn Phe Thr Ala Thr Asp Val Pro Thr Phe Thr Ala Thr Asp Ile65 70 75 80Pro Thr Phe Thr Ala Thr Asp Val Pro Ile Phe Thr Lys Lys Pro Gln85 90 95Gln Pro Ser Thr Leu Leu Thr Arg Thr Arg Thr His Ala Ser Val Ser100 105 110Phe Val Ala Lys Pro Ser Ala Phe Ile Pro Lys Pro Ser Ala Ser Thr115 120 125Ile Pro Ser Lys Pro Lys Thr Pro Glu Glu Val Asn Lys Cys Leu Asp130 135 140Ala Val Asn Ala Cys Ile Thr Gln Ala Gln Ser Ser Ile Gly Gly Val145 150 155 160Val Asn Phe Glu Pro Cys Glu Ser Gln Arg Ala Leu Cys Tyr165 170<210>3<211>31<212>DNA<213>假黑盘菌<220>
<221>misc_feature Primer NP887U1
<222>(1)..(31)<400>3gacatcgttg acggagagtc cgtagacacg a31<210>4<211>34<212>DNA<213>假黑盘菌<220>
<221>misc_feature Primer NP887D1<222>(1)..(34)<400>4acatcctccg gcacctccaa tgacaaggcc gtcg 34<210>5<211>21<212>DNA<213>人工的<220>
<223>引物PNA2I<220>
<221>misc_feature Primer PNA2I<222>(1)..(21)<400>5gtttccaact caatttacct c 21<210>6<211>32<212>DNA<213>人工的<220>
<223>引物NP887Dau1
<220>
<221>misc_feature Primer NP887Dau1<222>(1)..(32)<400>6ccaaagcttt tcatcctccg gcacctccaa tg 32<210>7<211>32<212>DNA<213>人工的<220>
<223>引物N887Dau2<220>
<221>misc_feature Primer NP887Dau2<222>(1)..(32)<400>7gcgaagctta atcttactcc atctcacctc cc 32<210>8<211>573<212>DNA<213>假黑盘菌<220>
<221>CDS<222>(1)..(570)<223>假丝酵母脂肪酶信号肽位置1-57、假丝酵母脂肪酶序列位置positions 58-147、假黑盘菌CBM多肽位置148-570。
<400>8atg aag cta ctc tct ctg acc ggt gtg gct ggt gtg ctt gcg act tgc48Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys1 5 10 15
gtt gca gcc act cct ttg gtg aag tgc gca act agt ggc cat tac ggc96Val Ala Ala Thr Pro Leu Val Lys Cys Ala Thr Ser Gly His Tyr Gly20 25 30ctc gcg agg ccg cct cgg ccc caa cga att ctt gga ata tta agc ttt144Leu Ala Arg Pro Pro Arg Pro Gln Arg Ile Leu Gly Ile Leu Ser Phe35 40 45tca tcc tcc ggc acc tcc aat gac aag gcc gtc gct tct tcc agt att192Ser Ser Ser Gly Thr Ser Asn Asp Lys Ala Val Ala Ser Ser Ser Ile50 55 60gcg gcc gtg gac cct gtg acc agc tcc gtc gta gcc tct gtt cag gtc240Ala Ala Val Asp Pro Val Thr Ser Ser Val Val Ala Ser Val Gln Val65 70 75 80cct aac ttc act gcc act gac gtc ccc act ttt act gcc acc gac atc288Pro Asn Phe Thr Ala Thr Asp Val Pro Thr Phe Thr Ala Thr Asp Ile85 90 95cct act ttc act gct act gat gtt cct atc ttc acc aag aag ccc caa336Pro Thr Phe Thr Ala Thr Asp Val Pro Ile Phe Thr Lys Lys Pro Gln100 105 110cag ccc tca act tta ttg acc cgc acc cgt acc cat gcc tct gtt tca384Gln Pro Ser Thr Leu Leu Thr Arg Thr Arg Thr His Ala Ser Val Ser115 120 125ttc gtc gct aag ccc tcc gct ttt att ccc aag cct tcc gcg agc aca432Phe Val Ala Lys Pro Ser Ala Phe Ile Pro Lys Pro Ser Ala Ser Thr130 135 140atc ccg tca aag ccc aag act ccc gaa gag gtt aat aag tgc ctt gac480Ile Pro Ser Lys Pro Lys Thr Pro Glu Glu Val Asn Lys Cys Leu Asp145 150 155 160gct gtc aac gcc tgt att aca cag gcc cag agc tcc att gga gga gtt528Ala Val Asn Ala Cys Ile Thr Gln Ala Gln Ser Ser Ile Gly Gly Val165 170 175gtc aac ttt gag cct tgc gag agc cag aga gct ctt tgc tat tag573Val Asn Phe Glu Pro Cys Glu Ser Gln Arg Ala Leu Cys Tyr180 185 190
<210>9<211>190<212>PRT<213>假黑盘菌<400>9Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys1 5 10 15Val Ala Ala Thr Pro Leu Val Lys Cys Ala Thr Ser Gly His Tyr Gly20 25 30Leu Ala Arg Pro Pro Arg Pro Gln Arg Ile Leu Gly Ile Leu Ser Phe35 40 45Ser Ser Ser Gly Thr Ser Asn Asp Lys Ala Val Ala Ser Ser Ser Ile50 55 60Ala Ala Val Asp Pro Val Thr Ser Ser Val Val Ala Ser Val Gln Val65 70 75 80Pro Asn Phe Thr Ala Thr Asp Val Pro Thr Phe Thr Ala Thr Asp Ile85 90 95Pro Thr Phe Thr Ala Thr Asp Val Pro Ile Phe Thr Lys Lys Pro Gln100 105 110Gln Pro Ser Thr Leu Leu Thr Arg Thr Arg Thr His Ala Ser Val Ser115 120 125Phe Val Ala Lys Pro Ser Ala Phe Ile Pro Lys Pro Ser Ala Ser Thr130 135 140
Ile Pro Ser Lys Pro Lys Thr Pro Glu Glu Val Asn Lys Cys Leu Asp145 150 155 160Ala Val Asn Ala Cys Ile Thr Gln Ala Gln Ser Ser Ile Gly Gly Val165 170 175Val Asn Phe Glu Pro Cys Glu Ser Gln Arg Ala Leu Cys Tyr180 185 190
权利要求
1.碳水化合物结合组件,其为(a)由SEQ ID NO1位置109-531的DNA序列或与SEQ ID NO1位置109-531有至少50%同一性的与SEQ ID NO1同源的DNA序列编码的多肽,或(b)通过在表达DNA序列的条件下培养包含SEQ ID NO1位置109-531的DNA序列的细胞产生的多肽,或(c)具有SEQ ID NO2位置34-174氨基酸序列的多肽,或与SEQ IDNO2同源且与SEQ ID NO2位置34-174有至少50%同一性的多肽,或(d)由在低严格条件下与SEQ ID NO1位置109-531DNA序列杂交的DNA序列编码的多肽,或(e)分离的多核苷酸分子编码的多肽,该多核苷酸分子与变性的双链DNA探针在低严格条件下杂交,其中探针选自包含SEQ ID NO1位置109-531所示序列的DNA探针,以及包含SEQ ID NO1位置109-531的子序列的DNA探针,该子序列有至少大约300碱基对的长度。
2.权利要求1中的碳水化合物结合组件,其由可从假黑盘菌CBS 444.97中获得的DNA序列编码。
3.编码具有碳水化合物结合组件活性多肽的分离的核苷酸分子,其选自(a)包含SEQ ID NO1中由109核苷酸至531核苷酸所示的核苷酸序列的多核苷酸分子;(b)编码与SEQ ID NO2位置34-174氨基酸序列有大于50%同一性的多肽或其具有碳水化合物结合组件活性的片段的多核苷酸分子;(c)与(a)或(b)互补的分子;和(d)(a)或(b)的简并核苷酸序列。
4.根据权利要求3的分离的多核苷酸分子,其中多核苷酸为DNA。
5.编码具有碳水化合物结合组件活性多肽的分离的多核苷酸分子,该多核苷酸分子与变性的双链DNA探针在低严格条件下杂交,其中探针选自包含SEQ ID NO1位置109-531所示序列的DNA探针,以及包含SEQID NO1位置109-531至少大约300碱基对长度的子序列的DNA探针。
6.根据权利要求3的分离的多核苷酸分子,其分离自如细菌的原核生物或如真菌或酵母的真核生物的DNA文库或在其基础上产生。
7.根据权利要求6的分离的多核苷酸分子,其分离自假黑盘菌属菌株的DNA文库或在其基础上产生,优选的是假黑盘菌CBS 444.97菌株的DNA文库。
8.多核苷酸构建体,其包含根据权利要求3-7中任一项的多核苷酸分子。
9.权利要求8的多核苷酸构建体,其包含一个或多个控制序列,这些控制序列例如启动子、前导序列、多腺苷酸化序列、信号肽、前肽及转录终止序列。
10.包含有效连接的转录启动子、DNA片段和转录终止子的表达载体,其中DNA片段选自(a)编码具有碳水化合物结合组件活性的多核苷酸分子,其包含SEQ ID NO1从核苷酸109-531所示核苷酸序列;(b)编码具有碳水化合物结合组件活性且与SEQ ID NO2位置34-174氨基酸序列同一性大于50%的多肽或其具有碳水化合物结合组件活性的片段的多核苷酸分子;以及(c)(a)或(b)的简并核苷酸序列。
11.培养的细胞,其导入了根据权利要求10的表达载体,其中所述细胞表达DNA片段编码的多肽。
12.根据权利要求11的细胞,其为真核细胞,具体的为真菌细胞或产生编码显示内-β-1,4-葡聚糖酶活性的多肽的DNA片段的内源细胞。
13.根据权利要求12的细胞,其中该细胞属于曲霉菌株,优选米曲霉菌株,优选米曲霉BECh2菌株。
14.产生具有碳水化合物结合组件活性的多肽的方法,其包括培养根据权利要求11的细胞,其中所述细胞表达DNA片段编码的多肽;并回收该多肽。
15.具有碳水化合物结合组件活性的分离的多肽,其中该多肽(i)不含有同源杂质,并且(ii)由根据权利要求14的方法产生。
16.包含根据权利要求1、2或15的CBM的组合物。
17.权利要求16的组合物,还包括一个或多个选自蛋白酶、纤维素酶、β-葡聚糖酶、半纤维素酶、脂肪酶、过氧化物酶、漆酶、α-淀粉酶、葡萄糖淀粉酶、角质酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质酶、支链淀粉酶、果胶酸裂合酶、木葡聚糖酶、木聚糖酶、果胶乙酰酯酶、多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、果胶裂合酶、其他甘露糖聚酶、果胶甲酯酶、纤维二糖水解酶、转谷氨酰胺酶;或其混合物。
18.降解含纤维素生物质的方法,其中该生物质用有效数量的根据权利要求1-2和15的碳水化合物组件或根据权利要求16到17的组合物处理。
19.内切葡聚糖酶杂合体,其显示包含根据权利要求1、2或15的CBD和催化结构域的内-β-1,4-葡聚糖酶活性。
20.组合物,其包含根据权利要求1、2或15的碳水化合物结合组件或权利要求19的内切葡聚糖酶杂合体。
21.根据权利要求1、2或15的碳水化合物结合组件或权利要求19的内切葡聚糖酶杂合体在去污剂组合物中的用途。
22.根据权利要求1、2或15中任一项的碳水化合物结合组件或权利要求19的内切葡聚糖酶杂合体在纺织品染整加工中的用途。
23.根据权利要求1、2或15中任一项的碳水化合物结合组件在多肽纯化中的用途。
24.根据权利要求1、2或15中任一项的碳水化合物结合组件用于活性酶固定的用途。
25根据权利要求1、2或15中任一项的碳水化合物结合组件在焙烤中的用途。
26.根据权利要求1、2或15中任一项的碳水化合物结合组件用于制造生物燃料的用途。
27.根据权利要求1、2或15中任一项的碳水化合物结合组件用于修饰植物细胞壁的用途。
28.根据权利要求1、2或15任一项的碳水化合物结合组件在纤维织物加工中的用途。
全文摘要
本发明涉及属于CBM新家族的非催化性碳水化合物结合组件(CBM)。发现本发明的CBM附着于糖基水解酶家族61(GH61)多肽并显示与已知的CBM几乎没有同源性,这表示它是CBM新家族的第一个已知成员。本发明还涉及优选对纤维素显示出亲和力的CBM;产生该CBM的方法;以及在纺织品、洗涤剂和纤维素纤维生产工业中、纯化多肽、活性酶固定、焙烤、制造生物燃料、改变植物细胞壁中使用该CBM的方法。
文档编号C12N15/62GK1875098SQ200480032596
公开日2006年12月6日 申请日期2004年10月26日 优先权日2003年10月30日
发明者K·M·施诺尔, L·L·H·克里斯坦森 申请人:诺和酶股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1