耐热性纤维二糖水解酶的制作方法

文档序号:14453276阅读:325来源:国知局
耐热性纤维二糖水解酶的制作方法

本发明涉及纤维二糖水解酶的耐热性。纤维二糖水解酶是水解纤维素、半纤维素等木质纤维素而生成单糖的过程中涉及的糖苷水解酶的一种。更具体而言,本发明涉及一种新耐热性纤维二糖水解酶、编码该耐热性纤维二糖水解酶的多核苷酸、用于表达该耐热性纤维二糖水解酶的表达载体、整合了该表达载体的转化体、以及使用该耐热性纤维二糖水解酶的纤维素分解产物的制造方法。

本申请要求2013年3月27日提交的国际申请号为PCT/JP2013/059028号的国际申请的优先权,并在本文中引用其内容。



背景技术:

除地球温暖化和大气污染等环境上的问题之外,出于对原油价格的大幅上涨、以及不久的将来的原油枯竭的预想(石油峰值论)等运输用能源供应的担忧,近年来,石油替代能源的开发成为非常重要的课题。植物生物质或木质纤维素是地球上最丰富的可再生能源,作为石油替代资源而备受期待。生物质干重的主要成分为纤维素、半纤维素等多糖类以及木质素。例如,多糖类被统称为纤维素酶的糖苷水解酶水解为葡萄糖或木糖等单糖后,用作生物燃料或化学品原料。

具有复杂结构的木质纤维素是难分解性的,难以用单一的酶分解或糖化。对于木质纤维素的全分解,通常需要糖苷水解酶中的内切葡聚糖酶(纤维素酶或内切-1,4-β-D-葡聚糖酶,EC 3.2.1.4)、外切型纤维二糖水解酶(1,4-β-纤维二糖糖苷酶(cellobiosidase)或纤维二糖水解酶,EC 3.2.1.91)、β-葡萄糖苷酶(EC 3.2.1.21)这三种酶。对于木质纤维素的水解,据认为另外还需要适当添加作为半纤维素酶的木聚糖酶(内切-1,4-β-木聚糖酶,EC 3.2.1.8)、以及包括其他植物细胞壁 分解酶的多个酶。

在以木质纤维素为资源制造生物乙醇时,以乙醇的高能效转化为目的,尝试了基于高固体负荷(30~60%的固体负荷)的糖化处理。这种基于高固体负荷的糖化虽然生物质糖化液的粘性高、难以进行酶促反应,但是通过在高温下进行,使生物质糖化液的粘性降低,结果有望实现缩短糖化反应时间和降低酶量。此外,根据范特霍夫-阿伦尼乌斯规则(van’t Hoff-Arrhenius),通常化学反应的温度上升10℃,反应速度增加2-3倍。因此,以与传统相比更高的温度使用耐热性纤维素酶进行木质纤维素糖化处理时,遵从该经验规则应该可获得快的酶反应速度。由上述理由可以认为,通过使用耐热性酶在高温下进行木质纤维素糖化处理,可以大幅降低酶量和糖化时间,减少酶的成本。

作为真核生物的嗜热丝状真菌与作为原核生物的嗜热菌和超嗜热古细菌相比,其生存极限温度低,为55℃左右。因此,嗜热丝状真菌表达分泌的糖苷水解酶的耐热性通常不是很高。在目前的报导中来源于耐热性最高的丝状真菌的CBH(纤维二糖水解酶),嗜热丝状真菌嗜热毛壳菌(Chaetomium thermophilum)的纤维二糖水解酶CBH Ⅰ、CBH Ⅱ表现出的最适温度分别为75℃和70℃(例如参照非专利文献1),嗜热子囊菌(Thermoascus aurantiacus)的纤维二糖水解酶CBH Ⅰ的最适温度为65℃(例如参照非专利文献2。)。虽然有通过取代纤维二糖水解酶中的一个或多个氨基酸来进一步提高耐热性的方法(例如参照专利文献1或2。),但是这样获得的突变型纤维二糖水解酶的耐热性仍然不足。

另一方面,对来自于温泉、热液喷口、油田和矿山等极限环境的、生长于55℃以上的嗜热菌和生长于80℃以上的超嗜热菌进行分离培养。来源于这些嗜热菌和超嗜热古细菌的耐热性糖苷水解酶,其大部分为具有内切葡聚糖酶活性、木聚糖酶活性、木糖苷酶活性或葡糖苷酶活性的酶。在木质纤维素水解过程中起到最重要作用的纤维二糖水 解酶为仅分离自属于梭菌属(Clostridium)、嗜热菌属(Thermobifida)、热袍菌属(Thermotoga)的三种嗜热菌中的几种。例如,嗜热厌氧菌热纤梭菌(Clostridium thermocellum)在菌体外表示具有高木质纤维素水解活性的复合酶纤维体。纤维体的主要酶为纤维二糖水解酶,分离出属于GH5家族的CelO、属于GH9家族的Cbh和CelK这3种,最适温度均为Topt=60~65℃(例如参考非专利文献3~5。)。从嗜热放线菌褐色嗜热裂胞菌(Thermobifida fusca)分离出属于GH6家族的E3(例如参照非专利文献6)和属于GH48家族的Cel48A(例如参照非专利文献7。)这两种纤维二糖水解酶基因。这些纤维二糖水解酶的热稳定性比较高,表现出最大活性的50%的温度范围为40~60℃,并在55℃下至少具有16个小时的稳定活性。然而,这两种纤维二糖水解酶在70℃以上的活性不足,在用它们进行纤维素的糖化处理时,糖化处理温度的上限为60~65℃。据报道,来源于热袍菌属的嗜热菌的纤维二糖水解酶的耐热性最高,最适温度为Topt=105℃,活性半衰期Thalf在108℃下为70分钟(例如参照非专利文献8。)。然而,该酶表现出内切葡聚糖酶式的底物特异性,并仅对无定形结构的纤维素与羧甲基纤维素(CMC)表现出分解活性。另外,由于滤纸的水解活性弱,无法期待通过该酶对结晶木质纤维素进行有效糖化。

现有技术文献

专利文献

专利文献1:特表第2006-515506号公报

专利文献2:特开第2012-39967号公报

专利文献3:特开第2005-237233号公报

专利文献4:特开第2007-53994号公报

专利文献5:特开第2008-193953号公报

非专利文献

非专利文献1:Ganju等,《Biochim.Biophys.Acta.》,1989年, 第993卷,第266-274页。

非专利文献2:Hong等,《应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)》,2003年,第63卷,第42-50页。

非专利文献3:Zverlov等,《微生物学》,2002年,第148卷,第247-255页。

非专利文献4:Zverlov等,《微生物学》,1997年,第143卷,第3537-3542页。

非专利文献5:Kataeva等,《细菌学杂志》,1999年,第181卷,第5288-5295页。

非专利文献6:Zhang等,《生物化学》,1995年,第34卷,第3386-3395页。

非专利文献7:Irwin等,《欧洲生物化学杂志》,2000年,第267卷,第4988-4997页。

非专利文献8:Ruttersmith和Daniel,《生化杂志》,1991年,第277卷,第887-890页。

非专利文献9:Herai,S.等,《美国科学院院报》,2004年,第101卷,第14031-14035页。

非专利文献10:Ogino,S.,《应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)》,2004,第64卷,第823-828页。

非专利文献11:Tamura,T.等,《环境生物技术杂志(J.Environmental Biotechnol.)》,2007,第7卷,第3-10页。

非专利文献12:DN.Bolam等,《生物化学杂志》,1998年,第331卷,第775-781页。

非专利文献13:N.DIN等,1994年,《美国科学院院报》,第91卷,第11383-11387页。

非专利文献14:K.Riedel等,《FEMS微生物学快报》,1998年,第164卷,第261-267页。

非专利文献15:Mahadevan SA,Wi SG,Lee DS,Bae HJ:“Cel5A(海栖热袍菌(Thermotoga maritima))的定点突变和CBM工程”,《FEMS微生物学快报》,2008年,第287卷,第205-211页。



技术实现要素:

本发明要解决的技术问题

本发明的目的是提供一种至少在75℃下表现出纤维二糖水解酶活性的新的耐热性纤维二糖水解酶、编码该耐热性纤维二糖水解酶的多核苷酸、用于表达该耐热性纤维二糖水解酶的表达载体、整合了该表达载体的转化体、以及使用该耐热性纤维二糖水解酶制造纤维素分解产物的方法。

解决技术问题的技术手段

本发明的发明人为了解决上述问题,通过从温泉高温土壤中直接提取DNA来进行难培养微生物群的大规模宏基因组测序,成功获取具有新的氨基酸序列的耐热性纤维二糖水解酶,从而完成本发明。

本发明的耐热性纤维二糖水解酶、多核苷酸、表达载体、转化体、耐热性纤维二糖水解酶的制造方法、纤维素酶混合物、纤维素分解产物的制造方法、多核苷酸的制造方法、以及引物具有例如下述[1]~[17]的实施方式。

[1]本发明第一实施方式为一种耐热性纤维二糖水解酶,其具有由下列(A)~(L)中的多肽构成的纤维二糖水解酶催化区域:

(A)由序列号1所示氨基酸序列构成的多肽;

(B)由序列号1所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(C)由与序列号1所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(D)由序列号3所示氨基酸序列构成的多肽;

(E)由序列号3所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(F)由与序列号3所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(G)由序列号5所示氨基酸序列构成的多肽;

(H)由序列号5所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(I)由与序列号5所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(J)由序列号7所示氨基酸序列构成的多肽;

(K)由序列号7所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;或者

(L)由与序列号7所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽。

[2]作为上述[1]的耐热性纤维二糖水解酶,优选其还具有纤维素结合域。

[3]本发明第二实施方式为一种多核苷酸,其具有由下列(a)~(n)中的碱基序列构成的编码纤维二糖水解酶催化区域的区域:

(a)编码由序列号1所示氨基酸序列构成的多肽的碱基序列;

(b)编码由序列号1所示氨基酸序列中的一个或多个氨基酸的 缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(c)编码由与序列号1所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(d)编码由序列号3所示氨基酸序列构成的多肽的碱基序列;

(e)编码由序列号3所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(f)编码由与序列号3所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(g)编码由序列号5所示氨基酸序列构成的多肽的碱基序列;

(h)编码由序列号5所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(i)编码由与序列号5所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(j)编码由序列号7所示氨基酸序列构成的多肽的碱基序列;

(k)编码由序列号7所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(l)编码由与序列号7所示氨基酸序列具有80%以上序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(m)与序列号2、4、6或8所示碱基序列具有80%以上序列一 致性、且编码至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;或者

(n)与由序列号2、4、6或8所示碱基序列构成的多核苷酸在严格条件下进行杂交的多核苷酸的碱基序列、且编码至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列。

[4]作为上述[3]的多核苷酸,优选其进一步具有编码纤维素结合域的区域。

[5]本发明第三实施方式为一种表达载体,其整合了上述[3]或[4]的多核苷酸,在宿主细胞中可表达至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽。

[6]本发明第四实施方式为一种转化体,其导入有上述[5]的表达载体。

[7]上述[6]的转化体优选为真核微生物。

[8]上述[6]的转化体优选为植物。

[9]本发明第五实施方式为一种耐热性纤维二糖水解酶的制造方法,在上述[6]~[8]中任一转化体中生产耐热性纤维二糖水解酶。

[10]本发明第六实施方式为一种纤维素酶混合物,其含有上述[1]的耐热性纤维二糖水解酶、上述[2]的耐热性纤维二糖水解酶、或者利用上述[9]的耐热性纤维二糖水解酶的制造方法制得的耐热性纤维二糖水解酶及至少一种以上的其他纤维素酶。

[11]在上述[10]的纤维素酶混合物中,优选上述其他纤维素酶为选自由半纤维素酶和内切葡聚糖酶构成的组中的一种以上。

[12]本发明第七实施方式为一种纤维素分解产物的制造方法,使含有纤维素的材料与上述[1]的耐热性纤维二糖水解酶、上述[2]的耐热性纤维二糖水解酶、上述[6]~[8]中任一转化体、或者利用上述[9]的耐热性纤维二糖水解酶的制造方法制得的耐热性纤维二糖水解酶接触,由此生产纤维素分解产物。

[13]在上述[12]的纤维素分解产物的制造方法中,优选进一步使至少一种以上的其他纤维素酶与上述含有纤维素的材料接触。

[14]在上述[13]的纤维素分解产物的制造方法中,优选上述其他纤维素酶为选自由半纤维素酶和内切葡聚糖酶构成的组中的一种以上。

[15]本发明第八实施方式为一种编码耐热性纤维二糖水解酶的多核苷酸的制造方法,以来源于生物的DNA或来源于生物的RNA的反转录产物为模板,使用正向引物和反向引物进行PCR,作为扩增产物,得到含有编码耐热性纤维二糖水解酶的碱基序列的多核苷酸,所述正向引物由序列号12所示碱基序列、或在序列号12所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成,所述反向引物由序列号13所示碱基序列、或在序列号13所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

[16]本发明第九实施方式为一种引物,其由序列号12所示碱基序列、或在序列号12所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

[17]本发明第十实施方式为一种引物,其由序列号13所示碱基序列、或在序列号13所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

此外,本发明具有以下方面。

[1]一种耐热性纤维二糖水解酶,其具有由下列(A)~(L)中任一多肽构成的纤维二糖水解酶催化区域:

(A)由序列号1所示氨基酸序列构成的多肽;

(B)由序列号1所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(C)由与序列号1所示氨基酸序列具有80%以上且不足100% 的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(D)由序列号3所示氨基酸序列构成的多肽;

(E)由序列号3所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(F)由与序列号3所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(G)由序列号5所示氨基酸序列构成的多肽;

(H)由序列号5所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(I)由与序列号5所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(J)由序列号7所示氨基酸序列构成的多肽;

(K)由序列号7所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;或者

(L)由与序列号7所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽。

[2]在[1]中所述的耐热性纤维二糖水解酶,其还具有纤维素结合域。

[3]一种多核苷酸,其具有由下列(a)~(n)中的碱基序列构成的编码纤维二糖水解酶催化区域的区域:

(a)编码由序列号1所示氨基酸序列构成的多肽的碱基序列;

(b)编码由序列号1所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(c)编码由与序列号1所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(d)编码由序列号3所示氨基酸序列构成的多肽的碱基序列;

(e)编码由序列号3所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(f)编码由与序列号3所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(g)编码由序列号5所示氨基酸序列构成的多肽的碱基序列;

(h)编码由序列号5所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(i)编码由与序列号5所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(j)编码由序列号7所示氨基酸序列构成的多肽的碱基序列;

(k)编码由序列号7所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(l)编码由与序列号7所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的 条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(m)与序列号2、4、6或8所示碱基序列具有80%以上且不足100%的序列一致性、且编码至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;或者

(n)与由序列号2、4、6或8所示碱基序列构成的多核苷酸在严格条件下进行杂交的多核苷酸的碱基序列、且编码至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列。

[4]在[3]中所述的多核苷酸,其还具有编码纤维素结合域的区域。

[5]一种表达载体,其整合了在[3]或[4]中所述的多核苷酸,在宿主细胞中可表达至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽。

[6]一种转化体,其导入有在[5]中所述的表达载体。

[7]在[6]中所述的转化体,其为原核生物。

[8]在[6]中所述的转化体,其为真核生物。

[9]在[6]中所述的转化体,其为植物。

[10]一种耐热性纤维二糖水解酶的制造方法,在[6]~[9]的任一项中所述的转化体中生产耐热性纤维二糖水解酶。

[11]一种纤维素酶混合物,其含有在[1]中所述的耐热性纤维二糖水解酶、在[2]中所述的耐热性纤维二糖水解酶、或者利用在[10]中所述的耐热性纤维二糖水解酶的制造方法制得的耐热性纤维二糖水解酶及至少一种以上的其他纤维素酶。

[12]在[11]中所述的纤维素酶混合物,所述其他纤维素酶为选自由半纤维素酶和内切葡聚糖酶构成的组中的一种以上。

[13]一种纤维素分解产物的制造方法,使含有纤维素的材料与在[1]中所述的耐热性纤维二糖水解酶、与[2]中所述的耐热性纤维二糖水解酶、在[6]~[9]的任一项所述的转化体、或者利用在[10]中所述的耐热性纤维二糖水解酶的制造方法制得的耐热性纤维二糖水解酶接 触,由此生产纤维素分解产物。

[14]在[13]中所述的纤维素分解产物的制造方法,使至少一种以上的其他纤维素酶与所述含有纤维素的材料接触。

[15]在[14]中所述的纤维素分解产物的制造方法,所述其他纤维素酶为选自由半纤维素酶和内切葡聚糖酶构成的组中的一种以上。

[16]一种编码耐热性纤维二糖水解酶的多核苷酸的制造方法,以来源于生物的DNA或来源于生物的RNA的反转录产物为模板,使用正向引物和反向引物进行PCR,作为扩增产物,得到含有编码耐热性纤维二糖水解酶的碱基序列的多核苷酸,所述正向引物由序列号12所示碱基序列、或在序列号12所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成,所述反向引物由序列号13所示碱基序列、或在序列号13所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

[17]一种引物,其由序列号12所示碱基序列、或在序列号12所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

[18]一种引物,其由序列号13所示碱基序列、或在序列号13所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

发明效果

本发明的耐热性纤维二糖水解酶至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性。因此,该耐热性纤维二糖水解酶适合于高温条件下的纤维素的糖化处理。

此外,本发明的多核苷酸、整合了该多核苷酸的表达载体、导入有该表达载体的转化体适合用于制造本发明的耐热性纤维二糖水解酶。

附图说明

图1为在实施例1中,由利用宏基因组分析得到的属于GH6家族的4个开放阅读框(AR19G-166、AR19G-12(以及OJ1-2)、OJ1-1) 推断的氨基酸序列的有根分子进化树。由于OJ1-2与AR19G-12的氨基酸序列100%相似(一致),从而推断OJ1-2与AR19G-12为同一基因,OJ1-2为AR19G-12的部分序列。

图2A为由开放阅读框(AR19G-166、AR19G-12、OJ1-1)推断的氨基酸序列、以及与这些氨基酸序列的序列一致性最高的绿弯菌门(Chloroflexi)的中温需氧菌橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的第6家族糖苷水解酶的催化区域的氨基酸序列的比对图。

图2B为由开放阅读框OJ1-1推断的氨基酸序列与嗜热需氧菌热解纤维素菌(Caldibacillus cellulovorans)的纤维素结合域CBM3的氨基酸序列的比对图。

图3A为由开放阅读框(AR19G-166、AR19G-12、OJ1-1)推断的氨基酸序列所构成的多肽、以及由与这些氨基酸序列的序列一致性最高的绿弯菌门(Chloroflexi)的中温需氧菌橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的第6家族糖苷水解酶的碱基序列推断的多肽的氨基酸示意图。

图3B为由开放阅读框OJ1-1推断的氨基酸序列所构成的多肽、以及嗜热需氧菌热解纤维素菌(Caldibacillus cellulovorans)的纤维素结合域CBM3的氨基酸示意图。

图4为表示实施例1中的大肠杆菌所表达的AR19G-166-RA蛋白及AR19G-166-QV蛋白的SDS-PAGE分析结果(A)和Western印迹分析结果(B)的图。

图5A为表示实施例1中的利用高效液相色谱法分析大肠杆菌所表达的AR19G-166-RA蛋白的PSA水解反应产物的结果的图。

图5B为表示实施例1中的利用高效液相色谱法分析丝状真菌里氏木霉(Trichoderma reesei)的第6家族纤维二糖水解酶TrCBH Ⅱ的PSA水解反应产物的结果的图。

图6A为表示测算实施例1中的大肠杆菌所表达的 AR19G-166-RA蛋白在各温度的PSA水解活性的结果的图。

图6B为表示测算实施例1中的大肠杆菌所表达的AR19G-166-QV蛋白在各温度的PSA水解活性的结果的图。

图7A为表示测算实施例1中的大肠杆菌所表达的AR19G-166-RA蛋白在各pH的PSA水解活性的结果的图。

图7B为表示测算实施例1中的大肠杆菌所表达的AR19G-166-QV蛋白在各pH的PSA水解活性的结果的图。

图8A为表示测算实施例1中的大肠杆菌所表达的AR19G-166-RA蛋白受预培育时间影响的结果的图。

图8B为表示测算实施例1中的大肠杆菌所表达的AR19G-166-QV蛋白受预培育时间影响的结果的图。

图9A为表示测算实施例1中的大肠杆菌所表达的AR19G-166-RA蛋白受预培育温度影响的结果的图。

图9B为表示测算实施例1中的大肠杆菌所表达的AR19G-166-QV蛋白受预培育温度影响的结果的图。

图10为表示实施例2中的导入AR19G-166-RW基因的曲霉菌(Aspergillus)转化体和导入AR19G-166-QW基因的曲霉菌转化体的培养基上清液、以及在实施例1中制备的AR19G-166-RA和AR19G-166-QV的基因重组大肠杆菌的破碎上清液的Western印迹分析结果的图。

图11A为表示各温度的、实施例1中的大肠杆菌所表达的AR19G-166-RW蛋白及AR19G-166-QW蛋白的PSA水解活性(U/mg)、以及实施例2中的曲霉菌所表达的AR19G-166-RW蛋白及AR19G-166-QW蛋白的PSA水解活性(相对值(%))的计算结果的图。

图11B为表示各pH的、实施例1中的大肠杆菌所表达的AR19G-166-RW蛋白及AR19G-166-QW蛋白的PSA水解活性 (U/mg)、以及实施例2中的曲霉菌所表达的AR19G-166-RW蛋白及AR19G-166-QW蛋白的PSA水解活性(相对值(%))的计算结果的图。

图12A为在实施例3中用于制作烟草叶绿体转化体的烟草叶绿体转化用表达盒的载体pNtaGL及pNtaGLPL的示意图。

图12B为在实施例3中用于制作烟草叶绿体转化体的烟草叶绿体转化用表达盒pPXT及pPXTPL的示意图。

图12C为在实施例3中用于制作烟草叶绿体转化体的整合了烟草叶绿体转化用表达盒的表达载体pNtaGL-QV和pNtaGLPL-RA的示意图。

图13A为表示在实施例3中通过导入pNtaGL-QV而得到的2个系统的叶绿体转化烟草(QV-2、QV-17)与野生型烟草(WT(SR-1))的Southern杂交的结果的图。

图13B为表示在实施例3中通过导入pNtaGLPL-RA而得到的3个系统的叶绿体转化烟草(RA-6-2-1、RA-6-2-2、RA-6-2-3)与野生型烟草(WT(SR-1))的Southern杂交的结果的图。

图13C为表示在实施例3中通过导入pNtaGL及pNtaGLPL载体而得到的叶绿体转化烟草的Southern杂交的结果的图。

图14A为实施例3中的花期的、通过导入AR19G-166-QV而得到的叶绿体转化烟草植株(T1世代)和载体对照(pNtaGL)的照片。

图14B为实施例3中的花期的、通过导入AR19G-166-RA而得到的叶绿体转化烟草植株(T1世代)和载体对照(pNtaGLPL)的照片。

图15A为表示在实施例3中、从通过导入AR19G-166-QV而得到的叶绿体转化烟草植株和通过导入pNtaGL而得到的叶绿体转化烟草植株中提取的可溶性蛋白质提取液的SDS-PAGE分析结果的图。

图15B为表示在实施例3中、从通过导入AR19G-166-QV而得 到的叶绿体转化烟草植株和通过导入pNtaGL而得到的叶绿体转化烟草植株中提取的可溶性蛋白质提取液的Western印迹分析结果的图。

图15C为表示在实施例3中、从通过导入AR19G-166-RA而得到的叶绿体转化烟草植株和通过导入pNtaGLPL而得到的叶绿体转化烟草植株中提取的可溶性蛋白质提取液的SDS-PAGE分析结果的图。

图15D为表示在实施例3中、从通过导入AR19G-166-RA而得到的叶绿体转化烟草植株和通过导入pNtaGLPL而得到的叶绿体转化烟草植株中提取的可溶性蛋白质提取液的Western印迹分析结果的图。

图16A为以还原糖含量(mM)表示各温度的、实施例3中的烟草叶绿体所表达的AR19G-166-QV蛋白的PSA水解活性的图。

图16B为以还原糖含量(mM)表示各温度的、实施例3中的烟草叶绿体所表达的AR19G-166-RA蛋白的PSA水解活性的图。

图17为表示实施例4中的拟南芥所表达的AR19G-166-RA蛋白及AR19G-166-QV蛋白的Western印迹分析结果的图。

图18为表示实施例4中的拟南芥所表达的AR19G-166-RA蛋白及AR19G-166-QV蛋白的PSA水解活性(mM还原糖/20分钟)的温度依存性的图。

图19为表示在实施例5中、从通过导入AR19G-166-RA而得到的基因重组放线菌中提取的无细胞提取液的SDS-PAGE分析结果的图。

图20为表示实施例5中的放线菌变铅青链霉素(Streptomyces lividans)所表达的AR19G-166-RA基因编码的酶蛋白(无细胞提取液)的磷酸溶胀Avicel(PSA)水解活性的温度依存性的图。

图21A为表示在实施例6中、使添加有CBM的AR19G-166-RA蛋白在大肠杆菌中表达而得到的酶蛋白的SDS-PAGE分析结果的图。

图21B为表示在实施例6中、使添加有CBM的AR19G-166-RA蛋白在大肠杆菌中表达而得到的酶蛋白的Western印迹分析结果的图。

图22A为表示各温度的、实施例6中的大肠杆菌所表达的添加有CBM的AR19G-166-RA蛋白的PSA水解活性(U/mg)的温度依存性的图。

图22B为表示各温度的、实施例6中的大肠杆菌所表达的添加有CBM的AR19G-166-RA蛋白的Avicel分解活性(U/mg)的温度依存性的图。

具体实施方式

[耐热性纤维二糖水解酶]

众所周知包括丝状真菌、细菌、古细菌的大多微生物是具有难培养性的,在土壤等微生物环境中生存的菌有99%为未知的菌。特别公认在高温环境中生存的微生物的培养是极其困难的,目前的微生物培养技术只不过是分离培养出0.1%以下土壤中生存的微生物。该高温土壤微生物的难培养性成为耐热性纤维二糖水解酶的开发没有进展的一个原因。

近年来,通过开发可大量序列解码千兆碱基对的新一代千兆测序仪(giga-sequencer),可完整解码土壤等中所含有的微生物群的基因组。提出了利用该分析技术的宏基因组分析法,从而使难培养性微生物的基因组解码得到了飞速发展,所述宏基因组分析法即制备来自于土壤等环境样本的微生物菌落的基因组DNA,对基因组结构不均匀、多杂的菌群直接进行基因组的全面解码,通过并行计算机进行解码数据的拼接,再度构成微生物群基因组序列。

本发明的发明人如下述实施例1所示,制备从日本国内的5处地点采集的来自于高温温泉土壤的微生物菌落的基因组DNA(宏基因组DNA),进行宏基因组DNA的鸟枪法测序和注释,获得44个具有 与已知纤维二糖水解酶类似的氨基酸序列的开放阅读框(ORF)。根据这些ORF的碱基序列信息设计引物,通过PCR法,从高温温泉土壤宏基因组DNA克隆得到候选基因。将PCR克隆得到的DNA整合到大肠杆菌中,表达该碱基序列编码的蛋白质,通过磷酸溶胀Avicel(PSA)分解活性测试及羧甲基纤维素(CMC)分解活性测试来进行功能筛选。最终,从1个ORF得到具有PSA分解活性的耐热性纤维二糖水解酶。

通过PCR克隆,从该ORF得到2个氨基酸取代的2种耐热性纤维二糖水解酶。在这2种基因型中,以第299位氨基酸为精氨酸(R)、第351位氨基酸为丙氨酸(A)的基因型为AR19G-166-RA,以第299位氨基酸为谷氨酰胺(Q)、第351位氨基酸为缬氨酸(V)的基因型为AR19G-166-QV。将AR19G-166-RA的碱基序列及氨基酸序列分别示于序列号2及序列号1中。此外,将AR19G-166-QV的碱基序列及氨基酸序列分别示于序列号4及序列号3中。由PCR克隆得到的AR19G-166-RA和AR19G-166-QV由于不存在起始蛋氨酸,从而推测它们只是在上述高温温泉土壤中含有的微生物所具有的纤维二糖水解酶基因的纤维二糖水解酶催化区域的部分基因。

如下述实施例1等所示,AR19G-166-RA及AR19G-166-QV对PSA表现出的高水解活性,对于由β-1,3键与β-1,4键葡聚糖形成的地衣多糖或结晶性纤维素的Avicel,虽然微弱,但也表现出分解活性。另一方面,对于CMC或由β-1,3键和β-1,6键葡聚糖形成的海带多糖,几乎没有表现出分解活性。进行高效液相色谱(HPLC)分析时,AR19G-166-RA水解PSA,生成纤维二糖和少量纤维三糖。此外,在公知的氨基酸序列数据库中检索AR19G-166-RA及AR19G-166-QV的氨基酸序列,序列一致性最高的氨基酸序列为已知的属于绿弯菌门(Chloroflexi)的中温需氧菌橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的GH6家族的糖苷水解酶(序列号15),其序列一致性仅 为66%。由底物特异性、PSA水解反应产物的HPLC分析、以及与已知的纤维二糖水解酶的氨基酸序列的序列一致性(相似性)得知,AR19G-166-RA及AR19G-166-QV为属于GH6家族的新纤维二糖水解酶。

AR19G-166-RA及AR19G-166-QV均至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性。实际上,如下述实施例1<13>所示,AR19G-166-RA及AR19G-166-QV均在30~100℃的宽温度范围内表现出纤维二糖水解酶活性。然而,两者的纤维二糖水解酶活性的最适温度范围不同。以大肠杆菌为宿主表达的AR19G-166-RA的纤维二糖水解酶活性在30~80℃的范围内随着温度的升高而升高,在80~100℃的范围内,随着温度的升高,纤维二糖水解酶活性有降低的倾向。与此相对的是,AR19G-166-QV的纤维二糖水解酶活性在30~70℃的范围内随着温度的升高而升高,在70℃附近形成峰值,在70~100℃的范围内表现出随着温度的升高而降低的倾向。

在本发明及本说明书中,“纤维二糖水解酶活性”是指以选自由β-1,3键与β-1,4键形成的葡聚糖及结晶纤维素构成的组中的至少一种的化合物、以及磷酸溶胀Avicel为底物,通过从非还原性末端一侧水解上述底物而生成纤维二糖的活性。

在本发明及本说明书中,“至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽”是指含有上述多肽的溶液的pH为5.5时、在75℃具有最高的纤维二糖水解酶活性。即,含有上述多肽的溶液即使在pH5.5以外、且75℃以外的条件下不具有纤维二糖水解酶活性,但只要将上述溶液置于pH5.5且75℃的条件时,上述溶液具有纤维二糖水解酶活性,上述多肽就包含在本发明的范围内。

在本发明及本说明书中,“耐热性纤维二糖水解酶”优选为在55~80℃、pH3.5~7.0时具有上述纤维二糖水解酶活性的酶,更加优选为在70~100℃、pH4.0~6.0时具有上述纤维二糖水解酶活性的酶。

将AR19G-166-RA的第351位氨基酸残基取代为色氨酸(W)而形成的AR19G-166-RW、以及将AR19G-166-QV的第351位氨基酸残基取代为色氨酸(W)而形成的AR19G-166-QW,与AR19G-166-RA及AR19G-166-QV一样,至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性。分别将AR19G-166-RW的氨基酸序列示于序列号5及对其编码的碱基序列示于序列号6中,并分别将AR19G-166-QW的氨基酸序列示于序列号7及对其编码的碱基序列示于序列号8中。以曲霉菌为宿主表达的AR19G-166-RW及AR19G-166-QW的纤维二糖水解酶活性在30~100℃的范围内随着温度的升高而升高,在100℃表现出最高的纤维二糖水解酶活性。

通常,任何具有生理活性的蛋白质都能在不损害其生理活性的前提下,进行一个或多个氨基酸的缺失、取代或添加。即,对于AR19G-166-RA、AR19G-166-QV、AR19G-166-RW或AR19G-166-QW,可以在不丧失纤维二糖水解酶活性的前提下,进行一个或多个氨基酸的缺失、取代或添加。

即,作为本发明第一实施方式的耐热性纤维二糖水解酶为具有下列(A)~(L)中的任一多肽构成的纤维二糖水解酶催化区域的耐热性纤维二糖水解酶;

(A)由序列号1所示氨基酸序列构成的多肽;

(B)由序列号1所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(C)由与序列号1所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(D)由序列号3所示氨基酸序列构成的多肽;

(E)由序列号3所示氨基酸序列中的一个或多个氨基酸的缺失、 取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(F)由与序列号3所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(G)由序列号5所示氨基酸序列构成的多肽;

(H)由序列号5所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(I)由与序列号5所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;

(J)由序列号7所示氨基酸序列构成的多肽;

(K)由序列号7所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽;或者

(L)由与序列号7所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽。

在本发明及本说明书中,“多肽中的氨基酸的缺失”是指失去(去除)构成多肽的一部分氨基酸。

在本发明和本说明书中,“多肽中的氨基酸的取代”是指将构成多肽的氨基酸替换为其他氨基酸。

在本发明和本说明书中,“多肽中的氨基酸的添加”是指在多肽中插入新的氨基酸。

在上述(B)、(E)、(H)及(K)的多肽中,对于序列号1、3、5或7所示氨基酸序列,缺失、取代或添加氨基酸的个数优选为1~20 个,更加优选为1~10个,进一步优选为1~5个。在各氨基酸序列中,缺失、取代或添加的氨基酸的位置没有特别的限制,但优选第299位氨基酸为精氨酸。

在上述(C)、(F)、(I)及(L)的多肽中,与序列号1、3、5或7所示氨基酸序列的序列一致性只要是80%以上且不足100%即可,没有特别的限制,但优选为85%以上且不足100%,更加优选为90%以上,进一步优选为95%以上且不足100%。

另外,氨基酸序列之间的序列一致性(相似性)是以使对应氨基酸有最多一致的方式,在相当于插入及缺失的部分加入空位(gap)同时使两个氨基酸序列并列得到比对,再以一致的氨基酸相对于除去所得比对中的空位的氨基酸序列整体的比例求得。氨基酸序列之间的序列一致性可以该技术领域中公知的各种相似性检索软件来求得。本发明的氨基酸序列的序列一致性的值是以利用公知的相似性检索软件BLASTP得到的比对为基础算得的。

作为上述(B)、(C)、(E)、(F)、(H)、(I)、(K)及(L)的多肽,可以是人工设计的,也可以是AR19G-166-QV等的同源物或其部分蛋白质。

上述(A)~(L)的多肽分别可以根据氨基酸序列进行化学合成,也可以使用下述本发明第二实施方式所涉及的多核苷酸,利用蛋白质表达系统来生产。此外,上述(B)、(C)、(E)、(F)、(H)、(I)、(K)及(L)的多肽分别也可以根据由序列号1、3、5或7所示氨基酸序列构成的多肽,利用导入氨基酸突变的基因重组技术来进行人工合成。

上述(A)~(L)的多肽至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性。因此,通过具有上述(A)~(L)中任一多肽作为纤维二糖水解酶催化区域,能够得到耐热性纤维二糖水解酶。其中,由于在70~100℃仍表现出高纤维二糖水解酶活性,优选以上述(D) ~(L)中任一多肽形成纤维二糖水解酶催化区域。

本发明的耐热性纤维二糖水解酶以磷酸溶胀Avicel(phosphoric acid swollen Avicel,PSA)为底物。该耐热性纤维二糖水解酶还可以以PSA之外的其他β-葡聚糖为底物。作为该其他β-葡聚糖,例如可列举由β-1,3键和β-1,4键形成的地衣多糖、Avicel、微晶性细菌纤维素(Bacterial microcrystalline cellulose,BMCC)、滤纸等结晶纤维素、羧甲基纤维素(carboxymethylcellulose,CMC)、由β-1,3键和β-1,6键形成的葡聚糖、由β-1,3键形成的葡聚糖、由β-1,6键形成的葡聚糖、以及木聚糖等。作为本发明的耐热性纤维二糖水解酶,除了PSA之外,优选由β-1,3键和β-1,4键形成的葡聚糖、以及结晶纤维素中的至少一种为底物,更加优选以PSA、由β-1,3键和β-1,4-键形成的葡聚糖及结晶纤维素为底物。

本发明的耐热性纤维二糖水解酶的最适pH虽然依存于反应温度而变化,但是在pH4.5~6.0的范围内。作为本发明的耐热性纤维二糖水解酶,优选至少在pH4.5~6.0的范围内表现出纤维二糖水解酶活性,更加优选在pH4.0~6.5的范围内表现出纤维二糖水解酶活性,进一步优选在pH3.5~7.0的范围内表现出纤维二糖水解酶活性。

本发明的耐热性纤维二糖水解酶还可以具有纤维二糖水解酶活性之外的纤维素水解活性。作为其他纤维素水解活性,可列举内切葡聚糖酶活性、木聚糖酶活性或β-葡萄糖苷酶活性等。

本发明的耐热性纤维二糖水解酶可以是仅由上述(A)~(L)的多肽中的任一多肽构成纤维二糖水解酶催化区域所构成的酶,也可以含有其他区域。作为其他区域,可列举公知的纤维二糖水解酶所具有的纤维二糖水解酶催化区域之外的区域。例如,在本发明的耐热性纤维二糖水解酶中,相对于公知的纤维二糖水解酶,还包括通过纤维二糖水解酶催化区域被上述(A)~(L)的多肽取代而得到的酶。

在本发明的耐热性纤维二糖水解酶含有纤维二糖水解酶催化区 域之外的区域的情况下,优选含有纤维素结合域。纤维素结合域可以位于纤维二糖水解酶催化区域的上游(N末端一侧),也可以位于其下游(C末端一侧)。此外,纤维素结合域与纤维二糖水解酶催化区域可以直接结合,也可以通过适当长度的连接区域进行结合。作为本发明的耐热性纤维二糖水解酶,优选在纤维二糖水解酶催化区域的上游或下游通过连接区域存在纤维素结合域,更加优选在纤维二糖水解酶催化区域的上游通过连接区域存在纤维素结合域。

本发明的耐热性纤维二糖水解酶所含有的纤维素结合域只要是具有与纤维素结合能力的区域即可、例如与PSA或结晶Avicel的结合能力,其氨基酸序列没有特别的限制。作为该纤维素结合域,例如可使用已知的蛋白质所具有的纤维素结合域、或者对其进行适当改变的纤维素结合域。在本发明中,作为该纤维素结合域,优选为序列号11所示氨基酸序列的第35位的苏氨酸(T)至第182位的脯氨酸(P)的148个氨基酸(T35-P182)所构成的多肽,或者由该多肽中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且具有纤维素结合能力的多肽。

在本发明的耐热性纤维二糖水解酶具有纤维二糖水解酶催化区域和纤维素结合域的情况下,优选它们通过连接序列进行结合。该连接序列的氨基酸序列及其长度等没有特别的限制。作为这种连接序列,具体而言,例如可列举序列号11所示氨基酸序列的第183位的丝氨酸(S)至第294位的苏氨酸(T)的112个氨基酸(S183-T294)所构成的多肽,或者由该多肽中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的多肽。

另外,序列号11所示氨基酸序列为在下述实施例1中,从高温温泉土壤宏基因组DNA得到的开放阅读框OJ1-1、及其通过PCR克隆而得到的新基因OJ1-1-11所编码的多肽的氨基酸序列。据认为,从OJ1-1-11的第35位的苏氨酸至第182位的脯氨酸的148个氨基酸 (T35-P182)为纤维素结合域CBM3,从第183位的丝氨酸至第294位的苏氨酸的112个氨基酸(S183-T294)为连接序列。

本发明的耐热性纤维二糖水解酶另外还可以在N末端或C末端具有可转移并定位于细胞内特定区域的信号肽、或者向细胞外分泌的信号肽。作为这种信号肽,例如有质外体转移信号肽、内质网驻留信号肽、核转运信号肽、分泌信号肽等。通过在N末端和C末端添加信号肽,可以使转化植物中表达的耐热性纤维二糖水解酶定位于质外体或细胞中的内质网等中。

质外体转运信号肽只要为可将多肽转运至质外体的肽即可,没有特别的限制,可以适当使用公知的质外体转运信号肽。作为质外体转移信号肽,例如有土豆的蛋白酶抑制剂Ⅱ的信号肽(例如参照王等,2005年,《转基因研究》,第14卷,第167-178页。)等。此外,内质网驻留信号肽只要是可使多肽驻留于内质网的肽即可,没有特别的限制,可以适当使用公知的内质网驻留信号肽。作为内质网驻留信号肽,例如有由HDEL的氨基酸序列构成的信号肽等。

此外,本发明的耐热性纤维二糖水解酶,除此之外,由于在利用表达系统生产时可简单纯化,例如也可以在N末端或C末端添加各种标记。作为该标记,例如可使用His标记、HA(血凝素)标记、Myc标记及Flag标记等在重组蛋白的表达纯化中广泛使用的标记。

[编码耐热性纤维二糖水解酶的多核苷酸]

作为本发明第二实施方式的多核苷酸编码作为本发明第一实施方式的耐热性纤维二糖水解酶。该耐热性纤维二糖水解酶可以通过将整合了该多核苷酸的表达载体导入宿主中、利用该宿主的表达系统来生产。

具体而言,作为本发明第二实施方式的多核苷酸为具有由下列(a)~(n)中任一碱基序列构成的编码纤维二糖水解酶催化区域的区域的多核苷酸。

(a)编码由序列号1所示氨基酸序列构成的多肽的碱基序列;

(b)编码由序列号1所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(c)编码由与序列号1所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(d)编码由序列号3所示氨基酸序列构成的多肽的碱基序列;

(e)编码由序列号3所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(f)编码由与序列号3所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(g)编码由序列号5所示氨基酸序列构成的多肽的碱基序列;

(h)编码由序列号5所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(i)编码由与序列号5所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(j)编码由序列号7所示氨基酸序列构成的多肽的碱基序列;

(k)编码由序列号7所示氨基酸序列中的一个或多个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(l)编码由与序列号7所示氨基酸序列具有80%以上且不足100%的序列一致性的氨基酸序列构成的、且至少在75℃、pH5.5的 条件下具有纤维二糖水解酶活性的多肽的碱基序列;

(m)与序列号2、4、6或8所示碱基序列具有80%以上且不足100%的序列一致性、且编码至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列;或者

(n)与由序列号2、4、6或8所示碱基序列构成的多核苷酸在严格条件下进行杂交的多核苷酸的碱基序列、且编码至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽的碱基序列。

另外,在本发明及本说明书中,“严格条件”例如可列举《分子克隆-实验室手册第三版》(Sambrook等,冷泉港实验室出版社)中记载的方法。例如可列举,通过在由6×SSC(20×SSC的组成:3M氯化钠、0.3M柠檬酸溶液,pH7.0)、5×5×邓哈特溶液(Denhardt's solution)(100×邓哈特溶液的组成:2质量%的牛血清白蛋白、2质量%的ficoll、2质量%的聚乙烯吡咯烷酮)、0.5质量%的SDS、0.1mg/mL的鲑鱼精子DNA及50%的甲酰胺组成的杂交缓冲液中,在42~72℃进行数小时到一晚的温育而使杂交进行的条件。另外,作为用于温育后的清洗时的清洗缓冲液,优选为含有0.1质量%SDS的1×SSC溶液,更加优选为含有0.1质量%SDS的0.1×SSC溶液。

在上述(a)~(l)的碱基序列中,简并密码子优选宿主中使用频率高的密码子。例如,作为上述(a)的碱基序列,可以是序列号2所示碱基序列,也可以是在不改变所编码的氨基酸序列的前提下,将序列号2所示碱基序列变更为宿主中使用频率高的密码子的碱基序列。同样的,作为上述(d)、(g)及(j)的碱基序列,分别可以是序列号4、6及8所示碱基序列,也可以是将这些碱基序列中的简并密码子变更为宿主中使用频率较高的密码子的碱基序列。另外,密码子的变更可以通过公知的基因重组技术来进行。

由序列号2、4、6或8所示碱基序列构成的多核苷酸可以根据碱基序列信息进行化学合成,也可以是利用基因重组技术从自然界取得 的编码AR19G-166-RA、AR19G-166-QV等的基因(有时被称为“AR19G-166基因”)的全长或含有纤维二糖水解酶催化区域的部分区域。AR19G-166基因的全长或其部分区域可以通过从自然界获取含有微生物的样本,以从该样本回收的基因组DNA为模板,使用基于序列号2、4、6或8所示碱基序列用常规方法设计的正向引物和反向引物进行PCR而获得。以可以将从该样本回收的mRNA为模板通过反转录反应合成的cDNA作为模板。另外,回收作为模板的核酸的样本优选为在温泉土壤等高温环境下采集的样本。

在上述(m)的碱基序列中,与序列号2、4、6或8所示碱基序列的序列一致性只要是80%以上且100%以下即可,没有特别的限制,但优选为85%以上且100%以下,更加优选为90%以上且100%以下,进一步优选为95%以上且100%以下。

另外,氨基酸序列之间的序列一致性(相似性)是以使对应碱基最多一致的方式,在相当于插入和缺失的部分加入空位(gap)同时使两个碱基序列并列得到比对,再以一致的碱基相对于除去所得比对中的空位的碱基序列整体的比例求得。氨基酸序列之间的序列一致性可以该技术领域中公知的各种相似性检索软件来进行求得。本发明的碱基序列的序列一致性的值是以利用公知的相似性检索软件BLASTN得到的比对为基础算得的。

例如,上述(b)、(c)、(e)、(f)、(h)、(i)、(k)、(l)或(m)的碱基序列构成的多核苷酸分别可以通过对序列号2、4、6或8所示碱基序列构成的多核苷酸进行一个或多个碱基的缺失、取代或添加而人工合成。此外,作为上述(b)、(c)、(e)、(f)、(h)、(i)、(k)或(l)的碱基序列,可以是AR19G-166基因的同源基因的全长序列或其部分序列。AR19G-166基因的同源基因可以通过在获取碱基序列已知的基因的同源基因时所使用的基因重组技术来获得。

在本发明及本说明书中,“多核苷酸中的碱基的缺失”是指失去 (去除)构成多核苷酸的一部分核苷酸。

在本发明及本说明书中,“多核苷酸中的碱基的取代”是指将构成多核苷酸的碱基替换为其他碱基。

在本发明及本说明书中,“多核苷酸中的碱基的添加”是指在多核苷酸中插入新的碱基。

在人工合成上述(b)、(c)、(e)、(f)、(h)、(i)、(k)、(l)或(m)的碱基序列构成的多核苷酸时,对于序列号2、4、6或8所示碱基序列,缺失、取代或添加碱基的个数只要满足使合成后的多核苷酸的碱基序列与序列号2、4、6或8所示碱基序列具有80%以上且不足100%的序列一致性即可,没有特别的限制,但优选为1~256个,更加优选为1~192个,进一步优选为1~128个,特别优选为1~64个。

作为本发明第二实施方式的核苷酸,可以仅为具有编码纤维二糖水解酶催化区域的区域的多核苷酸,也可以除该区域之外,还具有编码纤维素结合域、连接序列、各种信号肽、各种标记等的区域。

[表达载体]

作为本发明第三实施方式的表达载体整合了上述本发明第二实施方式的多核苷酸,可在宿主细胞中表达至少在75℃、pH5.5的条件下具有纤维二糖水解酶活性的多肽。即,以可表达上述本发明第一实施方式的耐热性纤维二糖水解酶的状态整合本发明第二实施方式的多核苷酸的表达载体。

在本发明及本说明书中,表达载体是指从上游开始含有具有启动子序列的DNA、具有用于整合外源DNA的序列的DNA、以及具有终止子序列的DNA的载体。

具体而言,需要在表达载体中整合由从上游开始的具有启动子序列的DNA、上述本发明第二实施方式的多核苷酸、具有终止子序列的DNA所形成的表达盒。另外,多核苷酸向表达载体中的整合可以利用众所周知的基因重组技术来进行,也可以使用市售的表达载体制 作试剂盒。

作为该表达载体,可以是导入大肠杆菌或放线菌等原核细胞的表达载体,也可以是导入酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、植物细胞等真核细胞的表达载体。作为这些表达载体,可以分别对应宿主使用通常所使用的任意表达载体。

作为导入植物细胞的表达载体,例如有pIG121、pIG121Hm等双元载体等。作为可使用的启动子,例如有胭脂碱合成酶基因的启动子、花椰菜花叶病毒35S启动子等。此外,作为可使用的终止子,例如有胭脂碱合成酶基因的终止子等。另外,也可以使用组织或器官特异的启动子。通过使用这种组织或器官特异的启动子,由于不是在植物整体而是仅在特定的组织或器官表达耐热性纤维二糖水解酶,因此例如有望仅在食用植物的非食用部分表达耐热性纤维二糖水解酶。

本发明的表达载体优选为不仅整合了上述本发明第二实施方式的多核苷酸,还整合了耐药基因等的表达载体。这是由于可以利用表达载体容易进行转化植物和非转化植物的筛选。作为上述耐药基因,例如有卡那霉素抗性基因、潮霉素抗性基因、双丙氨磷抗性基因等。

[转化体]

作为本发明第四实施方式的转化体导入有上述本发明第三实施方式的表达载体。在该转化体中,可表达上述本发明第一实施方式的耐热性纤维二糖水解酶。传统公知的纤维二糖水解酶的表达宿主范围窄,即,大多难以异源表达。于此相对的是,本发明的耐热性纤维二糖水解酶可在大肠杆菌、放线菌、酵母、丝状真菌、高等植物叶绿体等广泛的表达宿主中表达。

使用表达载体制作转化体的方法没有特别的限制,可以利用在制作转化体时通常使用的方法来进行。作为该方法,例如有农杆菌介导法、粒子枪法、电穿孔法及PEG(聚乙二醇)法等。其中,宿主为植物细胞的情况下,优选以粒子枪法或农杆菌介导法来进行。

作为导入表达载体的宿主,可以是大肠杆菌或放线菌等原核细胞,也可以是酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、植物细胞等真菌细胞。通过培养大肠杆菌或放线菌的转化体,可以简便且大量的生产本发明的耐热性纤维二糖水解酶。另一方面,由于在真核细胞内,蛋白质被实施了糖链修饰,通过使用真核细胞的转化体,能够比使用原核细胞的转化体时生产耐热性更加优异的耐热性纤维二糖水解酶。特别是,该转化体为曲霉菌等丝状真菌或酵母菌等真核微生物(或真核生物)的情况下,可以比较简便的大量生产耐热性更加优异的耐热性纤维二糖水解酶。此外,导入有上述本发明第三实施方式的表达载体的转化植物不仅每一个个体所生产的本发明的耐热性纤维二糖水解酶的量比较多,而且还可以通过野外栽培来进行大量栽培。进一步,该转化植物由于本身在植株内就含有耐热性纤维二糖水解酶,因此适合作为生物质资源。

作为用于表达本发明的耐热性纤维的宿主细胞,优选由大肠杆菌、酵母、丝状真菌、放线菌及植物构成的组中的至少一种宿主细胞,更加优选由酵母、丝状真菌、放线菌及植物构成的组中的至少一种宿主细胞,进一步优选植物。

在将原核细胞、酵母、丝状真菌、昆虫培养细胞、哺乳培养细胞等用作宿主的情况下,所得到的转化体通常可以与转化前的宿主一样利用常规方法进行培养。

本发明的转化体为植物的情况下,作为宿主,可以使用植物培养细胞,也可以使用植物器官或植物组织。通过利用众所周知的植物组织培养法等,可以从转化了的植物细胞或胼胝体等中得到转化植物。例如,利用不含激素的再分化培养基培养转化植物细胞,再将所得到的生根植物幼株移植到土壤等中进行栽培,由此可以得到转化植物。

本发明的转化体为植物的情况下,来源于上述本发明第三实施方式的表达载体的、用于表达本发明的耐热性纤维二糖水解酶的表达盒 可以整合进植物的核基因组,但优选整合进叶绿体基因组。叶绿体转化体由于所插入的外源基因进行细胞质遗传,因此能够防止重组基因通过花粉发生环境泄漏。在利用转化植物的野外栽培的大规模生产中,虽然担心重组基因的环境泄漏,但叶绿体转化体与核基因组转化体相比,在抑制重组基因的环境泄漏方面更具有优越性。

此外,本发明的转化体为植物的情况下,在该转化体中,除了利用转化直接得到的植物之外,还含有作为与该植物一样表达本发明的耐热性纤维二糖水解酶的该植物的后代的植物。此处,植物的后代是指从植物得到的种子发芽而得到的植物,或者通过扦插而得到的植物。

作为宿主的植物的种类没有特别的限制,可以是双子叶植物,也可以是单子叶植物,还可以是蕨类植物或藓类植物,或者可以是藻类和微藻类。例如可列举属于十字花科、禾本科、茄科、豆科、菊科、旋花科、大戟科等的植物。茄科、十字花科、禾本科的植物由于是适合通过农杆菌进行转化的植物而优选。作为茄科植物,例如有烟草、茄子、土豆、西红柿、柿子椒等。作为十字花科植物,例如有拟南芥(Arabidopsis thaliana)、油菜、荠菜、萝卜、卷心菜、芥末等。此外,作为禾本科植物,例如有水稻、玉米、高粱、小麦、大麦、黑麦、粟等。另外,作为豆科植物,例如有花生、鹰嘴豆、大豆和菜豆等。作为菊科植物,例如有牛蒡、苦艾、金盏花、矢车菊、向日葵等。作为旋花科植物,例如有旋花、肾叶打碗花、菟丝子、田旋花等。作为大戟科植物,例如有泽漆(Euphorbia helioscopia)、钩腺大戟(Euphorbia sieboldiana)、大戟(Euphorbia lasiocaula)等。

本发明的转化体为植物的情况下,其中,优选单子叶植物,更加优选禾本科植物,进一步优选生物质的量多的禾本科植物。

[耐热性纤维二糖水解酶的制造方法]

本发明第五实施方式的耐热性纤维二糖水解酶的制造方法,是在 上述本发明第四实施方式的转化体中生产耐热性纤维二糖水解酶的方法。在使用将上述本发明第二实施方式的多核苷酸整合到不具有控制表达时期等的能力的启动子下游的表达载体所制造的转化体中,稳定表达本发明的耐热性纤维二糖水解酶。另一方面,对于使用通过特定化合物或温度等诱导表达的所有表达诱导型启动子制造的转化体,通过进行适应于各种表达诱导条件的诱导处理,在该转化体中表达耐热性纤维二糖水解酶。

由转化体生产的耐热性纤维二糖水解酶能够以留存于该转化体中的状态使用,也可以从该转化体中提取纯化。

从转化体中提取纯化耐热性纤维二糖水解酶的方法只要是不损害耐热性纤维二糖水解酶活性的方法即可,没有特别的限制,可以利用从细胞或活体组织中提取多肽时通常使用的方法来进行提取。作为该方法,例如可列举将转化体浸入适当的提取缓冲液中,提取耐热性纤维二糖水解酶后,将提取液与固体残渣分离的方法。作为该提取缓冲液,优选为含有表面活性剂等增溶剂的提取缓冲液。转化体为植物的情况下,在浸入提取缓冲液前,可以预先将该转化体切碎或粉碎。此外,作为分离提取液和固体残渣的方法,例如可使用过滤法、压缩过滤法、离心分离处理法等公知的固液分离处理,也可以对浸入提取缓冲液状态的转化体进行挤压。提取液中的耐热性纤维二糖水解酶可以利用盐析法、超滤法、层析法等公知的纯化方法进行纯化。

本发明的耐热性纤维二糖水解酶在转化体中以具有分泌信号肽的状态表达时,在对该转化体进行培养后,回收从所得到的培养物除去转化体的培养液上清,由此能够简便的获得含有耐热性纤维二糖水解酶的溶液。此外,本发明的耐热性纤维二糖水解酶具有His标记等标记时,通过利用该标记的亲和层析法,能够简便的纯化提取液或培养液上清中的耐热性纤维二糖水解酶。

即,本发明的耐热性纤维二糖水解酶的制造方法包括在本发明第 四实施方式的转化体中表达耐热性纤维二糖水解酶,以及根据需要从上述转化体中提取纯化上述耐热性纤维二糖水解酶。

[纤维素酶混合物]

本发明第六实施方式的纤维素酶混合物含有上述本发明第一实施方式的耐热性纤维二糖水解酶、或者由上述第五实施方式的耐热性纤维二糖水解酶的制造方法制造的耐热性纤维二糖水解酶与至少一种其他纤维素酶。由上述第五实施方式的耐热性纤维二糖水解酶的制造方法制造的耐热性纤维二糖水解酶可以是包含在转化体中的状态,也可以是从转化体中提取纯化的。通过将本发明的耐热性纤维二糖水解酶以与其他纤维素酶的混合物的形式用于纤维素的分解反应,能够更高效地分解难分解的木质纤维素。

作为该纤维素酶混合物中含有的上述耐热性纤维二糖水解酶之外的其他纤维素酶,只要是具有纤维素水解活性的纤维素酶即可,没有特别的限制。例如可列举木聚糖酶、β-木糖苷酶等半纤维素酶、β-葡萄糖苷酶、内切葡聚糖酶等。作为本发明的纤维素酶混合物,优选含有半纤维素酶和内切葡聚糖酶中的至少一种,更加优选含有半纤维素酶和内切葡聚糖酶两种。其中,优选含有选自由木聚糖酶、β-木糖苷酶、β-葡萄糖苷酶及内切葡聚糖酶构成的组中的1种以上纤维素酶,更加优选全部含有木聚糖酶、β-木糖苷酶、β-葡萄糖苷酶及内切葡聚糖酶。

该纤维素酶混合物中含有的其他纤维素酶优选为至少在70℃具有纤维素酶活性的耐热性纤维素酶,更加优选为在70~90℃具有纤维素酶活性的耐热性纤维素酶。通过使该纤维素酶混合物含有的全部酶为耐热性的,能够在高温条件下高效进行基于该纤维素酶混合物的纤维素分解反应。即,该纤维素酶混合物仅含有耐热性纤维素酶时,通过将该纤维素酶混合物用于木质纤维素糖化处理,使得可以在糖化温度为70~90℃的高温环境下进行木质纤维素水解反应。通过该高温糖 化,可以显著减少酶量和糖化时间,大幅降低糖化成本。

[纤维素分解物的制造方法]

本发明第七实施方式的纤维素分解产物的制造方法为通过本发明的耐热性纤维二糖水解酶分解纤维素而得到分解产物的方法。具体而言,使含有纤维素的材料与上述本发明第一实施方式的耐热性纤维二糖水解酶、上述本发明第四实施方式的转化体、或者利用上述第五实施方式的耐热性纤维二糖水解酶的制造方法制得的耐热性纤维二糖水解酶接触,由此生产纤维素分解产物。

在本发明及本说明书中,“纤维素分解产物”包括纤维二糖。

作为含有纤维素的材料,只要含有纤维素即可,没有特别的限制。作为该材料,例如可列举杂草或农业废弃物等纤维素类生物质、废纸等。优选使该含有纤维素的材料与本发明的耐热性纤维二糖水解酶接触前,先进行破碎切碎等物理处理、酸碱等化学处理、浸渍或溶解于适当的缓冲液中的处理等。

利用涉及本发明的耐热性纤维二糖水解酶进行纤维素的水解反应的反应条件只要是使该耐热性纤维二糖水解酶表现出纤维二糖水解酶活性的条件即可。例如优选在55~80℃、pH3.5~7.0的条件下进行反应,更加优选在70~100℃、pH4.0~6.0的条件下进行反应。反应时间可考虑供水解的含有纤维素的材料的种类、预处理的方法、量等进行适当的调整。例如可进行10分钟~100小时,在分解纤维素类生物质的情况下,可进行1~100小时。

在纤维素的水解反应中,除了本发明的耐热性纤维二糖水解酶之外,优选还使用至少一种其他纤维素酶。作为该其他纤维素酶,可以使用与上述纤维素酶混合物中含有的纤维素酶一样的纤维素酶,优选的至少在70℃、优选至少在70~100℃具有纤维素酶活性的耐热性纤维素酶。此外,在该纤维素分解产物的制造方法中,也可以使用上述本发明第六实施方式的纤维素酶混合物代替本发明第一实施方式的 耐热性纤维二糖水解酶、上述本发明第四实施方式的转化体、或者利用上述第五实施方式的耐热性纤维二糖水解酶的制造方法制得的耐热性纤维二糖水解酶。

[多核苷酸的制造方法及其使用的引物]

作为本发明第八实施方式的编码耐热性纤维二糖水解酶的多核苷酸的制造方法如下:以来源于生物的DNA或来源于生物的RNA的反转录产物为模板,使用正向引物(作为本发明第九实施方式的引物)和反向引物(作为本发明第十实施方式的引物)进行PCR,作为扩增产物,得到含有编码耐热性纤维二糖水解酶的碱基序列的多核苷酸,所述正向引物由序列号12所示碱基序列、或在序列号12所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成,所述反向引物由序列号13所示碱基序列、或在序列号13所示碱基序列的5’末端添加一个或多个碱基而构成的碱基序列形成。

序列号12所示碱基序列与由序列号2所示碱基序列的第1~22位碱基所构成的部分序列为相同的(同一)碱基序列。此外,序列号13所示碱基序列与由序列号2所示碱基序列的第1263~1284位碱基所构成的部分序列为互补的碱基序列。因此,将由序列号12所示碱基序列形成的引物用作正向引物,将由序列号13所示碱基序列形成的引物用作反向引物,以含有序列号2所示碱基序列的多核苷酸为模板进行PCR,能够以扩增产物的形式获得编码AR19G-166基因的耐热性纤维二糖水解酶催化区域的多核苷酸(例如由序列号2、4、6或8所示碱基序列构成的多核苷酸)。

在PCR中,在引物的5’末端一侧可以具有不供模板杂交的添加的碱基序列。例如,通过使用由在序列号12所示碱基序列的5’末端添加一个或多个碱基而成的碱基序列形成的正向引物、和由在序列号13所示碱基序列的5’末端添加一个或多个碱基而成的碱基序列形成的反向引物,能够得到在编码AR19G-166基因的耐热性纤维二糖水 解酶催化区域的区域的5’末端添加有来源于该正向引物的一个或多个碱基、在3’末端添加有来源于该反向引物的一个或多个碱基的多核苷酸。作为在各引物的5’末端添加的碱基序列,例如可列举扩增产物向表达载体中整合时需要的序列、限制酶切位点、编码标记的碱基序列、编码信号肽的碱基序列等。此外,优选在序列号12所示碱基序列的5’末端添加起始蛋氨酸(ATG)。

充当PCR的模板的DNA为来源于生物的DNA或来源于生物的RNA的反转录产物(cDNA)。该生物可以是人工导入有整合了编码AR19G-166基因的耐热性纤维二糖水解酶催化区域的多核苷酸的质粒的微生物或上述转化体,也可以是从自然界采集的样本中含有的生物。由从自然界采集的样本制备充当模板的DNA时,该样本优选为从温泉土壤等高温环境下采集的样本。

在本发明的多核苷酸的制造方法中,如果是本领域技术人员,可以考虑所使用的聚合酶的种类等而适当决定PCR的条件等。在充当模板的核酸中含有由AR19G-166基因的基因组DNA或该基因的mRNA合成的cDNA时,通过该PCR,能够以扩增产物的形式获得编码AR19G-166基因的耐热性纤维二糖水解酶催化区域的多核苷酸。

纤维二糖水解酶催化区域的氨基酸序列的同源基因之间的保守性高。因此,通过使用上述正向引物和反向引物,在充当模板的核酸中含有由AR19G-166基因的同源基因的基因组DNA或该同源基因的mRNA合成的cDNA时,通过本发明的多核苷酸的制造方法,能够以扩增产物的形式获得编码AR19G-166基因的同源基因的耐热性纤维二糖水解酶催化区域的多核苷酸。

此外,在充当模板的核酸中含有作为AR19G-166基因的同源基因以外的基因的、从具有类似于AR19G-166基因的碱基序列的基因的基因组DNA或该同源基因的mRNA合成的cDNA时,通过本发明 的多核苷酸的制造方法,能够以扩增产物的形式获得编码该基因的全部区域或部分区域的多核苷酸。因此,本发明的多核苷酸的制造方法对于克隆由与AR19G-166基因类似的碱基序列所构成的新纤维二糖水解酶也是有用的。

实施例

下面示出实施例对本发明进行进一步的详细说明,但本发明并不局限于以下实施例。

[实施例1]来自于温泉土壤的新耐热性纤维二糖水解酶的克隆

<1>来自于温泉土壤的DNA提取与全基因组序列(Whole Genome Sequence,WGS)

以耐热性纤维二糖水解酶(最适温度为55℃以上)、超耐热性纤维二糖水解酶(最适温度为80℃以上)的基因探索为目的,从中性~弱碱性温泉采集土壤DNA,进行构成这些土壤的微生物群的基因组DNA的碱基序列解码。

作为中性~弱碱性温泉土壤样本,从在野外有喷出高温温泉的日本国内的3处的5个地点(宏基因组DNA样本N2、AR19、AR15、OJ1和H1)采集含有土壤、泥、生物垫(biomat)的温泉水。这些温泉土壤样本在采集温度58~78℃、pH7.2~8的范围内。

使用DNA提取试剂盒(ISOIL Large for Beads ver.2,NIPPON GENE社制),从所采集的温泉土壤样本各10g中提取DNA。在所得DNA的量为10μg以上的基因组试剂中,使用其中的5μg进行宏基因组测序。即,对于所提取的DNA,使用罗氏诊断(Roche Diagnostics)社制GS FLX Titanium 454进行宏基因组DNA及16srDNA扩增子的鸟枪法测序。剩下的DNA用于纤维素酶基因的PCR克隆。另一方面,在DNA的量少的试剂(10μg以下)中,使用基因组DNA扩增试剂盒(GenomiPhi V2 DNA扩增试剂盒,GE医疗社制)进行基因组扩增,对得到的扩增产物进行宏基因组DNA的序列解码。

每个各温泉土壤样本3~4次,共计进行了19次宏基因组DNA的序列解码,得到平均解码(read)长度为394bp、总解码数为26,295,463、总基因组解码量为10.3Gbp的全基因组序列(WGS)数据集。

<2>温泉宏基因组数据的拼接与统计量

使用从温泉宏基因组提取的基因组DNA,按照罗氏(Roche)社制454GS FLX Titanium技术鸟枪法测序用标准流程构建序列文库。将Roche 454的输出(sff文件)通过PyroBayes(Quinlan等,《自然方法》,2008年,第5卷,第179-181页)再次进行碱基识别(base-calling),得到FASTA形式的序列文件和品质值文件。切掉所得序列解码的端部,提高其品质,使用454生命技术公司的拼接软件Newbler 2.3版或2.5.3版进行拼接。拼接是设定为“最低的可接受重叠匹配(mi)=0.9”、“选项:-大(对于大型或复杂的基因组,加快拼接,但降低精度。)”来进行的。

经过质量过滤处理的解码和100bp以上的拼接重叠群(config)共计为2.5Gbp,此数据集用于纤维素酶基因分析。解码总数为26,294,193个解码中的17,991,567个解码拼接为平均1kb以上的重叠群(共计595,602个重叠群),其中最大重叠群的长度为278,185bp。

拼接后的序列参照KEGG数据库(Kanehisa,《M.科技日本(M.Science&Technology Japan)》,1996年,第59号,第34-38页,http://www.genome.jp/kegg/,2011/5/11(检索)),将所有重叠群和单一序列(singleton)按细菌、古细菌(Archaea)、真核生物、病毒、均不属于这些物种的这五类进行系统分类。在拼接后的长度(=总重叠群长度+总单一序列长度)为2.5Gbp的序列中,命中(hit)细菌的序列长度为258Mbp,命中古细菌的序列长度为27Mbp,命中真核生物的序列长度为193,561bp(拼接后的全序列长度的0.008%),命中病毒的序列长度为685,640bp(拼接后的全序列长度的0.027%)。据认为 属于真核生物的序列少的理由在于,温泉土壤宏基因组的温度在58~70℃的范围内,反映出超过了丝状真菌等真核生物的生存极限温度。由这些结果可知,该宏基因组数据库仅含有11.3%的已知DNA序列。所述均不属于这些物种的序列长度为2.2Gbp,占拼接后的序列全体的88.7%。它们是来源于细菌、古细菌或真核生物中任一物种的新序列。结果确认了Handelsman等(Handelsman等,《化学生物学杂志(Chem.Biol.)》,1998年,第5卷,第R245-R249页)所指出的,在传统的微生物基因组研究方法,即,对微生物进行培养、分离,然后进行全基因组DNA的Sanger法测序,对基因组描述的方法中,未捕获大半构成某特定环境中的微生物群落的基因组DNA。

<3>纤维二糖水解酶的开放阅读框(OPF)预测

从Uniprot数据库(http://www.uniprot.org/)下载EC号为3.2.1.4(纤维素)、3.2.1.37(β-木糖苷酶)、3.2.1.91(纤维素1,4-β-纤维二糖糖苷酶)、3.2.1.8(内切-1,4-β-木聚糖酶)的序列(访问日期:2009/4/13),构建这些糖苷水解酶基因的蛋白质组本地数据库。宏基因组AR15和AR19使用注释软件Orphelia(Hoff等,《核酸研究》,2009年,第37卷,Web服务器问题:W101-W105),宏基因组H1、N2、OJ1使用Metagene(Noguchi等,《DNA研究》,2008,15(6)),由上述<2>所得重叠群序列推断基因区域(=开放阅读框)(Orphelia选项:默认(模型=Net700,最大重叠(maxoverlap)=60),Metagene选项:-m)。为了从推断的ORF提取糖苷水解酶基因,使用了BLASTP(blastall ver.2.2.18),参照了本地数据库。BLASTP的选项条件设为“过滤查询序列=假”,“期待值(E)<1e-20”[以下为默认值:空位开放罚分=-1,空位扩展罚分=-1,空位比对的X下降值=0,阈值拓展命中=0,字段长度=默认(Cost to open a gap=-1,Cost to extended gap=-1,X dropoff value for gapped alignment=0,Threshold for extending hits=0,Word size=default)],以命中序列为糖苷水解酶基因进行收集。

由于注释软件Orphelia及Metagene不对应由读取错误等产生的移码,因而用下述方法进行移码校正。首先,重叠群移码1kbp时,将其切为2kbp的长度。因此,切出的序列与其前后的序列有1kbp的序列重叠。切出的各重叠群序列参照上述糖苷水解酶基因的蛋白组本地数据库(E<1e-20),利用Blastx进行筛选。对于命中重叠群序列,使用Genewise(Wise2package:http://www.ebi.ac.uk/Tools/Wise2/)获得糖苷水解酶的编码区域。此时,去除具有100bp以下的编码区域的序列。对于靶重叠群,Genewise软件是通过参照本地数据库中的命中酶序列,以使比对得分最高的方式插入或删除空位(gap)来校正序列的移码。

对于如此获得的纤维素酶、内切半纤维素酶、脱支酶等糖苷水解酶,以蛋白质功能区域序列数据库pfam HMM(Pfam 23.0版和HMMER v2.3;Finn等,《核酸研究数据库》,2010年,第38卷,第D211-222页)为标准进行功能分类。具体而言,使用应用了隐马尔可夫模型的序列相似性检索算法HMMER(Durbin等,“概形HMM理论。生物序列分析理论:蛋白质和核酸的概率模型(The theory behind profile HMMs.Biological sequence analysis:probabilistic models of proteins and nucleic acids)”,1998年,剑桥大学出版社;hmmpfam(2.3.2版)中,E值截止值<1e-5;数据库=Pfam_fs(可用于查找所表示的结构域在序列中的片段的模型。)),由与Pfam结构域数据库的相似性确定糖苷水解酶(GH)家族。利用BLASTP进行筛选,将作为CBH序列(纤维二糖水解酶)命中的44个ORF分类为GH家族。

<4>在Orphelia输出中发现的稀有起始密码子的校正

除了ATG(蛋氨酸)之外,注释软件Orphelia以稀有密码子GTG(缬氨酸)、TTG(亮氨酸)及ATA(异亮氨酸)作为起始密码子进行ORF检测。因此,拼接成的重叠群不含有以ATG为起始密码子的全长ORF时,Orphelia发生将稀有密码子识别为起始密码子的错误。 在上述<3>中的通过Orphelia以全长输出的ORF中,以稀有密码子GTG、TTG、ATA为起始密码子的ORF为8个。参照由Genewise输出的ORF和含有ORF的重叠群的氨基酸序列,对这些ORF是以稀有密码子为起始密码子的全长序列还是输出错误进行确认。结果表明,Orphelia输出的以稀有密码子为起始密码子的8个ORF全部是输出错误,即非全长序列。

[表1]

推断为纤维二糖水解酶基因的44个ORF的GH家族分类结果示于表1中。表1中,括号内表示以蛋氨酸为起始密码子的全长ORF数。如表1所示,属于GH6家族的纤维二糖水解酶ORF有2个(AR19G-166及AR19G-12)来自于宏基因组AR19、2个(OJ1-1和OJ1-2)来自于宏基因组OJ1、共计得到4个。另一方面,没有得到属于GH7家族的ORF序列。属于GH9、GH48家族的ORF分别得到15个和12个。属于其他GH家族(GH10、GH12、GH26)的纤维二糖水解酶基因ORF共计得到13个。对于这些推断为纤维二糖水解酶的、含有非全长序列的ORF,设计引物,利用PCR从温泉土壤宏基因组DNA克隆基因。

另外,目前,在实际使用中的生物燃料用纤维素酶溶液为Novozyme CELLIC(注册商标)CTec2 (http://www.bioenergy.novozymes.com/cellulosic-ethanol/)、Genencor Accellerase(注册商标)TRIO(HTTP://www.genencor.com/industries/biofuels/fuel_ethanol_from_biomass_cellulosic_biofuels/),均以木腐菌里氏木霉分泌的酶为基础。该丝状真菌分泌的糖苷水解酶(GH)的主要组成酶为纤维二糖水解酶CBH Ⅰ、CBH Ⅱ,分别属于GH7家族和GH6家族。

<5>开放阅读框OJ1-1和OJ1-2

开放阅读框OJ1-1编码由548个氨基酸构成的、具有纤维素结合域CBM3(149bp)-连接肽(111bp)-GH6催化区域的多域酶。然而,催化区域的后半部分丢失了终止密码子,为非全长的。此外,该纤维素结合域序列为与具有嗜热需氧菌热解纤维素菌(Caldibacillus cellulovorans)的纤维二糖水解酶(Genbank:AAF22273.1)的纤维素结合域CBM3(序列号16)的氨基酸序列表现出63%序列一致性的新CBM3序列。OJ1-1的纤维二糖水解酶催化区域与地中海拟无枝菌酸菌(Amycolatopsis mediterranei)U32的纤维素1,4-β-纤维二糖糖苷酶(Genbank:ADJ46954.1)的氨基酸序列表现出58%的序列一致性,与具有强效的纤维素酶的嗜热放线菌褐色嗜热裂胞菌(Thermobifida fusca)YX的β-1,4-纤维二糖水解(Genbank:AAA62211.1)的氨基酸序列表现出48%的序列一致性。

利用PCR克隆,从OJ1-1得到1个基因克隆(OJ1-1-11)。OJ1-1-11编码由548个氨基酸构成的多肽,该多肽表示起始密码子蛋氨酸(M)(第1位)至第32位的丙氨酸(M1-A32)的32个氨基酸(M1-A32)为分泌信号(signalP4.0)、第35位的苏氨酸至第182位的脯氨酸的148个氨基酸(T35-P182)为纤维素结合域CBM3、第183位的丝氨酸至第294位的苏氨酸的112个氨基酸(S183-T294)为连接序列、第295位的组氨酸(H)至最后的254个氨基酸表现属于GH6家族的纤维二糖水解酶催化区域的部分氨基酸序列。然而,在下述实施例

1<10>中,使该基因克隆的全长在大肠杆菌中表达,并进行PSA、CMC分解活性检测时,没有确认到对任一底物的水解活性。

开放阅读框OJ1-2为编码由247个氨基酸构成的、仅由GH6催化区域构成的多肽的碱基序列。由于OJ1-2缺少起始密码子和终止密码子,GH6家族的纤维二糖水解酶通常由400个以上的氨基酸构成,因此OJ1-2为非完全序列。由OJ1-2推断的氨基酸序列与AR19G-12的氨基酸序列为100%一致的序列,因此认为OJ1-2与AR19G-12为同一基因,OJ1-2为AR19G-12的部分序列。由OJ1-2通过PCR克隆得到的基因克隆在其催化区域整合到转化载体中、于大肠杆菌表达时,仍未得到对于PSA、CMC任一底物的酶活性。

<6>开放阅读框AR19G-166和AR19G-12

开放阅读框AR19G-166编码由474个氨基酸构成的多肽(序列号9),但其为失去了起始密码子的非全长序列,仅由连接肽的部分序列和GH6催化区域构成。AR19G-166的GH6催化区域与绿弯菌门的中温需氧菌橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的糖苷水解酶(Genebank:ABX04776.1)表现出66%的氨基酸序列一致性。使用由序列号14所示碱基序列构成的正向引物(5’-CACCATGTTGGACAATCCATTCATCGGAG-3’:在序列号12所示碱基序列的5’末端添加7个碱基(CACCATG)而成。该添加序列中,3’一侧的ATG为起始密码子,5’一侧的CACC为用于插入载体的序列。)与由序列号13所示碱基序列构成的反向引物(5’-TTAGGGTTGGATCGGCGGATAG-3’),通过PCR,由AR19G-166得到2个基因克隆(AR19G-166-RA和AR19G-166-QV)。AR19G-166-RA与AR19G-166-QV仅第299位和第351位两个氨基酸不同。AR19G-166-RA的第299位氨基酸为精氨酸,第351位氨基酸为丙氨酸(序列号1)。AR19G-166-QV的第299位氨基酸为谷氨酰胺,第351位氨基酸为缬氨酸(序列号3)。

开放阅读框AR19G-12编码由459个氨基酸构成的多肽(序列号10),但与AR19G-166一样,其为失去了起始密码子的非全长序列,由连接肽的部分序列和GH6催化区域构成。AR19G-12的GH6催化区域与橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的家族-6糖苷水解酶(Genebank:ABX04776.1)表现出64%的氨基酸序列一致性。然而,由AR19G-12通过PCR得到的基因克隆在其催化区域整合到转化载体中、于大肠杆菌表达时,仍未得到对于PSA、CMC任一底物的酶活性。

<系统遗传性分析>

与从培养分离的菌体所克隆的基因不同,利用宏基因组分析所克隆的基因的来源不明。从高温土壤宏基因组得到的属于GH6家族的4个开放阅读框(AR19G-166、AR19G-12(OJ1-2)、OJ1-1)不知是来源于古细菌(Archaea)等原核生物,还是来源于丝状真菌或菌类植物等真核生物。因此,通过催化区域氨基酸序列的多重比对和分子进化树进行系统遗传性分析,推断这些开放阅读框的来源。

图1为属于GH6家族的外切型糖苷水解酶(纤维二糖水解、糖苷水解酶、外切葡聚糖酶及纤维二糖糖苷酶)的有根分子系统树。对于由开放阅读框(AR19G-166、AR19G-12(OJ1-2)、OJ1-1)推断的氨基酸序列及具有纤维素分解能力的嗜热放线菌褐色嗜热裂胞菌(Thermobifida fusca)YX Cel6B(Genbank:AAA62211.1)的催化区域氨基酸序列,利用BLASTP对Genebank进行同源性检索,得到第6家族外切型糖苷水解酶的21种序列。接着,对于嗜热丝状真菌特异腐质霉(Humicola insolens)CEL6A(PDB:1VBW)的催化区域氨基酸序列,以同样的方式进行同源性检索,得到19种序列。对于通过这些同源性检索而命中的细菌的21个序列和丝状真菌的19个序列,以及由开放阅读框(AR19G-166、AR19G-12(OJ1-2)、OJ1-1)推断的氨基酸序列,使用Geneious Pro 5.6.5进行多重比对(成本矩阵 =Blosum80;空位开放罚分=12;空位扩展罚分=3;比对方式=无末端空位的全局比对(Global alignment with free end gaps))后,通过邻接法(Neighbors-Joining Method)创建系统树。将属于GH6家族的内切葡聚糖酶褐色嗜热裂胞菌(Thermobifida fusca)YX Cel6A(Genbank:AAC06388.1)设为外群。由1000次重复算出自举法概率,以百分数示于系统树的分支节点。图1中,下方所示比例尺为遗传距离(平均氨基酸取代数/位点)。此外,括号内所示酶的名称“CBH”为纤维二糖水解酶的略称,“GH”为糖苷水解酶的略称。

用于系统树的参考的细菌和丝状真菌的第6家族糖苷水解酶如下所示(括号中为Genbank、蛋白质数据库(Protein Data bank,PDB)或EMBL-Bank的登录号。)。

丝状真菌的第6家族糖苷水解酶:解纤维顶孢菌(Acremonium cellulolyticus)Y-94纤维二糖水解酶Ⅱ(Genbank:BAA74458.1)、双孢蘑菇(Agaricus bisporus)纤维二糖水解酶(Genbank:AAA50608.1)、白曲霉(Aspergillus kawachii)IFO 43081,4-β-D-葡聚糖纤维二糖水解酶C(Genbank:GAA89571.1)、黑曲霉(Aspergillus niger)ATCC 10151,4-β-D-葡聚糖纤维二糖水解酶C(Genbank:EHA25828.1)、嗜热毛壳菌(Chaetomium thermophilum)纤维二糖水解酶第6家族(Genbank:AAW64927.1)、菜薹炭疽病菌(Colletotrichum higginsianum)糖苷水解酶第6家族(Genbank:CCF33252.1)、地中海嗜蓝孢孔菌(Fomitiporia mediterranea)MF3/22纤维素酶CEL6B(Genbank:EJD02201.1)、禾生小虫壳菌(Glomerella graminicola)M1.001葡糖基水解酶(glucosyl hydrolase)第6家族(Genbank:EFQ25807.1)、特异腐质酶(Humicola insolens)Cel6A(PDB:1BVW)、十字花科小球腔菌(Leptosphaeria maculans)JN3纤维二糖水解酶Ⅱ(EMBL-Bank:CBX97039.1)、稻瘟病菌(Magnaporthe grisea)70-15外切葡聚糖酶2(Genbank:EHA57773.1)、嗜热毁丝酶(Myceliophthora thermophila)ATCC 42464糖苷水解酶第6家族(Genbank:AEO55787.1)、粗糙脉孢菌(Neurospora crassa)OR74A外切葡聚糖酶2(Genbank:EAA31534.1)、斜卧青霉(Penicillium decumbens)纤维二糖水解酶Ⅱ(Genbank:ADX86895.1)、皱革菌(Punctularia strigosozonata)HHB-11173SS5纤维二糖水解酶Ⅱ(Genbank:EIN07098.1)、埃默森篮状菌(Talaromyces emersonii)纤维二糖水解酶Ⅱ(Genbank:AAL33604.4)、土生梭孢壳(Thielavia terrestris)NRRL 8126糖苷水解酶第6家族(Genbank:AEO62210.1)、里氏木霉(Trichoderma reesei)纤维二糖水解酶Ⅱ(Genbank:AAA34210.1)、大丽轮枝菌(Verticillium dahliae)VdLs.17外切葡聚糖酶-6A(Genbank:EGY16046.1)。

细菌的第6家族糖苷水解酶:解纤维热酸菌(Acidothermus cellulolyticus)11B糖苷水解酶第6家族(Genbank:ABK52388.1)、地中海拟无枝酸菌(Amycolatopsis mediterranei)U321,4-β-纤维二糖糖苷酶(Genbank:ADJ46954.1)、粪碱纤维单孢菌(Cellulomonas fimi)ATCC 4841,4-β-纤维二糖水解酶(Genbank:AEE46055.1)、纤维弧菌(Cellvibrio japonicus)Ueda 107纤维二糖水解酶cel6A(Genbank:ACE85978.1)、橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785糖苷水解酶第6家族(Genbank:ABX04776.1)、脱氮琼斯氏菌(Jonesia denitrificans)DSM 20603糖苷水解酶第6家族(Genbank:ACV08399.1)、Ktedonobacter racemifer DSM 449631,4-β-纤维二糖糖苷酶(Genbank:EFH85864.1)、羽扇豆小单胞菌(Micromonospora lupini)str.Lupac 081,4-β-纤维二糖糖苷酶(Genbank:CCH20969.1)、解凝乳类芽胞杆菌(Paenibacillus curdlanolyticus)YK91,4-β-纤维二糖糖苷酶(Genbank:EFM08880.1)、茄科劳尔氏菌(Ralstonia solanacearum)Po82纤维二糖水解酶A(Genbank:AEG71050.1)、砂栖海水小单胞菌(Salinispora arenicola)CNS-205糖苷水解酶第6 家族(Genbank:ABV99773.1)、Stackebrandtia nassauensis DSM 447281,4-β-纤维二糖糖苷酶(Genbank:ADD42622.1)、橙色标桩菌(Stigmatella aurantiaca)DW4/3-1外切葡聚糖酶A(Genbank:EAU67050.1)、阿维链霉菌(Streptomyces avermitilis)MA-46801,4-β-纤维二糖糖苷酶(Genbank:BAC69564.1)、船蛆杆菌(Teredinibacter turnerae)T7901纤维二糖水解酶(Genbank:ACR12723.1)、褐色嗜热裂胞菌(Thermobifida fusca)YX纤维二糖水解酶Cel6B(Genbank:AAA62211.1)、Verrucosispora maris AB-18-0321,4-β-纤维二糖糖苷酶(Genbank:AEB46944.1)、野油菜黄单胞菌(Xanthomonas campestris)pv.raphani 756C外切葡聚糖酶A(Genbank:AEL08359.1)、水稻白叶枯菌(Xanthomonas oryzae)pv.oryzae KACC 103311,4-β-纤维二糖糖苷酶(Genbank:AAW77289.1)、Xylanimonas cellulosilytica DSM15894糖苷水解酶第6家族(Genbank:ACZ30181.1)、叶缘焦枯菌(Xylella fastidiosa)Ann-1纤维二糖水解酶A(Genbank:EGO81204.1)。

属于GH6家族的外切型糖苷水解酶分为相互间遗传距离远的2个分支群,即,来源于细菌的分支群和来源于丝状真菌的分支群。图1下方的分支群全部为丝状真菌的第6家族糖苷水解酶,另一方面,上方的分支群全部为细菌的第6家族糖苷水解酶。开放阅读框AR19G-166、AR19G-12及OJ1-1均位于细菌分支群,与橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的第6家族糖苷水解酶、革兰氏阴性木质分解菌纤维弧菌(Cellvibrio japonicus)的纤维二糖水解酶cel6A、海洋性γ-变形菌船蛆杆菌(Teredinibacter turnerae)的纤维二糖水解酶构成一个分支群。

如图1所示可知,利用宏基因组分析得到的属于GH6家族的4个开放阅读框(AR19G-166、AR19G-12(OJ1-2)、OJ1-1)与嗜热性丝状真菌解纤维顶孢菌和嗜热毛壳菌、以及木腐菌红褐肉座菌 (Hypocerea jecorina(里氏木霉))的纤维二糖水解酶的遗传距离远,与细菌的嗜热性放线菌褐色嗜热裂胞菌(Thermobifida fusca)YX的纤维二糖水解酶和橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的第6家族糖苷水解酶近缘。因此推断,这些属于GH6家族的4个开放阅读框为细菌的纤维二糖水解酶基因。OJ1-1具有细菌特异性纤维素结合域CBM3,有力的支持了此推断。

<7>氨基酸序列比对

表现出与AR19G-166-RA及AR19G-166-QV具有高度氨基酸序列一致性的橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的第6家族糖苷水解酶由1128个氨基酸构成。该基因为由从第1位至第29位的29个氨基酸构成的转运信号序列开始的,第37位至第136位的100个氨基酸构成的纤维素结合域CBM2,第241位至第611位的370个氨基酸构成的GH6催化区域,还有在下游的第713位至第1082位的370个氨基酸构成的另一个GH6催化区域所构成的多域基因。Pfam所示的这些GH6催化区域均由370个氨基酸残基构成,比细菌GH6催化区域、例如423个氨基酸所构成的褐色嗜热裂胞菌(Thermobifida fusca)YX Cel6B的催化区域还短50个氨基酸,被认为无法覆盖实际的催化区域。因此,利用BLASTP对与褐色嗜热裂胞菌(Thermobifida fusca)YX Cel6B相同的橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的GH6催化区域进行检索时,正如图2A所示,第一个GH6催化区域由第230位的缬氨酸(V)至第657位的谷氨酰胺(Q)的428个氨基酸残基构成。

此外,虽然OJ1-1的GH6催化区域为非全长的,但该部分序列对于AR19G-166的GH6催化区域表现出57%的氨基酸序列一致性,对于丝状真菌里氏木霉的第6家族CBH(TrCBH Ⅱ)仅表现出25%的序列一致性。

开放阅读框AR19G-166在GH6催化区域序列之前存在47个氨 基酸残基。该氨基酸序列由于脯氨酸(P)和苏氨酸(T)多次重复,因此被认为是连接肽的一部分。因此推测,AR19G-166与OJ1-1一样,是在纤维二糖水解酶催化区域上游通过连接序列而具有纤维素结合域CBM的多域基因。

图2A表示由开放阅读框(AR19G-166、AR19G-12、OJ1-1)推断的氨基酸序列所构成的多肽和橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的第6家族糖苷水解酶的催化区域的氨基酸序列比对。图2B表示由开放阅读框OJ1-1推断的氨基酸序列及嗜热需氧菌热解纤维素菌(Caldibacillus cellulovorans)的纤维素结合域CBM3(Genbank:AAF22273.1)的氨基酸序列比对。图2A及2B中,黑白反转的氨基酸表示这些全部氨基酸序列中的氨基酸残基保守的区域,网点的氨基酸表示这些氨基酸序列中一部分发生变异的、大部分氨基酸序列中的氨基酸序列保守的区域。

图3A表示由开放阅读框(AR19G-166、AR19G-12、OJ1-1)推断的氨基酸序列所构成的多肽、以及橙色滑柱菌(Herpetosiphon aurantiacus)DSM 785的CBM基因的氨基酸示意图。此外,图3B表示由开放阅读框OJ1-1推断的氨基酸序列及嗜热需氧菌热解纤维素菌(Caldibacillus cellulovorans)的纤维素结合域CBM3的氨基酸示意图。图3A及3B中,“催化区域(部分)”、“连接肽(部分)”分别表示仅存在各区域的一部分。

<8>基因克隆

利用PCR克隆得到的纤维二糖水解酶候选基因以通过基因组DNA扩增试剂盒(GenomiPhi V2 DNA扩增试剂盒,GE医疗社制)扩增的温泉土壤DNA为模板,利用PCR进行了扩增。所扩增的PCR产物插入Champion pET Directional TOPO(注册商标)表达试剂盒(Invitrogen社制)的pET101/D-TOPO载体中,转化为One Shot TOP10菌株。通过菌落PCR选择阳性克隆,使用含有100mg/L氨苄青霉素 的LB液体培养基,以37℃、200rpm培养17~20小时后,使用小提试剂盒(Miniprep Kit,Wizard(注册商标))加SV小提(Minipreps)DNA纯化系统,Promega社制)进行质粒的制备。所制备的质粒用生命技术(Life Technologies)社的3730DNA分析测序仪进行序列确认。

<9>基因表达及纤维二糖水解酶蛋白的纯化

序列确认后,具有目标基因的质粒通过热休克法导入蛋白质表达用大肠杆菌。转化用感受态细胞使用了Champion pET Directional TOPO(注册商标)表达试剂盒(Invitrogen社制)中附属的BL21 Star(DE3)菌株,或者Rosetta-gamiB(DE3)pLysS菌株(Merck社制)。将具有目标基因的大肠杆菌接种到含有100mg/L氨苄青霉素的LB培养基中,培养至OD600=0.2~0.8左右之后,添加IPTG,进一步培养5~20小时,由此进行目标蛋白质的诱导表达。培养后,进行离心分离回收大肠杆菌,添加培养液的1/10容量的50mM Tris-HCl缓冲液(pH8)进行悬浊。然后,使用超声波破碎装置BioRuptorUCD-200T(Cosmo Bio社制),重复10个周期的30秒破碎-30秒暂停的步骤,得到含有目标蛋白质的基因重组大肠杆菌的粗提物。该基因重组大肠杆菌粗提物用过滤器(孔径φ=0.45μm,Millipore社制)过滤,将所得滤液作为基因重组大肠杆菌破碎上清液。

将该基因重组大肠杆菌破碎上清液填充到用50mM Tris-HCl缓冲液(pH8.0)平衡的离子交换柱HiTrap Q HP(GE医疗社制)中,用中压液相色谱系统AKTA design(GE医疗社制),在含有1M NaCl的50mM Tris-HCl缓冲液(pH8.0)中以0~50%的浓度梯度对蛋白质进行分级。将具有纤维二糖水解酶活性的分级收集混合后,通过离心式超滤膜VIVASPIN20(Sartorius stedim社制)与含有750mM硫酸铵的50mM Tris-HCl缓冲液(pH8.0)进行溶液交换。将溶液交换后的纤维二糖水解酶活性分级填充到以相同溶液平衡的疏水相互作用 分离柱HiTrap Phennyl HP(GE医疗社制)中,通过50mM Tris-HCl缓冲液(pH8.0)以100~0%的浓度梯度对蛋白质进行分级。将具有纤维二糖水解酶活性的分级收集混合后,用VIVASPIN20浓缩到液量为8mL左右。将所浓缩的样本添加到由含有150mM NaCl的50mM Tris-HCl缓冲液(pH8.0)平衡的凝胶过滤柱Hiload26/60superdex200pg(GE医疗社制)中,通过以2~3mL/分钟的流速流过柱子体积的1~1.5倍体积的相同缓冲液来进行分级。将具有纤维二糖水解酶活性的分级收集混合后,进行与50mM Tris-HCl缓冲液(pH8.0)的溶液交换和浓缩,得到终浓度为1mg/mL的纯化酶。

通过SDS-PAGE分析和Western印迹对基因重组大肠杆菌破碎上清液和所纯化的纤维二糖水解酶蛋白进行了确认。

基因重组大肠杆菌破碎上清液和纯化酶的SDS电泳分别用4~20%的小型梯度凝胶(mini-gradient gel)和10%的小型凝胶(mini-gel,ATTO社制)进行。将上述上清液及纯化酶与Tris-SDSβME处理液(Cosmo Bio社制)以1:1混合后,在100℃下处理10分钟,分别使每个样本5μL基因重组大肠杆菌破碎上清液及每个样本0.5μL纯化酶进行电泳。电泳终止后,用考马斯亮蓝R250(Merck社制)对固定化的凝胶进行染色,使蛋白质的条带可视化。

基因重组大肠杆菌破碎上清液和纯化酶的Western印迹是在用10%小型凝胶(ATTO社制)进行SDS电泳后,用转印装置Trans-Blot SD(伯乐(Bio-Rad)社制)转印至聚偏氟乙烯膜(ATTO社制)。使膜上的蛋白质与稀释1000倍的兔一抗反应。该兔一抗通过合成AR19G-166-QV所编码的第384~403位的20个氨基酸残基(CDPNGQSRYNSAYPTGALPN)所构成的多肽,将免疫兔子所得到的血清进行亲和纯化而制得(操纵子生物技术(Operon Biotechnology)社制)。与蛋白质结合的1抗的检测用FastWestern印迹试剂盒(Pierce社制)进行,化学发光信号的检测使用了影像装置Ez-Capture MG (ATTO社制)。

图4表示使AR19G-166-RA和AR19G-166-QV在大肠杆菌中表达而得到的酶蛋白的SDS-PAGE分析(图4(A))和Western印迹分析(图4(B))的结果。泳道1为蛋白分子量标准,泳道2及3为AR19G-166-RA及AR19G-166-QV的基因重组大肠杆菌破碎上清液,泳道4及5为所纯化的AR19G-166-RA蛋白及AR19G-166-QV蛋白的电泳图案。

通常,纤维二糖水解酶基因的表达性非常差。例如,纤维二糖水解酶基因以大肠杆菌为宿主进行表达时,该基因无论是来源于丝状真菌还是来源于细菌都几乎完全不表达。然而,PCR克隆AR19G-166-RA及AR19G-166-QV均在大肠杆菌中良好表达。在AR19G-166-RA及AR19G-166-QV的基因重组大肠杆菌破碎上清液的SDS-PAGE分析中,由氨基酸序列(序列号1及3)预测的分子量46.7kDa处确认到强条带(图4(A)的泳道2及3)。对该蛋白质进行纯化后,AR19G-166-RA及AR19G-166-QV均确认到对应于上述条带的单一条带(图4(A)的泳道4及5)。通过使用针对AR19G-166的第384~403位的20个氨基酸残基所构成的多肽的抗体进行Western印迹,在基因重组大肠杆菌破碎上清液(图4(B)的泳道2、3)和纯化酶(图4(A)的泳道4、5)双方均在46.7kDa处检测到酶蛋白的单一条带。

<10>以PSA为底物的纤维二糖水解酶活性测定(PSA水解活性)

在纤维二糖水解酶活性测定中,使用磷酸溶胀Avicel(PSA)作为底物。PSA是通过Avicel粉末(微晶纤维素粉末,Merck社制)一溶解到磷酸溶液后即添加灭菌蒸馏水而析出,然后对其进行清洗直至pH达到5以上而制备的。另外,以下实验中使用的PSA全都是通过此方法制备的。

基因重组大肠杆菌破碎上清液或纯化过程中的酶试样的活性测 定通过使50μL含有1质量%PSA的200mM醋酸缓冲液(pH5.5)和50μL基因重组大肠杆菌破碎上清液或纯化过程中的酶试样构成的混合液在30~100℃反应20分钟来进行。

在整个测算过程中,添加50mM Tris-HCl缓冲液(pH8.0)替代基因重组大肠杆菌破碎上清液,将以相同条件反应的混合液作为对照区。另外,底物溶液和酶在反应温度下分别各自保温5分钟后进行混合,开始反应。反应中,任一混合液为了防止不溶性底物的沉淀,都使用Eppendorf社的恒温混匀器(ThermoMixer,1400rpm)进行搅拌。反应结束后,添加等量的3,5-二硝基水杨酸试剂(DNS溶液),在100℃进行5分钟加热处理,冷却5分钟后进行离心,得到上清液。上清液中的还原糖含量是用分光光度计测量540nm的吸光度,使用由葡萄糖制作的校准曲线进行计算,由与对照区的差求得通过酶的水解产生的还原糖含量。以1分钟产生1μmol还原糖的酶活性为1U,除以蛋白质的量得到的值为比活性(U/mg)。

结果,在利用PCR克隆得到的44个纤维二糖水解酶候选基因中,仅属于GH6的CBH基因的开放阅读框AR19G-166编码的多肽表现出PSA水解活性。由AR19G-166得到的2种PCR克隆(AR19G-166-RA及AR19G-166-QV)均表现出PSA水解活性。

<11>纤维二糖水解酶的底物特异性

对于确认到PSA水解活性的AR19G-166-RA及AR19G-166-QV,考察相对于各种纤维素底物及半纤维素底物的水解活性。测算使用在上述<9>中得到的纯化酶(终浓度约为1mg/mL)。

纤维二糖水解酶AR19G-166-RA的底物特异性用PSA、Avicel粉末、CMC(羧甲基纤维素,Sigma社制)、木聚糖(来源于山毛榉,Sigma社制)、地衣多糖(MP Biomedicals社制)、海带多糖(来源于掌状海带,Sigma社制)进行测算。具体而言,是通过将由50μL 200mM的醋酸缓冲液(pH5.5)、40μL纯化水和10μL纯化酶构成的混合液在 50℃预温育5分钟后,进一步添加100μL各底物的1质量%水溶液,在50℃使其反应20分钟(以Avicel粉末为底物时为2小时)来进行的。以与上述<10>同样的方式求得由酶的水解产生的还原糖含量,算出比活性(U/mg)。各个测算通过3次独立的试验进行,求取平均值和标准偏差。进一步算得以对PSA的比活性为100%时的对各底物的比活性的相对活性值(%)。结果示于表2中。

[表2]

表2:AR19G-166-RA和AR19G-166-QV的底物特异性

其结果为:AR19G-166-RA及AR19G-166-QV表现出对水溶性PSA的高水解活性。此外,对于由β-1,3键与β-1,4键葡聚糖形成的地衣多糖或结晶性纤维素的Avicel,也表现出分解活性。另一方面,对于CMC、由β-1,3键与β-1,6键葡聚糖形成的海带多糖、以及木聚糖,几乎完全没有表现出分解活性。虽然非常微弱但仍表现出对结晶纤维素Avicel的水解活性、且没有表现出对木聚糖的分解活性,这种酶底物特异性表示AR19G-166-RA及AR19G-166-QV为属于GH6家族的纤维二糖水解酶。

<12>PSA分解产物的HPLC分析

对于以磷酸溶胀Avicel PSA为底物,利用纤维二糖水解AR19G-166-RA及木腐丝状真菌里氏木霉第6家族CBH(TrCBH Ⅱ)的水解产物,通过高效液相色谱(HPLC)进行成分分析。AR19G-166-RA在0.1M醋酸缓冲液(pH5.5)、70℃的条件下,TrCBH Ⅱ在0.1M醋酸缓冲液(pH4.0)、40℃的条件下,分别进行1小时和24小时PSA的水解反应后,通过加入0.1M碳酸钠溶液而终止反应。水解反应产物在4℃、12,000rpm的条件下进行10分钟离心分离,并将上清液通过孔径为0.2μm的过滤器进行过滤,以供HPLC分析。HPLC装置使用了Alliance e2695(Waters社制),糖的检测使用RI检测器(2414RI)。HPLC装置的控制及分析软件使用Empower 3.0版。柱子使用HPLC糖类分析柱300mm×7.8mm(BIO-RAD社制),溶剂使用了超纯水。以0.6mL/分钟的流速、85℃的柱温分析10μl水解试样。校准曲线用标准物质(葡萄糖、纤维二糖、纤维三糖)制成,进行糖类的定量。校准曲线样本的最大浓度是葡萄糖为0.2质量%、纤维二糖为0.4质量%、纤维三糖为0.5质量%,制成稀释系列,以6点制成校准曲线。

将利用HPLC进行成分分析的测算结果示于图5A及5B中。利用了AR19G-166-RA的PSA水解反应产物在1小时后主要为纤维二糖(86.5%)和少量纤维三糖(13.5%),在24小时后为86.2%纤维二糖、13.0%纤维三糖和极少量的葡萄糖(0.7%)(图5A)。另一方面,利用TrCBH Ⅱ的PSA水解反应产物主要是纤维二糖(87.5%)和少量纤维三糖(12.5%)的,在24小时后为88.4%纤维二糖、9.4%纤维三糖和极少量的葡萄糖(2.2%)(图5B)。由HPLC分析的结果也显示AR19G-166为纤维二糖水解酶。

<13>纤维二糖水解酶活性的温度及pH依存性

对基于AR19G-166-RA及AR19G-166-QV的PSA水解活性的温 度依存性及pH依存性进行研究。测量中使用了在<9>中得到的纯化酶(终浓度约1mg/mL)。

纯化酶的PSA水解活性的测定除了将由100μL 1质量%PSA水溶液、50μL McIlvaine缓冲液(pH3~8)、40μL纯化水和10μL纯化酶构成的混合液在30、40、50、60、65、70、75、80、85、90或100℃进行20分钟反应之外,以与实施例1的<10>相同的方式进行,求得因酶水解产生的还原糖含量,算出PSA水解活性(U/mg)。

测算结果示于图6A及6B、以及图7A及7B中。图6A及6B为以温度为横轴表示各温度的PSA水解活性的测算结果的图,图7A及7B为以pH为横轴表示各pH的PSA水解活性的测算结果的图。pH标绘出底物、缓冲液和酶的混合液的测量值。

纯化酶AR19G-166-RA在60~80℃的温度范围为表现出高PSA水解活性(图6A)。表现出最高活性的最适温度(Topt)是在pH4.5时为70℃,在pH5.0~6.0时为75℃。在将酶反应温度设为85℃以上时,任意pH范围内的纯化酶AR19G-166-RA的PSA水解活性都急剧降低。另一方面,纯化酶AR19G-166-QV在65℃以上比AR19G-166-RA的PSA水解活性还低(图6B)。表现出最高活性的最适温度(Topt)是在pH4.5~5.5时为70℃,在pH6.0时为75℃。任意pH范围内的纯化酶AR19G-166-QV的PSA水解活性都在将酶反应温度设为80℃以上时急剧降低。

此外,纯化AR19G-166-RA在反应温度65~80℃、pH4~6的范围内表现出最高PSA水解活性(图7A)。最适pH根据反应温度而发生变化,在60~65℃为pH4.6(测量值),在70~75℃为pH5.2~5.3(实测值),在80℃为pH5.8(测量值)。在pH3.2~4.5、pH7~8的范围内,确认到低水平的PSA水解活性。另一方面,纯化酶AR19G-166-QV与AR19G-166-RA一样,在pH 4~6的范围内表现出最高PSA水解活性,在pH3.2~4.5、pH7~8的范围内确认到低水平的PSA水解活性(图 7B)。

<14>纤维二糖水解酶的热稳定性(酶活性的半衰期)

为了研究AR19G-166-RA及AR19G-166-QV的热稳定性(耐热性),进行了20分钟~1440分钟的预温育,测算了在各温度下的酶蛋白的PSA水解活性。

测量中使用了在<9>中得到的纯化酶(终浓度约1mg/mL)。纯化酶的预培养是将由10μL纯化酶、40μL纯化水和50μL 200mM的醋酸缓冲液构成的混合液(pH5.0)在50~80℃的各温度下保温0、20、40、60、120、240、480、960或1440分钟来进行的。PSA水解活性的测定除了将预温育后的混合液和1质量%PSA水溶液分别各自在50℃加热5分钟后,在此混合液中添加100μL PSA水溶液,使其进行20分钟反应之外,以与实施例1的<10>相同的方式进行,求得通过酶水解产生的还原糖含量,算出PSA水解活性(U/mg)。

测算结果示于图8A及8B中。酶活性显示为以无处理区(无预温育)的活性为100%的相对值(相对活性%)。如图8A的虚线垂直线所示,酶活性降低至无处理区的50%的预温育时间为半衰期Thalf

纯化酶AR19G-166-RA在预温育温度为50~60℃时,测算时间内的PSA水解活性未丧失,半衰期Thalf为测算上限的24小时以上。在70℃,通过由图8A的粗线所示指数函数得到的近似曲线算出半衰期Thalf为226分钟。在80℃,经预温育,酶活性立即丧失(图8A)。

另一方面,纯化AR19G-166-QV的耐热性与AR19G-166-RA相比,是相当低的。在预温育温度50℃,测算时间内的PSA水解活性几乎不丧失,半衰期Thalf为24小时以上。在预温育温度上升的同时,酶活性半衰期Thalf变短,60℃时为16小时,70℃时进一步变短,为40分钟。80℃时,酶活性立即丧失(图8B)。

<15>纤维二糖水解酶的热稳定性(二价金属离子的效果)

众所周知,通常二价金属离子通过与蛋白质结合而使蛋白质的结 构稳定,使耐热性提高。将钙(Ca2+)、锰(Mn2+)、钴(Co2+)、钡(Ba2+)、镁(Mg2+)、镍(Ni2+)、二价铁(Fe2+)、三价铁(Fe3+)、锌(Zn2+)各二价金属离子(浓度为1mM)投入酶-底物(PSA)反应液中,然后测算对酶蛋白的PSA水解活性的效果。首先,将10μL纯化酶溶液(浓度为1mg/mL)、40μL纯化水或各二价金属的5mM氯化物水溶液、50μL 200mM醋酸缓冲液的混合液(pH5.5)在30℃预温育30分钟。PSA水解活性的测定除了将预温育后的混合液和1质量%PSA水溶液分别各自在30~100℃的各温度下加热5分钟后,在此混合液中添加100μL PSA水溶液,使其在各温度下进行20分钟反应之外,以与实施例1的<10>相同的方式进行,求得通过酶水解产生的还原糖含量,算出PSA水解活性(U/mg)。

结果,通过投入终浓度为1mM的钙离子或钴离子,在85℃以上AR19G-166-RA及AR19G-166-QV的酶活性升高,锰离子时在60~90℃的温度范围内,酶活性显著升高(图中未表示)。与其说是无法观测到其他二价金属离子的影响(Ba2+、Mg2+、Ni2+),不如说是降低了酶活性(Fe2+、Fe3+、Zn2+)。

<16>纤维二糖水解酶的热稳定性(酶蛋白的热解温度)

关于蛋白质的热稳定性的另一指标为热变性温度或热解温度Tm(熔融温度)。通过一定时间的预加热(预温育)使酶活性降低至未处理区的50%的预温育温度等于蛋白质的热解温度Tm,如图9A的虚线垂直线所示,能够通过测算酶活性来求得。通过该方法,求得AR19G-166-RA及AR19G-166-QV的热解温度Tm

将10μL纯化酶溶液(浓度为1mg/mL)、40μL纯化水或5mM的二价金属离子的氯化物(CaCl2或MnCl2)水溶液、50μL 200mM醋酸缓冲液的混合液(pH5.0)在30℃预温育30分钟后,再在40~100℃预温育30分钟。PSA水解活性的测定除了将预温育后的混合液和1质量%PSA水溶液分别各自在50℃加热5分钟后,在此混合液中添加 100μL PSA水溶液,使其在50℃下进行20分钟反应之外,以与实施例1的<10>相同的方式进行,求得通过酶水解产生的还原糖含量,算出PSA水解活性(U/mg)。对于各预温育温度,3次测算酶的PSA水解活性值,求取平均值和标准误差。将水解活性饱和的低温区域(40~65℃)及高温区域(90~100℃)的水解酶活性的平均值分别设为1和0,进行数据的正规化。

各预温育温度的AR19G-166-RA蛋白和AR19G-166-QV蛋白的PSA水解活性、以及Sigmoid函数的近似曲线示于图9A及9B中。由该近似曲线求得酶蛋白的热解温度Tm值(即,Normalized activity=0.5时的预温育温度)。由PSA水解活性数据的近似曲线算出的酶蛋白的热解温度Tm示于表3中。表3中,“对照”是添加纯化水以取代5mM的二价金属离子的氯化物水溶液来进行反应的结果。AR19G-166-RA的Tm值为76.4℃,另一方面,AR19G-166-QV的Tm值为68.5℃,AR19G-166-RA要比AR19G-166-QV的Tm值约高8℃。此外,通过投入浓度为1mM的锰离子,AR19G-166-RA及AR19G-166-QV的热解温度Tm分别升高3.0℃和4.1℃。通过投入浓度为1mM的钙离子,AR19G-166-RA的Tm值升高的极少(0.7℃),与此相对的是,AR19G-166-QV的Tm值升高3.1℃。

[表3]

表3:AR19G-166-RA及AR19G-166-QV的热解温度Tm

[实施例2]

以丝状真菌和植物等真核生物为宿主导入任意基因,通常,所表达的蛋白质的最适温度升高5~10℃左右。这被称为糖基化(糖链修饰),其基于向蛋白质添加糖类的翻译后修饰反应,糖基化蛋白变得对热稳定。在作为丝状真菌的曲霉菌米曲霉(Aspergillus oryzae)中导入AR19G-166基因,验证糖链修饰对所编码的酶蛋白的耐热性的效果。

<1>曲霉菌转化体的制作

制作将AR19G-166-RA及AR19G-166-QV的第351位氨基酸残基取代为色氨酸(W)的突变体AR19G-166-RW(氨基酸序列:序列号5;碱基序列:序列号6)及AR19G-166-QW(氨基酸序列:序列号7;碱基序列:序列号8),将含有它们的表达盒导入曲霉菌,制成表达AR19G-166-RW或AR19G-166-QW的曲霉菌转化体。

将这些AR19G-166基因的氨基酸取代突变体整合到转化载体中构建表达载体,使用该表达载体以曲霉菌为宿主进行转化。曲霉菌转化体通过大关株式会社的蛋白委托表达服务(http://www.ozeki.co.jp/)来制作。该服务的曲霉菌转化以同源重组法为特征,由于将所导入的基因整合到染色体的特定部位,因此丝状真菌的转化效率虽然低,但只要整合到染色体上,即稳定的保持所导入的基因,能够稳定的生产编码所导入基因的蛋白质。此外,由于添加有分泌信号,因此导入基因所编码的蛋白质在培养液中向菌体外分泌。

<2>利用曲霉菌转化体生成的蛋白质的浓缩

对如此得到的曲霉菌转化体进行培养后,回收培养上清液。该培养上清液用离心超滤膜VIVASPIN20(Sartorius stedim社制)浓缩至1/10体积,与50mM Tris-HCl缓冲液(pH8.0)进行溶液交换,这即为浓缩上清液。

对各曲霉菌转化体的浓缩上清液各5μL和在实施例1中制备的AR19G-166-RA及AR19G-166-QV的基因重组大肠杆菌破碎上清液 5μL进行Western印迹分析。Western印迹分析以与实施例1的<9>相同的方式进行,其结果示于图10中。从导入AR19G-166-RW的曲霉菌转化体与导入AR19G-166-QW的曲霉菌转化体的浓缩上清液确认到与AR19G-166基因重组大肠杆菌破碎上清液(图10中的泳道2和3)的单一条带相对应的非常弱的条带为46.7kD,进一步在50~55kDa出现了宽的强条带(图10中的泳道2和3)。因此,以曲霉菌为宿主表达的AR19G-166基因所编码的蛋白质的大部分的表观分子量增加了约3~8kDa,该分子量的增加被认为是由于糖链的添加。

<3>AR19G-166-RW及AR19G-166-QW基因的大肠杆菌转化体的制作、以及纤维二糖水解酶蛋白的纯化

以与实施例1的<8>同样的方式,制作将突变体AR19G-166-RW及AR19G-166-QW插入pET101/D-TOPO载体的质粒。以与实施例1的<9>相同的方式,制作将这些质粒导入蛋白质表达用大肠杆菌的大肠杆菌转化体,对所得到的大肠杆菌转化体进行诱导表达,培养后,进行离心分离回收大肠杆菌,得到含有目标蛋白质的重组大肠杆菌粗提物,将它们过滤,得到大肠杆菌破碎上清液。以与实施例1的<9>相同的方式,通过离子交换柱、疏水相互作用分离柱、以及凝胶过滤柱进行分级纯化,得到终浓度约1mg/mL的纯化酶。

<4>纤维二糖水解酶活性的温度依存性

对由该基因重组曲霉菌转化体及该基因重组大肠杆菌生产的AR19G-166-RW及AR19G-166-QW的PSA水解活性的温度依存性进行了研究。在测算中,使用了在上述<2>中获得的浓缩上清液和<3>中获得的纯化酶。

各温度下的PSA水解活性的测算除了使用在上述<2>中获得的浓缩上清液、反应液的pH为5.5之外,以与实施例1的<13>相同的方式进行,求得通过酶的水解产生的还原糖含量。大肠杆菌表达的纯化酶AR19G-166-RW及AR19G-166-QW的PSA水解活性是以与实施 例1的<10>同样的方式,以1分钟产生1μmol还原糖的酶活性为1U,算出除以蛋白质的量所得到的值即比活性(U/mg)。另一方面,通过曲霉菌转化体产生的AR19G-166-RW及AR19G-166-QW的PSA水解活性是以AR19G-166-RW表现出最大水解活性的100℃的还原糖含量为100%,算出相对活性值(%)。

算得的各温度的PSA水解活性的相对活性值(%)示于图11A中。同时在图11A中也表示了在实施例1的<13>中测算得到的大肠杆菌表达的AR19G-166-RW及AR19G-166-QW(图中,分别为“来源于大肠杆菌的RW”及“来源于大肠杆菌的QW”)的PSA水解活性(U/mg)的测算结果。大肠杆菌表达的AR19G-166-RW及AR19G-166-QW的最适温度(Topt)分别为80℃和75℃。另一方面,曲霉菌表达的AR19G-166-RW及AR19G-166-QW(在图中,分别为“来源于米曲霉的RW”及“来源于米曲霉的QW”)的最适温度均为100℃以上。由此确定,AR19G-166基因通过曲霉菌表达增加了10%左右的分子量,最适温度升高了20~30℃。曲霉菌表达的AR19G-166比传统的来源于嗜热丝状真菌的纤维二糖水解酶的最适温度还高30℃以上,耐热性优异。

由这些结果可知,通过利用丝状真菌等真核生物的表达系统表达本发明的耐热性纤维二糖水解酶,能够得到在80℃以上也具有良好纤维二糖水解酶活性的酶。通过将在80~100℃也表现出高酶活性的耐热性纤维二糖水解酶与其他耐热性纤维素酶一同使用,可以在80℃以上的高温条件下进行木质纤维素的糖化处理。

<5>纤维二糖水解酶活性的pH特征

对由曲霉菌转化体及基因重组大肠杆菌产生的AR19G-166-RW及AR19G-166-QW的PSA水解活性的pH依存性进行了研究。在测算中,使用了在上述<2>中获得的浓缩上清液和<3>中获得的纯化酶。

各pH的PSA水解活性的测算除了使用在上述<2>中获得的浓缩 上清液之外,以与实施例1的<13>相同的方式进行,求得通过酶的水解产生的还原糖含量。由大肠杆菌转化体生产的AR19G-166-RW及AR19G-166-QW分别在80℃和75℃进行PSA水解反应,算出PSA水解活性(U/mg)。在由曲霉菌转化体生产的AR19G-166-RW及AR19G-166-QW中,以80℃的温度进行PSA水解反应,各pH的PSA水解活性是以得到最大活性的pH5.2的PSA水解活性为100%算出的相对活性值(%)。

算得的各pH的PSA水解活性的相对活性值(%)示于图11B中。同时在图11B中也表示了在实施例1的<13>中测算得到的大肠杆菌表达的AR19G-166-RW及AR19G-166-QW(图中,分别为“来源于大肠杆菌的RW”及“来源于大肠杆菌的QW”)的PSA水解活性(U/mg)的测算结果。曲霉菌表达的AR19G-166酶(在图中,分别为“来源于米曲霉的RW”及“来源于米曲霉的QW”)表现出比大肠杆菌表达的AR19G-166酶(图中,分别为“来源于大肠杆菌的RW”及“来源于大肠杆菌的QW”)宽的pH特性,表示最大活性值的50%的pH在80℃的反应温度下为3.3~8.0的范围。大肠杆菌表达时,该pH范围为4.5~6.8。

[实施例3]

通常,以植物为宿主的重组基因的蛋白质生产与大肠杆菌或芽孢杆菌等细菌表达系统、以及曲霉菌等丝状真菌表达系统相比,可获得高得多的表达量。特别是,叶绿体转化体在转化叶中以总可溶性蛋白质(TSP)比例计积累5~10质量%的外源蛋白,有时可表现出TSP比例为40质量%以上的高度积累。另一方面,核基因组转化在转化组织中以TSP比例为1质量%左右积累外源蛋白。因此,利用植物的蛋白质生产,特别是利用叶绿体转化体的外源蛋白生产,具有远超作为传统蛋白质生产平台的细菌和丝状真菌培养的经济优势。因此,制备了将AR19G-166-RA及AR19G-166-QV插入烟草叶绿体基因组内 的烟草叶绿体转化体。

<1>烟草叶绿体转化体的制作

构成叶绿体转化构建体(construct)的叶绿体基因组内部导入区、5’/3’表达调控区及筛选标记基因等参考迄今为止报道的外源蛋白的高表达例而进行设计(Daniell等,《分子生物学方法》,2005年,第286卷,第111-138页;Verma和Daniell,《植物生理学》,2007年,第145卷,第1129-1143页)。

首先,制备具有图12A所示结构的烟草叶绿体转化用表达盒载体pNtaGL及pNtaGLPL。该载体为用于在烟草叶绿体基因组内的反向重复序列中的trnI基因-trnA基因之间的区域通过同源重组导入目标基因的载体。作为以奇霉素抗性为指标的筛选标记,上述载体具有aadA基因(氨基糖苷-3’-腺苷酰基转移酶(Aminoglucoside-3’-adenyltransferase))的表达盒,在aadA基因表达盒的下游具有目标基因的表达盒导入部位(Cla Ⅰ-BsiWI位点)。pNtaGL载体中虽然插入了作为aadA基因的表达调控区的来源于烟草的16S核糖体RNA基因的启动子(Prrn),但pNtaGLPL载体为不含有启动子区的载体,aadA基因的表达依赖于同源重组区域上游的内部启动子。

图12B表示了目标基因的表达盒pPXT及pPXTPL。均设计为在BamHI位点插入目标基因,在目标基因的5’一侧分别具有Prrn启动子和来源于噬菌体T7的基因10(T7g10)序列,或仅具有T7g10序列。T7g10序列是暗示了外源基因在叶绿体中表达时对外源蛋白的高度积累有效的序列。在目标基因的3’一侧同样的配置了烟草叶绿体rbcL基因的3’-UTR(TrbcL),均可以通过表达盒两端的ClaI位点及BsiWI位点导入图12A所示叶绿体转化用表达盒的载体pNtaGL或pNtaGLPL载体。

PCR克隆AR19G-166-RA及AR19G-166-QV分别通过带有 BamHI接头(Linker)的引物进行扩增,将所得到的扩增产物插入表达盒pPXT或pPXTPL的BamHI位点。通过将插入AR19G-166-QV的表达盒pPXT利用ClaI位点及BsiWI位点整合到pNtaGL中,制备在trnI基因-trnA基因之间的区域具有aadA基因表达盒和AR19G-166-QV的表达盒的串联结构的叶绿体转化构建体pNtaGL-QV。以相同的方式,将插入有AR19G-166-RA的表达盒pPXTPL整合到pNtaGLPL中,制成叶绿体转化构建体pNtaGLPL-RA。图12C中示意性的表示了叶绿体转化构建体pNtaGL-QV及pNtaGLPL-RA的结构。在图12C中,“QV”指AR19G-166-QV,“RA”指AR19G-166-RA。

烟草叶绿体转化基本是按照Daniell等的方法(Daniell等,《分子生物学方法》,2005年,第286卷,第111-138页)进行的。具体而言,用MS平板培养基(含有30g/L蔗糖的Murashige和Skoog(MS)培养基(pH5.8)用3g/L的结冷胶固化而成的培养基)进行无菌接种,将长成的烟草(Nicotiana tabacum cv.SR-1)的绿叶切为0.5厘米见方,以叶子的近轴面与培养基接触的方式排布于填充有RMOP培养基的培养皿中央(Svab等,《美国科学院院报》,1990年,第87卷,第8526-8530页)。以16小时光照期/8小时黑暗期的条件培养1天后,分别用粒子枪(PDS-1000He,伯乐社制)导入pNtaQV或pNtaRA,以及作为比较解析用对照的pNtaGL或pNtaGLPL载体。粒子枪中使用了0.6μm的金粒子和1100psi的防爆板(Rupture disk),从防爆板到样本的距离约为9cm。

导入基因构建体后的烟叶在暗处以25℃培养3天后,移植到含有500mg/L奇霉素的RMOP培养基中,在25℃、16小时光照期/8小时黑暗期的条件下以2周的间隔持续种植。途中,通过切下再生幼株的叶子,移植到含有500mg/L奇霉素的RMOP培养基中,重复进行去分化和再分化,促进异质(hetroplasmic)状态植株的同质化 (homoplasmic)。

从经过3、4次去分化和再分化而得到的奇霉素抗性幼株采集100mg叶片,进行了DNA的提取。以该DNA为模板,用特异扩增导入序列的引物进行PCR,筛选在烟草叶绿体基因组的trnI基因-trnA之间导入目标序列的个体。

将确认导入有AR19G-166-RA或AR19G-166-QV、以及各个载体对照的个体移植到含有500mg/L奇霉素的MS培养基中,促进生根及植株的生长。从长成10cm左右大小的植株中,使用DNeasy植物小型试剂盒(QIAGEN社制)提取DNA,通过Southern印迹研究所导入基因的同质状态。具体而言,首先,用限制性酶Bgl Ⅱ消化从叶绿体转化烟草或野生型烟草(WT(SR-1))的叶子中提取的DNA各1μg。对于Bgl Ⅱ消化后的DNA,使用与trnI上游区域约1kb相同的碱基序列构成的探针进行Southern印迹,通过GE医疗社的AlkPhos Direct,对该探针进行了化学发光检测。理论上,对于由该探针检测到的DNA片段,野生型烟草约为4.5kb,pNtaGL-QV及pNtaGLPL-RA叶绿体转化烟草为7.1kb,pNtaGL或pNtaGLPL载体的叶绿体转化烟草分别为6.0kb或5.9kb。通过导入pNtaGL-QV而获得的2个系统的叶绿体转化烟草(QV-2、QV-17)与通过导入pNtaGLPL-RA而得到的3个系统的叶绿体转化烟草(RA-6-2-1、RA-6-2-2、RA-6-2-3)的Southern杂交结果示于图13A及13B中。此外,通过导入pNtaGL及pNtaGLPL载体而得到的叶绿体转化烟草的Southern杂交的结果示于图13C中。均仅检测到来源于重组型叶绿体的7.1kb或6.0kb、或者5.9kb的条带,并由于没有检测到来源于野生型叶绿体的约4.5kb的条带,因此确认了全部的叶绿体都是重组型的同质叶绿体转化体。

使同质叶绿体转化体进一步生长,在7叶左右的时期移植到18cm的培养土中,在重组体温室进行栽培。分别导入有AR19G-166-QV及AR19G-166-RA的叶绿体转化体在之后的生长中,在没有观察到形 态异常的情况下结出果实。使用T1植物进行表型分析,结果没有确认到比野生型及导入载体对照的叶绿体转化体的发育稍许迟缓的形态异常,并且花期的生物质的量与载体对照在同一水平。图14A为导入AR19G-166-QV的叶绿体转化烟草(T1世代)和载体对照(pNtaGL)的花期照片,图14B同样为AR19G-166-RA(T1世代)与载体对照(pNtaGLPL)的花期照片。

<2>来自于叶绿体转化烟草的纤维二糖水解酶蛋白的提取

纤维二糖水解酶蛋白质的提取是从导入AR19G-166-QV或AR19G-166-RA的叶绿体转化烟草植株中选出各一系统,分别各自由3个个体按下述方式进行的。从3片到达花期的叶绿体转化烟草植株的中间部分的叶子中,切出100mg左右的叶片各5~10片。将各个叶片投入预先加入3个直径为3mm的钨珠(QIAGEN社制)的试管中,在此状态下将其投入液氮使其冷冻。对于被冷冻的叶片,通过使用混合型研磨仪(Mixer Mill)MM400(Retsh社制)在30Hz下破碎90秒后,配制添加了叶片重量的10倍体积的含有1体积%的蛋白酶抑制剂(Sigma社制)的50mM醋酸缓冲液(pH5.5)的悬浊液。通过将该悬浮液充分搅拌后进行离心分离,制备了含有酶蛋白(AR19G-166-QV及AR19G-166-RA)的可溶性蛋白提取液。对于AR19G-166-RA,通过离心式超滤膜VIVASPIN 20(Sartorius stedim社制)对提取液进行5~10倍的浓缩。此外,作为用于比较分析的对照,通过同样的处理,从导入有pNtaGL或pNtaGLPL载体的叶绿体转化烟草植株制备可溶性蛋白质提取液。

上述可溶性蛋白质提取液通过SDS-PAGE分析和Western印迹分析进行了确认。使用Mini-PROTEAN TGX免染预制胶(伯乐社制)进行SDS电泳及Western印迹。将上述提取液和纯化酶与Tris-SDSβ-ME处理液(Cosmo Bio公司制造)以1:1混合后,在100℃下进行10分钟处理,每个样本,AR19G-166-QV为5μL,AR19G-166-RA和 对照个体为10μL,纯化酶为0.2μg,分别使它们进行电泳。电泳完成后,通过CBB染色检测到蛋白质的条带。Western印迹以与实施例1的<9>相同的方式进行。

图15A~图15D中表示了,由导入有AR19G-166-QV的叶绿体转化烟草植株和导入有pNtaGL的叶绿体转化烟草植株得到的可溶性蛋白的提取液的SDS-PAGE分析(图15A)及其Western印迹分析(图15B)、以及从导入有AR19G-166-RA的叶绿体转化烟草植株和导入有pNtaGLPL的叶绿体转化烟草植株得到的可溶性蛋白的提取液的SDS-PAGE分析(图15C)及其Western印迹分析(图15D)的结果。图15A~图15D的泳道1为蛋白质分子量标准,泳道2为纯化酶蛋白,泳道3~5为从3个个体的导入有AR19G-166-QV或AR19G-166-RA的叶绿体转化烟草植株得到的可溶性蛋白质的提取液,泳道6~8为从3个个体的导入有pNtaGL或pNtaGLPL的叶绿体转化烟草植株得到的可溶性蛋白质的提取液。

AR19G-166-QV及AR19G-166-RA蛋白酶均在烟草叶绿体内表达。在AR19G-166-QV及AR19G-166-RA的叶绿体转化烟草植株的可溶性蛋白质的提取液的SDS-PAGE分析中,在对应于各个纯化酶蛋白(图15A、图15C的泳道2)的位置确认到条带(图15A、图15C的泳道3~5)。另一方面,在导入有pNtaGL或pNtaGLPL的对照个体中,没有确认到条带(图15A、图15C的泳道6~8)。

通过使用了针对由AR19G-166的第384~403位的20个氨基酸残基所构成的多肽的抗体的Western印迹,在AR19G-166-QV(图15B的泳道3~5)及AR19G-166-RA(图15D的泳道3~5)的叶绿体转化烟草植株的可溶性蛋白质的提取液这两者中,在对应于各个纯化酶蛋白(图15B、图15D的泳道2)的位置确认到条带。此外,在AR19G-166-QV及AR19G-166-RA中,在比该酶蛋白分子量小的位置也确认到条带。可认为很可能是植株内的酶蛋白一部分被消化,或者 是混有表达不充分的酶蛋白。另一方面,在导入有pNtaGL及pNtaGLPL的对照个体中,完全没有确认到条带(图15B、图15D的泳道6~8)。

<3>纤维二糖水解酶活性的温度依存性

对由叶绿体转化烟草生产的AR19G-166-RW及AR19G-166-QW的PSA水解活性的温度依存性进行了研究。在测算中,使用了上述得到的可溶性蛋白质提取液。

各温度下的PSA水解活性的测算除了使用在上述得到的可溶性蛋白质提取液之外,以与实施例1的<10>相同的方式进行,求得通过酶的水解产生的还原糖浓度。

各温度下的烟草叶绿体所表达的AR19G-166-QV蛋白及AR19G-166-RA蛋白的PSA水解活性示于图16A及16B中。在30℃~100℃的温度范围内,酶活性以还原糖含量表示。结果确认到,烟草叶绿体所表达的AR19G-166-QV及AR19G-166-RA表现出与大肠杆菌所表达的AR19G-166-QV及AR19G-166-RA相同的PSA水解活性的温度依存性,正常地发挥功能。烟草叶绿体所表达的AR19G-166-QV(图16A)的最适温度(Topt)虽然因个体不同而不同,但为70~75℃,几乎表现出与大肠杆菌所表达的AR19G-166-QV同等程度的耐热性。此外,在烟草叶绿体所表达的AR19G-166-RA(图16B)中,最适温度(Topt)虽然因个体不同而不同,但为75~80℃,几乎表现出与大肠杆菌所表达的AR19G-166-RA同等程度的耐热性。另一方面,在导入有pNtaGL及pNtaGLPL的对照个体中,没有确认到PSA水解活性。

[实施例4]

以丝状真菌和植物等真核生物为宿主导入任意基因,通常,所表达的蛋白质的最适温度即升高5~10℃左右。这被称为糖基化(糖链修饰),其基于向蛋白质添加糖类的翻译后修饰反应,糖基化蛋白变 得对热稳定。在AR19G-166-RA及AR19G-166-QV基因的氨基酸残基序列中,N-连接型糖基化基序Asn-Xaa-Ser/Thr存在于4处。若以真核生物为宿主进行基因表达,则在这些基序中有可能发生糖链修饰,耐热性有望提高。在作为十字花科植物的拟南芥(Arabidopsis thaliana)中导入AR19G-166-RA及AR19G-166-QV基因,验证了糖链修饰对它们所编码的酶蛋白的耐热性的效果。

<1>拟南芥转化体的制作

以AR19G-166-RA及AR19G-166-QV基因为模板进行PCR,整合到质外体积累型的植物表达载体pIG121-Bar中。利用冻融法将上述表达载体导入农杆菌(根癌农杆菌(Agrobacterium tumefaciens))中。具体而言,在冰上解冻的农杆菌EHA105菌株的感受态细胞中,加入约1μg质粒(表达载体),轻轻混合后,用液氮瞬间冷冻。然后,在37℃加热4分钟来解冻,加入SOC培养基0.5ml,在28℃培养1~3小时。将所得到的培养液涂布到含有50mg/L卡那霉素和10mg/L PPT(草丁膦)的LB琼脂培养基上,在28℃的培养器中静置培养2天,由此得到转化农杆菌。对转化农杆菌进行液体培养后,提取质粒,用3730DNA分析测序仪(生命技术(Life Technologies)社制)进行序列确认。

接着,使用在22℃、24小时光照期中生长约2个月的拟南芥植株、以及由含有50mg/L卡那霉素和10mg/L PPT的LB培养基培养的转化农杆菌,制备转化拟南芥。

首先,对OD600=1左右的农杆菌培养液进行收菌后,悬浊于5%蔗糖、0.05%Silwet溶液中。然后,将拟南芥植株浸泡于农杆菌悬浊液中数秒,进行种子的感染。种子成熟后进行回收,使用含有50mg/L卡那霉素和10mg/L PPT的1/2MS培养基进行转化体的筛选,得到纤维二糖水解酶转化拟南芥,对于AR19G-166-RA为6个个体,对于AR19G-166-QV为4个个体。对于其中的2个个体,Arabi_RA4及 Arabi_QV4,研究了纤维二糖水解酶活性。

<2>由拟南芥转化体生成的纤维二糖水解酶蛋白的提取与酶活性检测

上述蛋白质的提取是将100mg转化拟南芥个体的叶子在液氮中用研钵和研钵棒粉碎后,加入1mL含有1体积%蛋白酶抑制剂混合物(Sigma-Aldrich社制)的20mM醋酸缓冲液(pH5.5),充分混合。将所得到的混合物转移到2mL微管中,在15,000rpm、4℃进行10分钟离心分离,回收上清液作为粗酶提取液。另外,使用野生型拟南芥的叶子,以同样的方式制备的粗酶提取液作为对照(非转化区)。

对于拟南芥转化体Arabi_RA4、Arabi_QV4、以及对照(未重组)个体,使用粗酶提取液进行Western印迹分析,确认了纤维二糖水解重组基因的表达。Western印迹分析以与实施例1的<9>相同的方式进行,其结果示于图17中。图17的泳道1为蛋白质分子量标准,泳道2为AR19G-166-RA基因重组拟南芥(Arabi_RA4)的叶子的粗酶提取物,泳道3为AR19G-166-QV基因重组拟南芥(Arabi_QV4)的叶子的粗酶提取物,泳道4为野生型拟南芥(WT)的叶子的粗酶提取物。

导入有AR19G-166-RA的拟南芥转化体(Arabi_RA4)和导入有AR19G-166-QV的拟南芥转化体(Arabi_QV4)的粗酶提取液分别在53.9kDa和52.1kDa处出现强条带。转化体Arabi_RA4的酶蛋白的分子量比转化体Arabi_QV4的酶蛋白的分子量稍大(图17的泳道2、3)。该蛋白质在大肠杆菌中生产时的大小为46.7kDa,以拟南芥为宿主表达的AR19G-166-RA基因及AR19G-166-QV基因所编码的蛋白质,其表观分子量分别增加了7.2kDa和5.4kDa。可认为该分子量的增加是由于添加了糖链,转化体Arabi_RA4和Arabi_QV4中表达的酶蛋白的分子量差异是由于添加糖链的程度不同。

<3>拟南芥表达AR19G-166蛋白质的纤维二糖水解酶活性的温 度依存性

对由该基因重组拟南芥转化体生产的AR19G-166-RA酶蛋白及AR19G-166-QV酶蛋白的PSA水解活性的温度依存性进行了研究。在测算中,使用了在上述<2>中获得的粗酶溶液,以与实施例1的<10>相同的方式进行,求得通过酶的水解产生的还原糖含量。

算得的各温度的PSA水解活性(还原糖含量)示于图18中。在图18中,作为比较对照区,测算了野生型拟南芥植株(WT)的纤维二糖水解酶活性,并进行了标绘。

以拟南芥为宿主表达的AR19G-166-RA酶蛋白表现出最高酶活性的温度的测算上限为100℃,推断其最适温度为100℃以上。另一方面,AR19G-166-QV的最适温度为90℃。因此,AR19G-166基因在拟南芥核基因组系统中表达即增加约10%的分子量,且最适温度升高了15~30℃。特别是,拟南芥表达AR19G-166-RA的耐热性极其优异,比传统的来源于嗜热丝状真菌的耐热性纤维二糖水解酶的最适温度还高30℃以上。

由这些结果可知,通过利用植物或丝状真菌等真核生物的核基因组表达系统表达本发明的耐热性纤维二糖水解酶,能够得到在80℃以上也具有高纤维二糖水解酶活性的酶。通过将在80~100℃的温度范围内表现出高酶活性的本发明的耐热性纤维二糖水解酶与同样是热稳定性高的内切葡聚糖酶、木聚糖酶或β-葡萄糖苷酶等一同使用,能够使得在80℃以上的高温条件下进行木质纤维素的糖化处理。

[实施例5]

作为放线菌的链霉菌(Streptomyces)属细菌由于生产有用的抗生素和生理活性物质而为人所知,是在工业上广泛使用的有用细菌。对应用了该物质生产能力的、外源基因的大量表达系统进行了开发,已经报道了一些成功例子(专利文献3、4和5,非专利文献9、10和11)。特别是,由于放线菌具有高GC含量的基因组,因而其具有 良好表达在大肠杆菌中表达困难的GC含量高的基因的倾向(非专利文献11),此外,还报道了异源蛋白质的表达达到放线菌无细胞提取液的40%的极高水平的表达性(非专利文献9)。对作为用于较廉价的大量生产本发明的耐热性纤维二糖水解酶的手段而导入AR19G-166-RA基因的放线菌的该蛋白质的表达性进行了验证。

<1>导入AR19G-166-RA基因的放线菌的制作

以pET101/D-TOPO载体(生命技术(Life Technologies)社制)克隆的AR19G-166-RA基因为模板,通过PCR将其转移到放线菌表达载体pHSA81(专利文献4)中,对变铅青链霉素TK24菌株进行转化。上述TK24菌株可从约翰英纳斯中心(John Innes Centre,诺里奇研究园(Norwich Research Park),诺里奇,NR47UH,英国)等获取。

上述转化是以“链霉菌属的遗传操作(Genetic manipulation of Streptomyces):实验室手册”中记载的方法(原生质体的聚乙二醇融合法(protoplast polyethylene glycol fusion method))为标准进行的。转化后,通过菌落PCR筛选阳性克隆,在YEME培养基(0.3%酵母提取物、0.5%细菌蛋白胨、0.3%麦芽提取物、1%葡萄糖、34%蔗糖、5mM MgCl2、0.5%甘氨酸)中振荡培养后,提取重组质粒,使用3730DNA分析测序仪(生命技术(Life Technologies)社制)进行序列确认。

<2>放线菌中的AR19G-166-RA蛋白的表达

将所得转化体接种到含有5μg/mL硫链丝菌素的YEME培养基中,在28℃振荡培养5天,通过离心分离进行收菌。用50mM Tris-HCl缓冲液(pH8.0)清洗菌体后,加入培养液的1/10体积的相同缓冲液进行悬浊。然后,用超声波破碎装置BioRuptorUCD-200T(Cosmo Bio社制)进行10次破碎30秒后停止30秒的处理,用离心后的上清液(无细胞提取液)进行SDS-PAGE的结果示于图19中。图19的泳道1为蛋白质分子量标准,泳道2为大肠杆菌表达AR19G-166-RA纯 化蛋白(箭头),泳道3为AR19G-166-RA基因重组放线菌变铅青霉素3的无细胞提取物。在图19中,在预期大小(46.7kDa)处确认到目标蛋白质的强表达(图19的泳道3)。

<3>放线菌表达AR19G-166-RA蛋白的酶活性测定

使用AR19G-166-RA基因重组放线菌的无细胞提取液进行纤维二糖水解酶的活性测定。活性测定是通过将由50μL无细胞提取液试剂和50μL含有1质量%磷酸溶胀Avicel(PSA)的200mM醋酸缓冲液(pH5.5)构成的混合液在30~100℃下反应20分钟来进行的。

底物溶液和酶在反应温度下分别各自保温5分钟后进行混合,开始反应。反应中,任一混合液为了防止不溶性底物的沉淀,都使用了Eppendorf社的恒温混匀器(ThermoMixer,1400rpm)进行搅拌。在全部测算中,以仅使50μL含有1质量%磷酸溶胀Avicel(PSA)的200mM醋酸缓冲液(pH5.5)在各温度下反应,在反应停止后添加50μL无细胞提取液试剂的混合液为对照区。反应结束后,添加等量的3,5-二硝基水杨酸试剂(DNS溶液),在100℃进行5分钟加热处理,冷却5分钟后进行离心,得到上清液。用分光光度计测算上述上清液的540nm的吸光度,使用由葡萄糖制作的校准曲线算出上清液中的还原糖含量,由其与对照区的差求得通过酶的水解产生的还原糖含量。各个测算通过3次独立的试验进行,求取平均值和标准误差。结果示于图20中。在图20中,各数据点中进行了3次测算,将平均值和标准误差对应于温度进行了标绘。

以1分钟产生1μmol还原糖的酶活性为1U,除以酶蛋白的量得到的值为比活性(U/mg)时,80℃的比活性为3.02。由上述可知,AR19G-166-RA纤维二糖水解酶由于在放线菌中表现出良好的表达及活性,因此能够用作本发明的导入基因的宿主。

[实施例6]

在纤维素酶中,有不仅具有水解纤维素的催化结构域,还具有具 纤维素结合功能的模块(CBM,糖类结合模块)的纤维素酶。CBM自身不具有分解活性,但具有独自与纤维素结合的能力。作为CBM的功能,已知通过吸附于不溶性底物,使底物周围的附于CBM的催化结构域的浓度上生,提高纤维素的分解速度,以及通过与CBM的结合,切断纤维素链间的氢键使其分离,从而破坏结晶构造(非专利文献12、13)。此外,若从分解结晶纤维素的CBH去除CBM,则与对可溶性底物的反应性没有变化无关,对结晶纤维素的分解活性和亲和性显著降低,因此认为CBM是酶作用于结晶纤维素而必须的结构域(非专利文献14)。反之,也有这样的报道,通过在一种本来不具有CBM的内切葡聚糖酶上添加CBM,使其对结晶纤维素的亲和性以及分解能力升高(非专利文献5)。

作为使本发明的耐热性纤维二糖水解酶的纤维素分解活性更高的手段,制作了在AR19G-166-RA上添加CBM的基因,验证了CBM的添加对于其所编码的酶蛋白的纤维素分解活性的效果。

<1>添加CBM的AR19G-166-RA基因的制作

CBM序列及连接序列使用了实施例1<5>中所示开放阅读框OJ1-1的序列。在AR19G-166-RA基因的C末端一侧添加开放阅读框OJ1-1的连接序列,在其C末端一侧添加开放阅读框OJ1-1的CBM3序列。添加CBM的AR19G-166-RA基因的全长碱基序列按照大肠杆菌的密码子使用频率进行最适化,进行人工合成。分别将添加的连接及CBM3基因的氨基酸序列示于序列号17中、碱基序列示于序列号18中,按照大肠杆菌的密码子用频率最适化的、添加CBM的AR19G-166-RA基因的全长氨基酸序列示于序列号19中、碱基序列示于序列号20中。序列号18的第808位至第810位的3个碱基TAA及序列号20的第2092位至第2094位的3个碱基TAA均为终止密码子。

将以上述方式合成的基因整合到表达载体pLEAD(NIPPON GENE社制)中,用JM109菌株进行转化,用生命技术社的3730DNA分析测序仪进行了序列确认。

<2>添加CBM的AR19G-166-RA蛋白的表达

序列确认后,将保持具有目标基因的质粒的大肠杆菌克隆接种到5mL含有100mg/mL氨苄西林的LB培养基中,在37℃振荡培养20小时。培养后,通过离心分离回收大肠杆菌,加入培养液的1/10体积的50mM Tris-HCl缓冲液(pH8)进行悬浊。然后,用超声波破碎装置BioRuptorUCD-200T(Cosmo Bio社制)进行10次破碎30秒后停止30秒的处理,得到离心后的上清液(大肠杆菌粗提物)。上述大肠杆菌粗提物的一部分用SDS-PAGE进行电泳,在预期大小处确认到目标蛋白质的表达。蛋白质的表达确认后,以37℃培养过夜的大肠杆菌溶液作为预培养液,用其100倍量的含有100mg/mL氨苄西林的LB培养基进行主培养(Main culture)。

<3>添加CBM的AR19G-166-RA蛋白的纯化

培养后,进行离心分离以回收大肠杆菌,加入培养液的1/10体积的50mM Tris-HCl缓冲液(pH8)进行悬浊。然后,使用超声波破碎装置astrason3000(MISONIX社制),重复7-8周期的5分钟破碎-5分钟停止的步骤,得到含有目标蛋白质的基因重组大肠杆菌的粗提物。用过滤器(孔径φ=0.45μm,Millipore社制)对该基因重组大肠杆菌粗提物进行过滤,将所得滤液作为基因重组大肠杆菌破碎上清液。

将该基因重组大肠杆菌破碎上清液填充到用50mM Tris-HCl缓冲液(pH8.0)平衡的离子交换柱HiTrap Q HP(GE医疗社制)中,用中压液相色谱系统AKTA design(GE医疗社制),在含有1M NaCl的50mM Tris-HCl缓冲液(pH8.0)中以0~50%的浓度梯度对蛋白质进行分级。将具有纤维二糖水解酶活性的分级收集混合后,通过离心式超滤膜VIVASPIN20(Sartorius stedim社制)进行与1mM磷酸缓 冲液(pH6.8)的溶液交换与浓缩,填充到以相同缓冲液平衡的羟磷灰石柱CHT5-1(伯乐社制)中,通过400mM磷酸缓冲液(pH6.8)以0~100%的浓度梯度对蛋白质进行分级。将具有纤维二糖水解酶活性的分级收集混合后,用VIVASPIN20浓缩至液量为8mL左右。在所浓缩的样本中,添加到由含有150mM NaCl的50mM Tris-HCl缓冲液(pH8.0)平衡的凝胶过滤柱Hiload26/60superdex200pg(GE医疗社制),通过以2~3mL/分钟的流速流过柱子体积的1~1.5倍体积的相同缓冲液来进行分级。将具有纤维二糖水解酶活性的分级收集混合后,通过VIVASPIN20,进行与50mM磷酸缓冲液(pH6)的溶液交换和浓缩,填充到用相同溶液平衡的离子交换柱HiTrap SP HP(GE医疗社制)中,通过含有1M NaCl的50mM磷酸缓冲液(pH6)以0~50%的浓度梯度对蛋白质进行分级。将具有纤维二糖水解酶活性的分级收集混合后,进行与50mM Tris-HCl缓冲液(pH8.0)的溶液交换和浓缩,得到终浓度约为1mg/mL的纯化酶。

通过SDS-PAGE分析和Western印迹对基因重组大肠杆菌破碎上清液和所纯化的添加CBM的AR19G-166-RA蛋白进行了确认。除了SDS-PAGE分析及Western印迹分析使用Mini-PROTEAN TGX免染预制胶(伯乐社制)之外,以与实施例1的<9>同样的方式进行,基因重组大肠杆菌破碎上清液为10μL,纯化酶为0.5μL,分别进行电泳。在SDS-PAGE分析中,蛋白质的条带通过Gel Doc EZ成像仪(伯乐社)进行检测。

图21A及图21B中表示了添加CBM的AR19G-166-RA蛋白在大肠杆菌中表达而得到的酶蛋白的SDS-PAGE分析(图21A)和Western印迹分析(图21B)的结果。图21A及图21B的泳道1为蛋白质分子量标准,泳道2为基因重组大肠杆菌破碎上清液,泳道3为纯化的添加CBM的AR19G-166-RA蛋白,泳道4为在实施例1的<9>中纯化的纤维二糖水解酶蛋白的电泳图案。

添加CBM的AR19G-166-RA蛋白在大肠杆菌中表达。在基因重组大肠杆菌破碎上清液的SDS-PAGE分析中,在从氨基酸序列(序列号19)预测的分子量74.5kDa附近确认到条带(图21A的泳道2)。对该蛋白质进行纯化时,虽然确认到对应于上述条带的强条带,但在分子量60kDa附近也确认到弱条带(图21A的泳道3)。通过使用了针对由AR19G-166的第384~403位的20个氨基酸残基所构成的多肽的抗体的Western印迹,在基因重组大肠杆菌破碎上清液(图21B的泳道2)中,在分子量74.5kDa附近检测到酶蛋白的条带。此外,在分子量60kDa附近也检测到条带,但认为这很可能是大肠杆菌内的酶蛋白一部分被消化、或者是混有表达不充分的酶蛋白。在纯化酶(图21B的泳道3)中,也在分子量74.5kDa附近检测到酶蛋白的强条带的同时,在分子量60kDa附近检测到弱条带,但确认主要含有的蛋白质为该酶蛋白。

<4>添加CBM的AR19G-166-RA蛋白的活性

对基于添加CBM的AR19G-166-RA蛋白的PSA和Avicel水解活性的温度依存性进行了研究。测算中使用了上述得到的纯化酶(终浓度约1mg/mL)。

纯化酶对于PSA和Avicel的水解活性的测定除了将由100μL 1质量%底物水溶液、50μL 200mM醋酸缓冲液(pH5.5)、40μL纯化水或10mM CaCl2水溶液、以及10μL纯化酶构成的混合液在50、60、70、75、80、85、90或99℃进行20分钟反应之外,以与实施例1的<10>相同的方式进行,求得通过酶水解产生的还原糖含量,算出水解活性(U/mg)。

各温度的添加CBM的AR19G-166-RA蛋白的PSA及Avicel水解活性示于图22A和22B中。结果,在PSA分解活性中,与钙离子存在与否无关,没有确认到添加CBM的效果,比单纯为AR19G-166-RA蛋白的分解活性还少很多(图22A)。然而,在Avicel 分解活性中,在钙离子的存在下,在50~85℃的宽温度范围内观察到分解活性的显著升高(图22B)。另一方面,在不存在钙离子的条件下,在70℃以上的温度范围内没有观察到Avicel分解活性的升高。这表示,CBM的热稳定性取决于钙离子。

由这些结果可知,通过在本发明的耐热性纤维二糖水解酶中添加CBM,至少在钙离子的存在下,能够使结晶纤维素的水解活性升高。

工业实用性

本发明的耐热性纤维二糖水解酶至少在75℃、pH5.5时具有纤维二糖水解酶活性,适用于75℃以上的高温条件下的含有纤维素的生物质的糖化处理。因此,该耐热性纤维二糖水解酶及其生产所使用的多核苷酸、整合了该多核苷酸的表达载体、导入有该表达载体的转化体可用于例如从含有纤维素的生物质产生能源的领域。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1