耐热性纤维二糖水解酶的制作方法

文档序号:11212252阅读:575来源:国知局
耐热性纤维二糖水解酶的制造方法与工艺

本发明涉及一种耐热性纤维二糖水解酶、编码所述耐热性纤维二糖水解酶的多核苷酸、用于表达所述耐热性纤维二糖水解酶的表达载体、以及整合了所述表达载体的转化体及使用了所述耐热性纤维二糖水解酶的制备纤维素分解产物的方法。

本申请要求基于2016年3月28日在日本申请的日本特愿2016-064525号的优先权,并在本文中引用其内容。



背景技术:

除了全球变暖以及大气污染等环境上的问题以外,由于对于原油价格的大幅度上升以及不久将来的原油枯竭的预测(石油峰值)等运输用能源供给的担忧,近年来,开发代替石油的能源成为非常重要的课题。植物生物质或木质纤维素是地球上最丰富的可再生能源,其作为代替石油的资源而备受期待。植物生物质干重的主要构成要素为由纤维素或半纤维素等多糖类与木质素构成的木质纤维素。例如,多糖类,在通过作为糖苷水解酶的纤维素酶或半纤维素酶而被水解为葡萄糖或木糖等单糖后,可被用作生物燃料或化学产品的原料。

木质纤维素具有复杂的结构,为难分解性,以单一的糖苷水解酶难以分解、糖化(水解(hydrolysis))。在木质纤维素的全分解中,通常认为需要内切葡聚糖酶(纤维素酶或内切-1,4-β-d-葡聚糖酶、ec3.2.1.4)、外切型的纤维二糖水解酶(1,4-β-纤维二糖苷酶(cellobiosidase)或纤维二糖水解酶、ec3.2.1.91、ec3.2.1.176)、β-葡萄糖苷酶(ec3.2.1.21)这三种酶,此外还需要适当添加还包含作为半纤维素酶的木聚糖酶(内切-1,4-β-木聚糖酶、ec3.2.1.8)或β-木糖苷酶(ec3.2.1.37)等其他植物细胞壁分解酶的多种酶。

在以往的将木质纤维素作为资源的生物乙醇的制备中,以乙醇的高能量效率转化为目的,尝试了利用高固相含量(solidloading)(30~60%固相含量)进行的糖化处理(水解处理(hydrolysisprocess))。这种利用高固相含量进行的木质纤维素的酶糖化(酶水解(enzymatichydrolysis)),其生物质糖化液(生物质水解液(hydrolyzedbiomasssolution))的粘性高,难以进行木质纤维素的水解反应。于是,通过使用耐热性酶,在例如65℃以上的高温下进行酶糖化处理,由此提高水解反应速度,同时降低生物质糖化液的粘性,因此预期能够实现缩短糖化反应时间(水解反应时间(hydrolysisreactiontime))及削减酶量。因此,关于各种糖苷水解酶,期望开发出耐热性更优异的酶。

若纤维素通过纤维二糖水解酶被水解,则主要生成二糖的纤维二糖。已知纤维二糖水解酶中存在由纤维素的还原末端进行水解的类型(属于gh7、gh48家族等的纤维二糖水解酶)、由非还原末端进行水解的类型(属于gh5、gh6、gh9家族等的纤维二糖水解酶),若两者混合使用,则与分别单独使用时相比,纤维素的分解活性上升(例如,参照非专利文献1)。关于由纤维素的非还原末端进行水解的纤维二糖水解酶,在gh6家族中,报导有最适温度超过75℃的纤维二糖水解酶(例如,参照专利文献1)。

现有技术文献

专利文献

专利文献1:国际公开第2014/157492号

非专利文献

非专利文献1:boisset等,《应用与环境微生物学(appliedandenvironmentalmicrobiology)》,2000年,第66卷,第1444-1452页。



技术实现要素:

本发明要解决的技术问题

本发明的目的在于,提供一种至少在65℃、进一步在钙离子的存在下时在70℃下表现纤维二糖水解酶活性、进一步表现与gh6家族的纤维二糖水解酶的协同效应的、属于gh48家族的新型耐热性纤维二糖水解酶、编码所述耐热性纤维二糖水解酶的多核苷酸、用于表达所述耐热性纤维二糖水解酶的表达载体、整合了所述表达载体的转化体及使用了所述耐热性纤维二糖水解酶的制备纤维素分解产物的方法。

解决技术问题的技术手段

本发明的发明人们为解决上述问题,通过从堆肥培养物中提取dna,对分离困难的微生物菌群进行大规模的基因组测序,成功取得了具有新的氨基酸序列的耐热性纤维二糖水解酶,从而完成本发明。

即,本发明的耐热性纤维二糖水解酶、多核苷酸、表达载体、转化体、制备耐热性纤维二糖水解酶的方法、纤维素酶混合物及纤维素分解产物的制备方法,包含下述[1]~[12]的实施方式。

[1]一种耐热性纤维二糖水解酶,其具有由下列(a)、(b)或(c)构成的纤维二糖水解酶催化区域:

(a)由序列号1所表示的氨基酸序列构成的多肽;

(b)由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在65℃、且ph为6的条件下具有以磷酸溶胀微晶纤维素(phosphoricacidswollenavicel)为底物的水解活性的多肽;

(c)由与序列号1所表示的氨基酸序列具有80%以上序列一致性的氨基酸序列所构成、且至少在65℃、且ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽。

[2]根据所述[1]的耐热性纤维二糖水解酶,其中,在钙离子的存在下,至少在70℃、且ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性。

[3]一种多核苷酸,其具有由下列(a)、(b)、(c)、(d)、或(e)的碱基序列构成的编码纤维二糖水解酶催化区域的区域:

(a)编码由序列号1所表示的氨基酸序列构成的多肽的碱基序列;

(b)编码由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在65℃、ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(c)编码由与序列号1所表示的氨基酸序列具有80%以上序列一致性的氨基酸序列所构成、且至少在65℃、ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(d)编码与序列号2所表示的氨基酸序列具有80%以上序列一致性的、且至少在65℃、ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(e)为在严格条件下与序列号2所表示的碱基序列构成的多核苷酸进行杂交的多核苷酸的碱基序列,且为编码至少在65℃、ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列。

[4]根据所述[3]的多核苷酸,其中,所述多肽进一步在钙离子的存在下,至少在70℃、且ph为6的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性。

[5]一种表达载体,其整合了所述[3]或[4]的多核苷酸,其在宿主细胞中,能够表达具有纤维二糖水解酶活性的多肽。

[6]一种转化体,其导入有所述[5]的表达载体。

[7]根据所述[6]的转化体,其为真核微生物。

[8]一种制备耐热性纤维二糖水解酶的方法,其包括:在所述[6]或[7]的转化体内,生产耐热性纤维二糖水解酶。

[9]一种糖苷水解酶混合物,其含有:所述[1]或[2]所述的耐热性纤维二糖水解酶、所述[3]或[4]所述的多核苷酸编码的耐热性纤维二糖水解酶、或利用所述[8]所述的制备耐热性纤维二糖水解酶的方法制备的耐热性纤维二糖水解酶,及至少一种其他糖苷水解酶。

[10]根据所述[9]所述的糖苷水解酶混合物,其进一步含有gh6家族的纤维二糖水解酶。

[11]一种制备纤维素分解产物的方法,其包括:通过使含有纤维素的材料,与所述[1]或[2]的耐热性纤维二糖水解酶、所述[3]或[4]的多核苷酸编码的耐热性纤维二糖水解酶、所述[6]或[7]所述的转化体、或利用所述[8]的制备耐热性纤维二糖水解酶的方法制备的耐热性纤维二糖水解酶、或所述[9]所述的糖苷水解酶混合物接触,以生产纤维素分解产物。

[12]根据所述[11]的制备纤维素分解产物的方法,其中,使含有纤维素的材料,与所述耐热性纤维二糖水解酶或所述糖苷水解酶混合物一起,与gh6家族的纤维二糖水解酶接触。

发明效果

本发明的耐热性纤维二糖水解酶至少在65℃、且ph为6的条件下,在钙离子的存在下时则至少在70℃、且ph为6的条件下,具有纤维二糖水解酶活性。进一步,本发明的耐热性纤维二糖水解酶的纤维二糖水解酶活性表现与gh6家族的纤维二糖水解酶的协同效应。因此,所述耐热性纤维二糖水解酶适合于高温条件下的纤维素的糖化处理(水解处理(hydrolysisprocess))。

此外,本发明的多核苷酸、整合有该多核苷酸的表达载体、导入有所述表达载体的转化体,适用于本发明的耐热性纤维二糖水解酶的制备。

附图说明

图1为被推测为开放阅读框wn12-a3-v6-4所编码的多肽的氨基酸序列(序列号1)与类芽孢杆菌fslh7-689亚种的纤维素1,4-β-纤维二糖苷酶的氨基酸序列(序列号7)的比对图。

图2为表示在实施例1中,使wn12-a3-v6-4-10-11基因在大肠杆菌中表达而得到的wn12-a3-v6-4-10-11蛋白质的sds-page分析结果的图。

图3为表示在实施例1中,对于使wn12-a3-v6-4-10-11基因在大肠杆菌中表达而得到的wn12-a3-v6-4-10-11蛋白质的各底物的水解活性的测定结果的图。

图4为表示在实施例1中,对使wn12-a3-v6-4-10-11基因在大肠杆菌中表达而得到的wn12-a3-v6-4-10-11蛋白质的、在钙离子的存在下或无钙离子存在下时的各温度下的psa水解活性(ph6)进行测算的结果的图。

图5为表示在实施例1中,对使wn12-a3-v6-4-10-11基因在大肠杆菌中表达而得到的wn12-a3-v6-4-10-11蛋白质的各ph下的psa水解活性(60℃)进行测算的结果的图。

图6为表示在实施例1中,对将使wn12-a3-v6-4-10-11基因在大肠杆菌中表达而得到的wn12-a3-v6-4-10-11蛋白质与在大肠杆菌中表达而得到的gh6纤维二糖水解酶ar19g-166-ra,以各种比例进行混合的酶组合物的、psa水解活性及微晶纤维素(avicel)水解活性(ph6、70℃)进行测算的结果的图。

图7为表示在实施例1中,使wn12-a3-v6-4-10-11基因在大肠杆菌中表达而得到的wn12-a3-v6-4-10-11蛋白质所表示的、伴随热变性而引起的宝石橙蛋白染色试剂(syproorange)的荧光强度变化的实测值(a)及其一阶微分“-d(荧光)/dt”(b)的图。

具体实施方式

[耐热性纤维二糖水解酶]

众所周知,包括丝状真菌、细菌、及古细菌的多数微生物为难培养性,生存在土壤等微生物环境中的菌中约99%为未知的菌。尤其公认生存在高温环境下的微生物的培养是极其困难的,在现有的以分离微生物为目标的培养技术中,仅对生存在从自然界中采集的天然样本中的微生物的0.1%以下进行分离。该微生物的难培养性为无法推进耐热性纤维二糖水解酶的开发的原因之一。因此,对于耐热性纤维二糖水解酶的开发,需要研究不依赖以往的分离培养技术的方法。

近年来,通过开发可大量序列解码千兆碱基对的新一代测序仪,可完整解码土壤等中所含的微生物菌群的基因组。人们提出了一种宏基因组分析法,使得难培养性微生物的基因组解码得到了快速进展,该宏基因组分析法利用上述分析技术,从土壤等环境样本中制备微生物菌落的基因组dna,对基因组结构不均匀及杂多的菌落直接进行基因组的全面解码,通过并行计算机来拼接(assemble)解码数据,由此再度构成微生物菌群基因组序列。然而,在活跃进行有机物的分解的堆肥中,存在大量的微生物,即使使用新一代测序仪,为了全面解码基因组,需要更多的解码量。因此,为了有效得到具有目标性质的微生物菌群,本发明人们使用了利用仅以纤维素作为碳源的培养基进行培养的手法。

本发明的发明人们如后述实施例1所示,从在日本国内采集的堆肥的培养物中提取微生物菌落的基因组dna(宏基因组dna),进行宏基因组dna的鸟枪法测序及注释,得到了编码与已知纤维二糖水解酶类似的氨基酸序列(例如,具有20%以上序列一致性,且期望值(e-value)小于1e-20的氨基酸序列)的开放阅读框(orf)。根据得到的orf的碱基序列信息设计引物,利用pcr法,从堆肥培养物的基因组dna中克隆候补基因。将经pcr克隆的dna整合到大肠杆菌中,使所述碱基序列编码的蛋白质表达,通过磷酸溶胀微晶纤维素(phosphoricacidswollenavicel,以下有时简称为psa)分解活性测定进行功能筛选。最后,从这些orf中,得到具有psa分解活性的耐热性纤维二糖水解酶(以下,有时称为“wn12-a3-v6-4-10-11”或“基因克隆wn12-a3-v6-4-10-11”。)。分别将wn12-a3-v6-4-10-11的氨基酸序列表示为序列号1,将编码wn12-a3-v6-4-10-11的氨基酸序列的碱基序列表示为序列号2。

如后述实施例1所示,wn12-a3-v6-4-10-11对psa表现出高水解活性,对结晶性纤维素的微晶纤维素或由β-1,3键与β-1,4键葡聚糖形成的地衣聚糖(lichenan)也表现出些许的水解活性,但对羧甲基纤维素(以下,有时简称为cmc。)、昆布糖(laminarin)、木聚糖、对硝基苯基-β-d-吡喃葡萄糖苷(以下,有时简称为pnpg。)、对硝基苯基-β-d-纤维二糖糖苷(以下,有时简称为pnpc。)几乎不表现出水解活性。由于该底物特异性,暗示出wn12-a3-v6-4-10-11为具有纤维二糖水解酶活性的糖苷水解酶。

此外,在本申请说明书中,“纤维二糖水解酶活性”,是指促进包含具有β-糖苷键的化合物的材料进行水解的酶活性,例如,意为通过将包含psa的具有β-糖苷键的化合物作为底物,对所述底物进行水解而生成纤维二糖的活性。此外,作为“具有β-糖苷键的化合物”,例如可列举出具有β-糖苷键的葡聚糖或具有β-糖苷键的寡糖等。

此外,在本申请说明书中,“具有活性”是指对至少一种底物起作用,与阴性对照(negativecontrol)相比,在经水解的底物的还原末端量或显色反应中存在显著差异。

因此,“具有纤维二糖水解酶活性”是指至少对psa起作用,与阴性对照相比,在经水解的底物的还原末端量或显色反应中存在显著差异。

对公知的氨基酸序列数据库检索wn12-a3-v6-4-10-11的氨基酸序列时,序列一致性最高的氨基酸序列为属于类芽孢杆菌fslh7-689亚种(类芽胞杆菌sp.(paenibacillussp.)的gh48家族的纤维素1,4-β-纤维二糖苷酶(序列号7),gh48催化区域中的序列一致性(相似性)为77%。由底物特异性及与已知的纤维二糖水解酶的氨基酸序列的序列一致性可知,wn12-a3-v6-4-10-11为属于gh48家族的新型纤维二糖水解酶。

wn12-a3-v6-4-10-11至少在65℃、且ph为6的条件下,具有以psa为底物的水解活性(即纤维二糖水解酶活性)。

实际上,如后述实施例1所示,wn12-a3-v6-4-10-11在50~70℃的温度范围内、且在ph为5.5~8的ph范围内表现出纤维二糖水解酶活性。更详细而言,wn12-a3-v6-4-10-11的纤维二糖水解酶活性在50~65℃的范围内随着温度的升高而升高,在超过65℃时,有纤维二糖水解酶活性急剧降低的倾向。

此外,wn12-a3-v6-4-10-11在二价的金属离子的存在下,与无金属离子存在时相比,即使在更高温下,也表现出高的纤维二糖水解酶活性。实际上,如后述实施例1所示,wn12-a3-v6-4-10-11在钙离子的存在下,在55~75℃的温度范围内、且在ph5.5~8的较宽ph范围内表现出纤维二糖水解酶活性。

通常,具有某些生理活性的蛋白质能够在不损害其生理活性的前提下,进行至少一个氨基酸的缺失、取代或添加。即,对于wn12-a3-v6-4-10-11,也能够在不失去纤维二糖水解酶活性的前提下,进行至少一个氨基酸的缺失、取代或添加。

即,本发明的耐热性纤维二糖水解酶为具有由下列(a)~(c)中任一种构成的纤维二糖水解酶催化区域的耐热性纤维二糖水解酶。

(a)由序列号1所表示的氨基酸序列构成的多肽;

(b)由序列号1所表示的氨基酸序列中的至少一个的氨基酸的缺失、取代或添加而形成的氨基酸序列构成、且至少在65℃、且ph为6的条件下具有以psa为底物的水解活性的多肽;或

(c)由与序列号1所表示的氨基酸序列具有80%以上序列一致性的氨基酸序列构成、且至少在65℃、且ph为6的条件下具有以psa为底物的水解活性的多肽。

在所述(b)的多肽中,对于序列号1所表示的氨基酸序列,缺失、取代或添加的氨基酸数量优选为1~20个,更优选为1~10个,进一步优选为1~5个。

在本申请说明书中,“在多肽中氨基酸的缺失”是指构成多肽的氨基酸的一部分失去(被去除)。

在本申请说明书中,“在多肽中氨基酸的取代”是指构成多肽的氨基酸被其他的氨基酸替换。

在本申请说明书中,“在多肽中氨基酸的添加”是指多肽中插入了新的氨基酸。

在所述(c)的多肽中,与序列号1所表示的氨基酸序列的序列一致性,只要是80%以上且小于100%,则无特别限定,但优选为85%以上且小于100%,更优选为90%以上且小于100%,进一步优选为95%以上且小于100%,特别优选为98%以上且小于100%。

此外,以使所对应的氨基酸为最多一致的方式,对两个氨基酸序列,在相当于插入及缺失的部分加入空位(gap),同时使这两个氨基酸序列并列而得到比对,以一致的氨基酸相对于除去所得的比对中的空位的氨基酸序列整体的比例的方式,而求出氨基酸序列相互之间的序列一致性(相似性)。氨基酸序列相互之间的序列一致性,可使用上述技术领域中公知的各种相似性检索软件而求出。本发明中的氨基酸序列的序列一致性的值,通过以使用公知的相似性检索软件blastp而得到的比对为基础进行计算而得到。

作为所述(b)及(c)的多肽,可以是人工设计的多肽,也可以是wn12-a3-v6-4-10-11等的同源物(homologue)或其部分蛋白质。

所述(a)~(c)的多肽,可以分别基于氨基酸序列而进行化学合成,也可以通过使用有后述的本发明的多核苷酸的蛋白质表达系统而进行生产。此外,所述(b)及(c)的多肽可分别基于由序列号1所表示的氨基酸序列构成的多肽,使用导入氨基酸突变的基因重组技术而进行人工合成。

所述(a)~(c)的多肽至少在65℃、且ph为6的条件下具有以psa为底物的水解活性(纤维二糖水解酶活性)。因此,通过具有所述(a)~(c)中任一种的多肽作为纤维二糖水解酶催化区域,能得到耐热性纤维二糖水解酶。

本发明的耐热性纤维二糖水解酶以psa为底物。除了psa以外,所述耐热性纤维二糖水解酶还可进一步以除psa以外的其他β葡聚糖或寡糖作为底物。作为该其他β葡聚糖或寡糖,例如可列举出微晶纤维素(avicel)、结晶性细菌纤维素(细菌微晶纤维素(bacterialmicrocrystallinecellulose),以下,有时简称为bmcc)、滤纸等结晶性纤维素;cmc;由β-1,4键形成的葡聚糖;纤维二糖等由β-1,4键形成的寡糖;木聚糖;对硝基苯基-β-d-吡喃半乳糖苷(有时简称为pnpgal);对硝基苯基-β-d-吡喃木糖苷(有时简称为pnpx);地衣聚糖等由β-1,3键与β-1,4键形成的葡聚糖;昆布糖等由β-1,3键与β-1,6键形成的葡聚糖;由β-1,3键形成的葡聚糖;由β-1,6键形成的葡聚糖;龙胆二糖等由β-1,6键形成的寡糖等。作为本发明的耐热性纤维二糖水解酶,除了psa之外,进一步优选以微晶纤维素及地衣聚糖为底物的耐热性纤维二糖水解酶。

本发明的耐热性纤维二糖水解酶至少在ph6的条件下,优选在60~65℃的温度范围内、更优选在55~65℃的温度范围内、进一步优选在50~70℃的温度范围内表现出以psa为底物的水解活性(纤维二糖水解酶活性)。本发明的耐热性纤维二糖水解酶的最适温度优选在60~70℃的范围内。

此外,本发明的耐热性纤维二糖水解酶中的“耐热性”,是指例如在50~70℃的温度范围内具有纤维二糖水解酶活性。

本发明的耐热性纤维二糖水解酶的最适ph在ph为5.5~6.5的范围内。作为本发明的耐热性纤维二糖水解酶,优选为至少在ph为5.5~7.0的范围内表现出纤维二糖水解酶活性的耐热性纤维二糖水解酶。

作为一个方面,本发明的耐热性纤维二糖水解酶优选在二价的金属离子的存在下时,与无金属离子存在下时相比,即使在更高温下也表现出高的纤维二糖水解酶活性。

本发明的耐热性纤维二糖水解酶,在二价的金属离子的存在下,优选至少在70℃、且ph为6的条件下具有纤维二糖水解酶活性,更优选在65~75℃的温度范围内、且ph为5.5~7.0的ph范围内表现出纤维二糖水解酶活性,进一步优选在55~75℃的温度范围内、且ph为5.5~7.0的ph范围内表现出纤维二糖水解酶活性。

除了纤维二糖水解酶活性之外,本发明的耐热性纤维二糖水解酶还可以进一步具有除纤维二糖水解酶活性以外的纤维素水解活性。作为其他的纤维素水解活性,可列举出木聚糖酶活性、β-半乳糖苷酶活性、内切葡聚糖酶活性、木糖苷酶活性、或β-葡萄糖苷酶活性等。

本发明的耐热性纤维二糖水解酶可以是仅由纤维二糖水解酶催化区域构成的酶,所述纤维二糖水解酶催化区域由所述(a)~(c)的多肽中的任一种构成,除了纤维二糖水解酶催化区域以外,还可以进一步包含其他区域。作为该其他区域,可列举出公知的纤维二糖水解酶所具有的除酶催化区域以外的区域。例如,在本发明的耐热性纤维二糖水解酶中,对于公知的纤维二糖水解酶,也可含有通过将酶催化区域取代为所述(a)~(c)的多肽而得到的酶。

在本发明的耐热性纤维二糖水解酶包含除纤维二糖水解酶催化区域以外的区域时,也优选包含纤维素结合模块(以下,有时简称为cbm)。纤维素结合模块可以在纤维二糖水解酶催化区域的上游(n末端侧),也可以在下游(c末端侧)。此外,纤维素结合模块与纤维二糖水解酶催化区域可以直接结合,也可以经由适当长度的连接区域而结合。作为本发明的耐热性纤维二糖水解酶,优选在纤维二糖水解酶催化区域的上游或下游,纤维素结合模块经由连接区域而存在,更优选在纤维二糖水解酶催化区域的上游,纤维素结合模块经由连接区域而存在。

本发明的耐热性纤维二糖水解酶所含有的纤维素结合模块,只要是具有与纤维素的结合能的区域、例如具有与psa或结晶性微晶纤维素的结合能的区域,则其氨基酸序列没有特别限定。作为该纤维素结合模块,例如可使用已知的蛋白质所具有的纤维素结合模块或对其进行适当改变而成的纤维素结合模块。此外,在本发明的耐热性纤维二糖水解酶具有纤维二糖水解酶催化区域与纤维素结合模块时,优选该两者经由连接序列而结合。该连接序列的氨基酸序列或其长度没有特别限定。

除此之外,本发明的耐热性纤维二糖水解酶可在n末端或c末端上具有能够转移并定位于细胞内的特定区域的信号肽、或向细胞外分泌的信号肽。作为这样的信号肽,例如可列举出非原质体转运信号肽、内质网驻留信号肽、核转运信号肽、分泌型信号肽等。作为内质网驻留信号肽,例如可列举出由hdel的氨基酸序列构成的信号肽等。

此外,为了在使用表达系统进行生产时可简便地纯化,本发明的耐热性纤维二糖水解酶可例如在所述耐热性纤维二糖水解酶的n末端或c末端上添加各种标记。作为所述标记,可使用例如his标记、ha(血凝素(hemagglutinin))标记、myc标记、及flag标记等在重组蛋白质的表达、纯化中广泛使用的标记。

即,本发明的耐热性纤维二糖水解酶的一个方面包含:由所述(a)~(c)的多肽中的任一种构成的纤维二糖水解酶催化区域;以及根据所需所含的选自由添加位于所述纤维二糖水解酶催化区域的上游侧或下游侧的纤维素结合模块、连接区域、在所述耐热性纤维二糖水解酶的n末端或c末端添加的信号肽、及添加在所述耐热性纤维二糖水解酶的n末端或c末端的标记所组成的组中的至少一种。

[编码耐热性纤维二糖水解酶的多核苷酸]

本发明的多核苷酸编码本发明的耐热性纤维二糖水解酶。所述耐热性纤维二糖水解酶可通过将整合了所述多核苷酸的表达载体导入宿主,利用所述宿主的表达系统而进行生产。

具体而言,本发明的多核苷酸为具有由下述(a)~(e)中任一个碱基序列构成的编码纤维二糖水解酶催化区域的区域的多核苷酸。

(a)编码由序列号1所表示的氨基酸序列构成的多肽的碱基序列;

(b)编码由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在65℃、ph为6的条件下具有以psa为底物的水解活性的多肽的碱基序列;

(c)编码由与序列号1所表示的氨基酸序列具有80%以上序列一致性的氨基酸序列所构成、且至少在65℃、ph为6的条件下具有以psa为底物的水解活性的多肽的碱基序列;

(d)编码与序列号2所表示的氨基酸序列具有80%以上序列一致性的、且至少在65℃、ph6为的条件下具有以psa为底物的水解活性的多肽的碱基序列;或

(e)为在严格条件下与序列号2所表示的碱基序列构成的多核苷酸杂交的多核苷酸的碱基序列,且为编码至少在65℃、ph为6的条件下具有以psa为底物的水解活性的多肽的碱基序列。

此外,在本申请说明书中,“多核苷酸中碱基的缺失”是指构成多核苷酸的核苷酸的一部份失去(被去除)。

在本申请说明书中,“多核苷酸中碱基的取代”是指构成多核苷酸的碱基被其他的碱基替换。

在本申请说明书中,“多核苷酸中碱基的添加”是指在多核苷酸中插入新的碱基。

在本申请说明书中,“严格条件”例如可列举出《分子克隆-实验室手册第三版(molecularcloning-alaboratorymanualthirdedition)》(sambrook等,冷泉港实验室出版社(coldspringharborlaboratorypress))中所记载的方法。例如可列举,在由6×ssc(20×ssc的组成:3m的氯化钠、0.3m的柠檬酸溶液、ph为7.0)、5×邓哈特溶液(denhardt'ssolution)(100×邓哈特溶液的组成:2质量%的牛血清白蛋白、2质量%的ficoll(聚蔗糖)、2质量%的聚乙烯吡咯烷酮)、0.5质量%的sds、0.1mg/ml的鲑鱼精子dna、及50%的甲酰胺构成的杂交缓冲液中,在42~70℃下进行几小时至一夜的温育,从而使其杂交的条件。另外,作为在温育后清洗时所使用的清洗缓冲液,优选为含有0.1质量%sds的1×ssc溶液,更优选为含有0.1质量%sds的0.1×ssc溶液。

在所述(a)~(e)的碱基序列中,简并密码子优选选择宿主中使用频率高的密码子。例如,作为所述(a)的碱基序列,可以是序列号2所表示的碱基序列,也可以是在不改变所编码的氨基酸序列的前提下,将序列号2所表示的碱基序列变更为在宿主中使用频率高的密码子的碱基序列。密码子的改变可通过公知的基因序列突变技术或人工基因合成来进行。

由序列号2所表示的碱基序列构成的多核苷酸,可以根据碱基序列信息进行化学合成,也可以是通过基因重组技术从自然界中取得的编码wn12-a3-v6-4-10-11的基因(以下,有时称为“wn12-a3-v6-4-10-11基因”。)的全长或含有纤维二糖水解酶催化区域的部分区域。wn12-a3-v6-4-10-11基因的全长或其部分区域例如可通过以下方式获得:从自然界中取得含有微生物的样本,将从所述样本中回收的基因组dna作为模版,基于序列号2所表示的碱基序列,使用通过常规方法而设计的正向引物与反向引物,进行pcr。也可将以从所述样本中回收的mrna作为模版通过逆转录反应合成的cdna作为模版。

在所述(d)的碱基序列中,与序列号2所表示的氨基酸序列的序列一致性,只要是80%以上且小于100%,则无特别限定,但优选为85%以上且小于100%,更优选为90%以上且小于100%,进一步优选为95%以上且小于100%,特别优选为98%以上且小于100%。

此外,以使所对应的氨基酸为最多一致的方式,对两个氨基酸序列,在相当于插入及缺失的部分加入空位,同时使这两个氨基酸序列并列而得到比对,以一致的氨基酸相对于除去所得的比对中的空位的氨基酸序列整体的比例的方式,而求出氨基酸序列相互之间的序列一致性(相似性)。氨基酸序列相互之间的序列一致性,可使用上述技术领域中公知的各种相似性检索软件而求出。本发明中的氨基酸序列的序列一致性的值,通过以使用公知的相似性检索软件blastn而得到的比对为基础进行计算而得到。

例如,对于由所述(b)、(c)、或(d)的碱基序列构成的多核苷酸,可分别通过对于由序列号2所表示的碱基序列构成的多核苷酸,进行1个或2个以上的碱基的缺失、取代或添加而人工合成。

此外,作为所述(b)、(c)、或(d)的碱基序列,可以是wn12-a3-v6-4-10-11基因的同源基因的全长序列或其部分序列。wn12-a3-v6-4-10-11基因的同源基因可通过在碱基序列取得已知的基因的同源基因时所使用的基因重组技术而取得。

本发明的多核苷酸可以仅具有编码纤维二糖水解酶催化区域的区域,也可以除了具有所述区域外,还具有编码纤维素结合模块、连接序列、各种信号肽、各种标记等的区域。

即,本发明的多核苷酸的一个方面包含:由所述(a)~(e)中任一个碱基序列构成的编码纤维二糖水解酶催化区域的区域;以及根据需要所含的编码选自由纤维素结合模块、连接序列、信号肽、及标记组成的组中的至少一个的区域。

[表达载体]

本发明的表达载体整合有上述本发明的多核苷酸,在宿主细胞中,至少在65℃、且ph为6的条件下,能够表达具有纤维二糖水解酶活性的多肽。即,本发明的表达载体为以能够表达上述本发明的耐热性纤维二糖水解酶的状态而整合上述本发明的多核苷酸的表达载体。更具体而言,需要将从上游开始由具有启动子序列的dna、上述本发明的多核苷酸、具有终止序列的dna构成的表达盒整合入表达载体。此外,向多核苷酸的表达载体的整合,可通过使用众所周知的基因重组技术进行,也可使用市场上销售的制作表达载体制作试剂盒。

在本申请说明书中,“表达载体”是指从上游开始包含具有启动子序列的dna、具有用于整合外来dna的序列的dna、及具有终止序列的dna的载体。

作为所述表达载体,可以是向大肠杆菌等原核细胞导入的表达载体,也可以是向酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、植物细胞等真核细胞导入的表达载体。作为这些表达载体,可根据各自的宿主,使用通常所用的任意的表达载体。

本发明的表达载体优选不仅整合了上述本发明的多核苷酸,还整合了耐药性基因等。这是由于能够通过表达载体容易地筛选进行了转化的细胞与未转化细胞。

作为所述耐药性基因,例如可列举出卡那霉素抗性基因、潮霉素抗性基因、双丙氨磷抗性基因等。

[转化体]

本发明的转化体导入有本发明的表达载体。在所述转化体中,能够使本发明的耐热性纤维二糖水解酶表达。以往公知的纤维二糖水解酶的现有宿主的范围窄,即,大多难以异种表达。对此,本发明的耐热性纤维二糖水解酶能够在大肠杆菌、酵母、丝状真菌、高等植物叶绿体等广泛的表达宿主中表达。因此,作为导入表达载体的宿主,可以是大肠杆菌等原核细胞,也可以是酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、或植物细胞等真核细胞。即,作为本发明的转化体,为导入有本发明的表达载体的大肠杆菌、酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、植物细胞等。通过培养大肠杆菌的转化体,可更简便且大量地生产本发明的耐热性纤维二糖水解酶。另一方面,在真核细胞内,由于对蛋白质实施糖链修饰,因此,通过使用真核细胞的转化体,与使用原核细胞的转化体时相比,能够生产耐热性更优异的耐热性纤维二糖水解酶。

使用表达载体制作转化体的方法,没有特别限定,可通过在制作转化体时通常使用的方法来进行。作为所述方法,例如可列举,农杆菌介导法、基因枪法、电穿孔法、及peg(聚乙二醇)法等。其中,在宿主为植物细胞时,优选使用基因枪法或农杆菌介导法来进行。

在使用原核细胞、酵母、丝状真菌、昆虫培养细胞、或哺乳动物培养细胞等作为宿主时,得到的转化体通常可与转化前的宿主同样地,使用常规方法进行培养。

[耐热性纤维二糖水解酶的制备方法]

本发明的耐热性纤维二糖水解酶的制备方法为在上述本发明的转化体内生产耐热性纤维二糖水解酶的方法。对于使用将上述本发明的多核苷酸整合到不具有控制表达时期等的能力的启动子下游的表达载体而制备的转化体,通过培养该转化体,能够在上述转化体内恒常性地表达本发明的耐热性纤维二糖水解酶。另一方面,对于使用通过特定的化合物或温度条件等诱导表达的、所谓的表达诱导型启动子而制备的转化体,通过培养该转化体,且进行适于各个表达诱导条件的诱导处理,能够在所述转化体内表达本发明的耐热性纤维二糖水解酶。

由转化体生产的耐热性纤维二糖水解酶,能够在留存于所述转化体内的状态下使用,也可以从所述转化体中提取、纯化。

从转化体提取或纯化耐热性纤维二糖水解酶的方法,只要是不损害耐热性纤维二糖水解酶的活性的方法,则没有特别的限定,可通过在从细胞或生物体组织中提取多肽时通常使用的方法进行提取。作为所述方法,例如可列举出例如将转化体浸渍在适当的提取缓冲液中,提取耐热性纤维二糖水解酶后,将提取液与固体残渣分离的方法。作为所述提取缓冲液,优选为含有表面活性剂等增溶剂的提取缓冲液。在转化体为植物时,也可在浸渍在提取缓冲液中之前,预先将所述转化体切碎或粉碎。此外,作为分离提取液与固体残渣的方法,例如可使用过滤方法、压缩过滤方法、或离心分离处理方法等公知的固液分离处理,也可对浸渍在提取缓冲液中的状态下的转化体进行挤压。提取液中的耐热性纤维二糖水解酶可使用盐析法、超滤法、或层析法等公知的纯化方法进行纯化。

在转化体内具有分泌型信号肽的状态下使本发明的耐热性纤维二糖水解酶表达时,在培养所述转化体后,通过回收从得到的培养物中除去了转化体的培养液上清液,能够简便地得到含有耐热性纤维二糖水解酶的溶液。此外,在本发明的耐热性纤维二糖水解酶具有his标记等标记时,通过利用了所述标记的亲和色谱法,能够简便地对提取液或培养上清液中的耐热性纤维二糖水解酶进行纯化。

即,本发明的制备耐热性纤维二糖水解酶的方法包括:在上述本发明的转化体内生产耐热性纤维二糖水解酶;及根据所需从所述转化体中提取、纯化所述耐热性纤维二糖水解酶。

[糖苷水解酶混合物]

本发明的糖苷水解酶混合物含有:上述本发明的耐热性纤维二糖水解酶、或通过上述本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶、与至少一种的其他糖苷水解酶。通过上述本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶,可以为包含在转化体内的状态的耐热性纤维二糖水解酶,也可以是由转化体中提取或纯化的耐热性纤维二糖水解酶。通过将本发明的耐热性纤维二糖水解酶作为与其他糖苷水解酶的混合物,用于纤维素的分解反应,可有效地分解含有纤维素的材料,例如由含有难分解性的纤维素、半纤维素及木质素的木质纤维素构成的材料。

作为所述糖苷水解酶混合物中含有的除所述耐热性纤维二糖水解酶以外的其他糖苷水解酶,只要具有纤维素的水解活性,则没有特别限定。作为所述糖苷水解酶混合物中含有的除所述耐热性纤维二糖水解酶以外的其他糖苷水解酶,例如可列举出木聚糖酶、或β-木糖苷酶等半纤维素酶、纤维二糖水解酶、β-葡萄糖苷酶、或内切葡聚糖酶等。作为本发明的糖苷水解酶混合物,优选为除了含有所述耐热性纤维二糖水解酶以外,还含有半纤维素酶与内切葡聚糖酶中的至少一种的糖苷水解酶的混合物,更优选为除了含有所述耐热性纤维二糖水解酶以外,还进一步含有半纤维素酶与内切葡聚糖酶这两者的糖苷水解酶的混合物。

其中,优选为除了含有所述耐热性纤维二糖水解酶以外,还含有选自由木聚糖酶、β-木糖苷酶、除所述耐热性纤维二糖水解酶以外的纤维二糖水解酶、及内切葡聚糖酶组成的组中的至少一种糖苷水解酶的混合物,更优选为除了含有上述耐热性纤维二糖水解酶以外,还进一步含有木聚糖酶、β-木糖苷酶、除所述耐热性纤维二糖水解酶以外的纤维二糖水解酶、及内切葡聚糖酶的全部糖苷水解酶的混合物。

作为所述糖苷水解酶混合物,特别优选至少含有所述耐热性纤维二糖水解酶与gh6家族的纤维二糖水解酶这两者。

这是由于,通过同时使用所述热性纤维二糖水解酶与gh6家族的纤维二糖水解酶,与各自单独使用时相比,能得到更高的纤维二糖水解酶活性。

所述糖苷水解酶混合物中所含有的其他糖苷水解酶,优选为至少在65℃下具有糖苷水解活性的耐热性糖苷水解酶,更优选为在65~80℃下具有糖苷水解活性的耐热性糖苷水解酶。通过使所述糖苷水解酶混合物中所含有的所有酶为耐热性(例如,酶活性的最适温度或酶蛋白的热变性温度为65℃以上),能够在高温条件下高效地进行利用所述糖苷水解酶混合物进行的纤维素的分解反应。即,在所述糖苷水解酶混合物只含有耐热性糖苷水解酶时,通过将所述糖苷水解酶混合物用于含有纤维素的材料、例如由含有纤维素的木质纤维素构成的材料的糖化处理,则能够在糖化温度为65~80℃的高温环境下进行所述材料的水解反应(高温糖化:高温水解(hightemperaturehydrolysis))。通过该高温糖化,能够显著减少酶量与糖化时间,大幅度降低糖化成本(水解成本(hydrolysiscost))。

[纤维素分解产物的制备方法]

本发明的制备纤维素分解产物的方法,是包括通过本发明的耐热性纤维二糖水解酶将使纤维素水解而生成的寡糖水解为单糖的、得到纤维素分解产物(例如,含有葡萄糖等单糖的分解产物)的方法。制备纤维素分解产物的方法,具体而言,为通过使含纤维素的材料与本发明的耐热性纤维二糖水解酶、本发明的转化体、利用本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶、或本发明的糖苷水解酶混合物接触,生产例如含有所述纤维素的材料的分解产物的方法,所述纤维素包含纤维素的分解产物。

作为含有所述纤维素的材料,只要含有纤维素,则没有特别限定。作为所述材料,例如可列举,杂草或农业类废弃物等纤维素类生物质、或废纸等。所述材料,优选在与本发明的耐热性纤维二糖水解酶接触前,预先进行破碎或切碎等物理处理、利用酸或碱等的化学处理、或者浸渍或溶解于适当的缓冲液中的处理等。

即,本发明的制备纤维素分解产物的方法还可进一步包含:在使含有所述纤维素的材料与本发明的耐热性纤维二糖水解酶接触前,进行物理处理、化学处理、或者浸渍或溶解于缓冲液中的处理。

利用本发明的耐热性纤维二糖水解酶进行的纤维素的水解反应的反应条件,只要是使所述耐热性纤维二糖水解酶表现出纤维二糖水解酶活性的条件即可。例如在无二价金属离子的存在下,优选在55~65℃、且ph为5.5~7.0下进行反应,更优选在60~65℃、且ph为5.5~7.0下进行反应。此外,在二价金属离子的存在下,优选在55~75℃、且ph为5.5~7.0下进行反应,更优选在65~75℃、且ph为5.5~7.0下进行反应。对于所述水解反应的反应时间,可考虑供于水解的所述材料的种类、前处理方法、或用量等进行适当的调整。例如,在以10分钟~100小时对含有纤维素类生物质的材料进行分解时,可以1~100小时的反应时间进行所述水解反应。

在含有所述纤维素的材料的水解反应中,优选除了使用本发明的耐热性纤维二糖水解酶以外,进一步还使用至少一种其他糖苷水解酶。作为所述其他糖苷水解酶,可使用与所述糖苷水解酶混合物中含有的糖苷水解酶相同的糖苷水解酶,优选为至少在65℃、优选至少在65~80℃下具有糖苷水解活性的耐热性糖苷水解酶。此外,所述纤维素分解产物的制备方法一个方面为,使用本发明的耐热性纤维二糖水解酶、本发明的转化体、或通过本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶,另一个方面为使用所述糖苷水解酶。

实施例

以下示出实施例,对本发明进行更详细说明,但本发明并不受以下的实施例所限。

[实施例1]来自堆肥培养样本的新型耐热性纤维二糖水解酶的克隆

<1>来自堆肥培养样本的dna提取及全基因组序列(wholegenomesequence,wgs)

以耐热性纤维二糖水解酶(最适温度:55℃以上)的基因探索为目的,进行构成堆肥培养样本的微生物菌群基因组dna的碱基序列解码。

堆肥培养样本wn12-a3按照以下方式制备。首先,采集堆肥。采集时堆肥的温度为25~72℃。然后在表1中所记载的20ml的改良ags(精氨酸葡萄糖斜面琼脂)液体培养基中,添加约0.5g的所采集的堆肥、作为碳源的1.5cm见方的厚纸2张(约250mg、凝胶印迹滤纸(gel-blottingpaper)gb005,whatman社制造)及一片1.2cm×1.5cm的再生纤维素制透析管(spectrarc透析管pore7,spectrumlaboratories社制造),使用125ml体积的带有挡板的三角烧瓶,以65℃、120rpm进行旋转振荡培养。

培养一周后,在确认到该三角烧瓶内的碳源的消失及菌的增殖后,使0.5ml的培养液在20ml的新的改良ags液体培养基中继代培养,以与上述相同的方式添加碳源进行培养。重复三次继代培养后,通过离心分离处理(5,000rpm、10分钟、4℃)回收菌体。

[表1]

使用dna提取试剂盒(isoilforbeadsbeating,nippongene社制造),从所回收的菌体中提取dna。对所提取的dna中的1μg,使用rochediagnosticsk.k.制造的gsflx+454,进行基因组dna的鸟枪法测序。

对堆肥培养样本wn12-a3(以下,有时称为“wn12-a3宏基因组”)进行基因组dna的序列解码,得到平均解码长度(averagelengthofread)为363bp、总解码数为3,257,291个、总基因组解码量为1.187gbp的全基因组序列(wgs)数据集。

<2>堆肥培养样本的基因组数据的拼接与统计量

使用pyrobayes(quinlan等,《自然方法(naturemethods)》,2008年,第5卷,第179-81页)对罗氏(roche)454的输出(sff文件)进行再一次的碱基识别(base-calling),取得fasta形式的序列文件及品质(quality)值文件。切除所得到的序列解码的端,提高其品质,使用454生命技术公司(lifesciences)的拼接软件newbler2.7版进行拼接。拼接设定为“最低的可接受重叠匹配(mi)=0.9”,“选项:-大(对于大型或复杂的基因组,加快拼接,但降低精度。)”而进行。

拼接为100bp以上的总重叠群(contig)长度合计为32,352,781bp,将该数据集用于纤维素酶基因分析。解码总数3,257,291个解码中的2,830,164个解码,被拼接为20,621的重叠群。该重叠群的平均长度为1,481bp,最大重叠群长度为66,836bp。

<3>纤维二糖水解酶的开放阅读框(orf)预测

从uniprot数据库(http://www.uniprot.org/)上下载ec号为3.2.1.4(纤维素酶)、3.2.1.21(β-葡萄糖苷酶)、3.2.1.37(β-木糖苷酶)、3.2.1.91(纤维素1,4-β-纤维二糖苷酶)、3.2.1.8(内切1,4-β-木聚糖酶)的序列(访问日:2011/12/9),构建这些糖苷水解酶基因的蛋白质组本地数据库。使用注释软件metegeneanotator(noguchi等,宏基因注释(metageneannotator):用于未命名原核基因组和噬菌体基因组中的精确的基因预测的、对核糖体结合位点的物种特异性模式的检测(detectingspecies-specificpatternsofribosomalbindingsiteforprecisegenepredictioninanonymousprokaryoticandphagegenomes),《dna研究(dnares)》,2008,15,387-396),由在所述<2>中得到的重叠群序列推测基因区域(=开放阅读框)。为了从所推测的orf中提取糖苷水解酶基因,使用blastp(blastallver.2.2.18),参照了上述本地数据库。blastp的选项条件为:设置“过滤查询序列=假”,“期待值(e)<1e-20”[以下为默认值:空位开放罚分=-1,空位扩展罚分=-1,空位比对的x下降值=0,阈值拓展命中=0,字段长度=默认(costtoopenagap=-1,costtoextendedgap=-1,xdropoffvalueforgappedalignment=0,thresholdforextendinghits=0,wordsize=default)],以命中的序列作为糖苷水解酶基因进行收集。

<4>基因的糖苷水解酶(gh)家族分类

对于含有在所述<3>中收集的纤维素酶、内切半纤维素酶、脱支酶等糖苷水解酶的序列,以蛋白质的功能区域序列数据库pfamhmms(pfam23.0版和hmmerv2.3;finn等,《核酸研究数据库(nucleicacidsresearchdatabase)》2010年,第38卷,第d211-222页)为标准,进行功能分类。具体而言,使用蛋白质基序检索程序hmmer(durbin等,“概形hmm理论。生物序列分析:蛋白质和核酸的概率模型(thetheorybehindprofilehmms.biologicalsequenceanalysis:probabilisticmodelsofproteinsandnucleicacids)”,1998年,剑桥大学出版社;hmmpfam(2.3.2版)中,e值截止值<1e-5;数据库=pfam_fs(e-valuecutoff<1e-5;database=pfam_fs)(可用于查找所表示的结构域在序列中的片段的模型(modelsthatcanbeusedtofindfragmentsoftherepresenteddomainsinasequence.)),从与pfam结构域数据库的相似性确定糖苷水解酶(gh)家族。

通过根据使用了堆肥培养样本wn12-a3的序列数据的blastp的相似性检索及pfamhmms,10个orf(全长orf6个,非全长orf4个)预测为纤维二糖水解酶基因。gh家族分类如表2所示。如表2所示,从堆肥培养样本wn12-a3的基因组数据中得到:属于gh16家族及gh18家族的纤维二糖水解酶的全长orf各1个,属于gh26家族及gh53家族的全长orf各2个。对于所有orf,设计引物,由来自堆肥培养样本的dna通过pcr来克隆基因。其结果,从带有属于gh48家族的纤维二糖水解酶序列的开放阅读框wn12-a3-v6-4中分离纤维二糖水解酶基因wn12-a3-v6-4-10-11。

[表2]

<5>开放阅读框wn12-a3-v6-4

开放阅读框wn12-a3-v6-4编码由784个氨基酸残基构成的多肽(序列号1),所述多肽为虽第1位氨基酸残基从蛋氨酸(m)开始、但3’末端不以终止密码子终止的非全长序列(序列号2)。从基序的序列相似性推测出:在开放阅读框wn12-a3-v6-4所编码的多肽中,从第1位的蛋氨酸到第40位的丙氨酸(a)的40个氨基酸残基为分泌信号(signalp4.1),从第47位的精氨酸(r)到第741位的亮氨酸(l)的695个氨基酸残基编码糖苷水解酶第48家族的催化区域。该orf与细菌厚壁菌门类芽孢杆菌fslh7-689亚种的纤维素1,4-β-纤维二糖苷酶(genbank登记号:ett50502.1)(序列号7)在gh48催化区域中表现出77%的氨基酸序列一致性,为新的序列。序列一致性通过clustalw算法计算。

图1表示推测为开放阅读框wn12-a3-v6-4所编码的多肽的氨基酸序列(序列号1)与类芽孢杆菌fslh7-689亚种的纤维素1,4-β-纤维二糖苷酶的氨基酸序列(序列号7)的比对。在图1中,黑白对比的氨基酸表示这些全氨基酸序列中的相同氨基酸残基(一致序列),“-”表示缺失(空位)。

<6>纤维二糖水解酶基因wn12-a3-v6-4-10-11

通过pcr克隆,从作为纤维二糖水解酶基因的开放阅读框而被预测的开放阅读框wn12-a3-v6-4(序列号1)中分离纤维二糖水解酶基因wn12-a3-v6-4-10-11。wn12-a3-v6-4-10-11基因含有由与开放阅读框wn12-a3-v6-4完全相同的2,352bp构成的碱基序列。

<7>纤维二糖水解酶酶蛋白的表达及纯化

使用由序列号5所表示的碱基序列构成的正向引物(5’-gtgatgatgcagggaatcgttcga-3’:在序列号3所表示的碱基序列的5’末端侧添加3个碱基(gtg),将5’末端磷酸化而成的引物)与由序列号6所表示的碱基序列构成的反向引物(5’-atgcaaagcttttaggtggcgcgcttcaccgtg-3’:在序列号4所表示的碱基序列的5’末端侧添加终止密码子及限制酶hindiii识别序列而成。hindiii为对载体的插入中所使用的序列),将通过pcr克隆分离的wn12-a3-v6-4-10-11基因作为模版,将使用kod-plus-neo(toyobo社制造)扩增的pcr产物插入到plead5载体(nippongeneco.,ltd.制造)中,转化到大肠杆菌jm109株中。此外,序列号3所表示的碱基序列为与由序列号2所表示的碱基序列的第1~21位的碱基构成的部分序列相同的(一致的)碱基序列。此外,序列号4所表示的碱基序列为与由序列号2所表示的碱基序列的第2,334~2,352位的碱基构成的部分序列互补的碱基序列。通过菌落pcr选出阳性克隆,使用含有50mg/l的氨苄青霉素的lb液体培养基,以37℃、200rpm培养17~20小时后,使用小量提取试剂盒(wizardplussvminiprepsdna纯化系统,promega社制造)进行质粒的制备。

使用测序仪(lifetechnologiescorporation的3730dna分析仪),对制备的质粒进行序列确认。

将带有经过序列确认的wn12-a3-v6-4-10-11/plead5质粒的转化大肠杆菌克隆接种到含有50mg/l的氨苄青霉素的turbobroth培养基(athenaenvironmentalsciences,inc制造)中,通过培养约20小时,使目标蛋白质表达。培养后,进行离心分离处理,回收大肠杆菌,加入培养液的1/10体积的50mmtris-hcl缓冲液(ph为8.0)进行悬浊。然后,使用超声波破碎装置astrason3000(misonix社制造),循环重复7~8次破碎5分钟-停止5分钟的步骤,得到含有目标蛋白质的基因重组大肠杆菌的粗提取物。使用过滤器(孔径millipore社制造)过滤所述基因重组大肠杆菌的粗提取物,将得到的滤液作为基因重组大肠杆菌破碎上清液。

将所述基因重组大肠杆菌破碎上清液填充(load)到用50mmtris-hcl缓冲液(ph为8.0)进行平衡的离子交换柱hitrapqhp(gehealthcare社制造)中,使用中高压液相色谱系统aktadesign(gehealthcare社制造),利用含有1m的nacl的50mmtris-hcl缓冲液(ph为8.0)以0~50%的浓度梯度对蛋白质进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,通过离心式超滤膜vivaspin20(sartoriusstedim社制造)与含有750mm的硫酸铵的50mmtris-hcl缓冲液(ph为8.0)进行溶液交换。将溶液交换后的纤维二糖水解酶活性级分填充到以相同液体进行平衡的疏水性相互作用分离柱hitrapphnenylhp(gehealthcare社制造)中,通过50mmtris-hcl缓冲液(ph为8.0)以0~100%的浓度梯度对蛋白质进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,使用vivaspin20进行浓缩,直至液量为8ml左右为止。将浓缩了的样本,添加到以含有150mm的nacl的50mmtris-hcl缓冲液(ph为8.0)进行平衡的凝胶过滤柱hiload26/60superdex200pg(gehealthcare社制造)中,以流速为2~3ml/分钟使柱体积的1~1.5倍体积的相同缓冲液流过,由此进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,通过vivaspin20进行与50mmtris-hcl缓冲液(ph为8.0)的溶液交换和浓缩,使用hitrapqhp,以与上述相同的方式对蛋白质进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,进行与50mmtris-hcl缓冲液(ph为8.0)的溶液交换与浓缩,得到最终浓度为约1mg/ml的纯化酶。

通过sds-page分析(sds聚丙烯酰胺凝胶电泳(sds-polyacrylamidegelelectrophoresis))确认基因重组大肠杆菌破碎上清液与纯化酶(纯化的纤维二糖水解酶酶蛋白)。基因重组大肠杆菌破碎上清液与纯化酶的sds电泳使用mini-proteantgxstain-freegel(bio-rad社制造)进行。将所述上清液或纯化酶分别与tris-sdsβ-me处理液(cosmobioco.,ltd.制造)以1:1混合而成的电泳用样本,在100℃下处理10分钟后,对于每个样本,分别使10μl的基因重组大肠杆菌破碎上清液、0.5μg的纯化酶进行电泳。电泳完成后,通过cbb染色来检测蛋白质的条带。

在图2中,表示由导入有wn12-a3-v6-4-10-11基因的转化大肠杆菌制备的基因重组大肠杆菌破碎上清液和由所述基因重组大肠杆菌破碎上清液纯化而成的纯化酶的sds-page分析结果。泳道1为蛋白质质量标准的电泳图案,泳道2为基因重组大肠杆菌破碎上清液的电泳图案,泳道3为纯化酶的电泳图案。

其结果,在所述基因重组大肠杆菌破碎上清液(泳道2)中,在由氨基酸序列(序列号1)所预测的质量为86.9kda附近确认到强条带;在纯化酶(泳道3)中,确认到对应于所述条带的单一条带(图中的箭头)。

<8>以psa为底物的纤维二糖水解酶活性

调查以wn12-a3-v6-4-10-11基因所编码的酶蛋白(wn12-a3-v6-4-10-11)的psa为底物的纤维二糖水解酶活性。在测算中,使用0.05m的tris-hcl缓冲液(ph为8.0)将所述<7>中得到的纯化酶稀释为1mg/ml而使用。

用作底物的psa通过以下方式制备:暂且使用磷酸溶液将微晶纤维素粉末(微结晶性纤维素粉末,merck社制造)溶解,然后加入灭菌蒸馏水(纯化水(purifiedwater))使其析出,然后进行清洗使ph为5以上。此外,在以后的试验中使用的psa全部按照该方法制备。

反应容器使用1.5ml体积的样本管,反应液的组成设为10μl的经稀释的纯化酶、40μl的纯化水、50μl的200mm乙酸缓冲液(ph为6)、100μl的1质量%psa溶液。在所有的测算中,将加入50mmtris-hcl缓冲液(ph为8.0)来代替纯化酶溶液、并在相同条件使其反应而成的混合液作为对照区。此外,纯化酶溶液、纯化水、及缓冲液的混合液与底物溶液,在反应温度下,分别各自保温5分钟(预培养)后进行混合,开始反应。反应中,所有的混合液均使用恒温混匀仪(eppendorf社制造)设定为规定的温度。在20分钟的反应完成后,对各反应液加入等量的3,5-二硝基水杨酸试剂(dns溶液),在100℃下进行5分钟加热处理,在5分钟的冰冷却后,以17,500g、5分钟在室温下进行离心分离处理,得到上清液。使用分光光度计,测量上清液中的还原糖量在540nm处的吸光度,使用以葡萄糖制作的校准曲线进行计算,由与对照区的差,求出通过酶的水解而生成的还原糖量。将在1分钟生成1μmol的还原糖(reducedsugar)的酶活性设为1u,将其除以蛋白质量的值设为比活性(u/mg)。各测算通过三次独立的试验进行,求出平均值与标准误差(standarderrors)。

<9>wn12-a3-v6-4-10-11的底物特异性

对于酶蛋白wn12-a3-v6-4-10-11,调查对各种纤维素底物及半纤维素底物的水解活性。测算中使用0.05m的tris-hcl缓冲液(ph8.0)将在上述<7>中得到的纯化酶稀释为1mg/ml而使用。此外,作为底物,使用psa、微晶纤维素粉末、cmc(sigma社制造)、木聚糖(来自布纳材料,sigma社制造)、地衣聚糖(mpbiomedicals社制造)、昆布糖(来自laminariadigitata,sigma社制造)、pnpc(sigma社制造)、pnpg(sigma社制造)。

具体而言,在以psa、微晶纤维素粉末、cmc、木聚糖、地衣聚糖、或昆布糖为底物时,除了使用1质量%的各水溶液作为底物溶液在65℃下进行反应以外,以与上述<8>相同的方式,求出通过酶的水解而生成的还原糖量,计算比活性(u/mg),此外,在木聚糖的测定中,使用以木糖制作的校准曲线。

在以pnpc或pnpg作为底物时,除了使用10mm的各水溶液作为底物溶液在65℃下进行反应以外,以与上述<8>相同的方式,反应20分钟,加入等量的200mm碳酸钠水溶液,进行5分钟离心分离处理,得到上清液。使用分光光度计测算上清液中的对硝基苯酚量在420nm处的吸光度,使用用对硝基苯酚制作的校准曲线进行计算,由与对照区的差,求出通过酶的水解而生成的对硝基苯酚量。将在1分钟生成1μmol的对硝基苯酚的酶活性设为1u,将其除以蛋白质量的值设为比活性(u/mg)。

测定结果如图3所示,其结果,wn12-a3-v6-4-10-11对psa表现出水解活性,对微晶纤维素及地衣聚糖也表现出弱水解活性,但对cmc、昆布糖、木聚糖、pnpg、pnpc几乎未表现出水解活性。

<10>wn12-a3-v6-4-10-11的纤维二糖水解酶活性的温度及ph依赖性

调查wn12-a3-v6-4-10-11的psa水解活性的温度依赖性。

具体而言,除了将反应温度设为50、55、60、65、70、75、80、或85℃以外,以与上述<8>相同的方式进行,求出通过酶的水解而生成的还原糖量,计算psa水解活性(u/mg)。

此外,代替40μl的纯化水,而利用加入10mmcacl2水溶液而成的反应液,也进行相同测定,求出通过酶的水解而生成的还原糖量,计算psa水解活性(u/mg)。

结果如图4所示。wn12-a3-v6-4-10-11在无钙离子存在下(图中,为“ph为6下的psa活性”),在温度范围为50~70℃中表现出psa水解活性。此外,在钙离子的存在下(图中,为“+2mmca2+”),在55~75℃下表现出psa水解活性。表现出最高活性的最适温度(topt)在无钙离子存在下为65℃,在此以上的温度下则活性急剧降低。另一方面,在钙离子的存在下,最适温度为65℃,但至75℃未发现活性大幅降低。75℃下的活性维持在最适温度下的活性的87%。

调查wn12-a3-v6-4-10-11的psa水解活性的ph依赖性。

具体而言,除了使用50μl的200mm麦基尔文(mcilvaine)缓冲液(ph为4~8),在60℃下反应以外,以与上述<8>相同的方式进行,求出通过酶的水解而生成的还原糖量,计算psa水解活性(u/mg)。

结果如图5所示。对于ph,对底物与缓冲液与酶的混合液的实测值进行绘图。wn12-a3-v6-4-10-11在ph为5~7的范围内表现出psa水解活性。最适ph为6.18(底物、缓冲液与酶的混合液的实测值)。

<11>gh6纤维二糖水解酶与wn12-a3-v6-4-10-11混合时的纤维二糖水解酶活性

调查wn12-a3-v6-4-10-11与gh6纤维二糖水解酶的混合的纤维素水解活性。使用ar19g-166-ra(序列号8)作为gh6纤维二糖水解酶,总酶量不变,使其与wn12-a3-v6-4-10-11的混合比(质量比)由10:0变化至0:10,测定psa水解活性及微晶纤维素水解活性。具体而言,将由10μl的纯化酶的混合液、40μl的10mmcacl2溶液、50μl的200mm乙酸缓冲液(ph6)、100μl的1质量%psa或微晶纤维素水溶液构成反应液,对于psa则使该反应液在70℃下反应20分钟,对于微晶纤维素则使该反应液在70℃下反应2小时。反应后,以与上述<8>相同的方式,求出通过酶的水解而生成的还原糖量,计算比活性(u/mg)。酶活性表示为:将ar19g-166-ra与wn12-a3-v6-4-10-11的混合比为10:0(wn12-a3-v6-4-10-11的含有比例为0%)的活性设为100%时的相对值(相对活性(relativeactivity),%)。

结果如图6所示。横轴为相对于总酶量的wn12-a3-v6-4-10-11的比例(含有比例(%))。图中,将假设无由同时使用ar19g-166-ra与wn12-a3-v6-4-10-11带来的协同效应时的理论值以虚线示出。在所有的混合比下,psa水解活性与微晶纤维素水解活性同时超过了理论值,由此,确认有ar19g-166-ra与wn12-a3-v6-4-10-11的协同效应。对于psa水解活性,wn12-a3-v6-4-10-11的比例在20%~60%的范围内,对于微晶纤维素水解活性,wn12-a3-v6-4-10-11的比例在20%~40%的范围内,与单独使用ar19g-166-ra时相比,确认到分解活性上升。对于最大值,psa水解活性与微晶纤维素水解活性均为wn12-a3-v6-4-10-11的比例在20%~40%时,分解活性的上升率分别为约40%与约50%。由此,通过与gh6家族的纤维二糖水解酶的协同效应,与各自单独使用时的分解活性相比,wn12-a3-v6-4-10-11表现出最大约50%的纤维二糖水解酶活性的上升,因此,适于纤维素的糖化处理的高效化。

<12>利用差示扫描荧光测定法(differentialscanningfluorimetry)进行的纤维二糖水解酶的热稳定性测定

差示扫描荧光测定法(dsf)是使用荧光色素与实时pcr装置来测算蛋白质的热变性的方法之一,可应用于各种蛋白质。宝石橙蛋白染色试剂等用于dsf的荧光色素,在与疏水性部位结合的非极性条件下散发荧光,另一方面,在溶于水的极性条件下抑制发光。通常,蛋白质在其热变性温度中折叠结构发生解聚,位于内部的疏水性部位暴露在蛋白质表面。若宝石橙蛋白染色试剂结合在该暴露的疏水性部位,则通过波长为470~480nm的激发光,在波长为595nm附近发出带有峰的强荧光。使蛋白质溶液的温度以一定间隔逐步上升,通过测算荧光强度,计算热变性温度(=荧光强度的变化点)。

测算中使用以水将由上述<7>中得到的纯化酶wn12-a3-v6-4-10-11调整至1mg/ml的纯化酶溶液。

具体而言,在96孔pcr板(multiplate96孔pcr板mll-9651,bio-rad社制造)的孔中,加入2μl的经过100倍稀释的宝石橙蛋白染色试剂(lifetechnologiescorporation制造)、1μl浓度为1mg/ml的纯化酶溶液、5μl的200mm乙酸缓冲液(ph为6)、纯化水或纯化水与10mmcacl2以2:1混合而成的溶液12μl,使各孔的溶液体积为20μl。pcr板以平顶8联管盖(bio-rad社制造)密封,使用实时pcr装置(cfx96touch实时pcr系统,bio-rad社制造),以每次0.2℃,使孔的温度从30℃上升至100℃,在达到目标温度后再经过10秒钟后,同时测算各孔的荧光强度。通过波长带450~490nm的光的发光二极管(led)激发宝石橙蛋白染色试剂,宝石橙蛋白染色试剂放射光通过560~580nm范围的带通滤波器,用ccd相机进行荧光强度的测算,将荧光强度变化以温度的函数的形式而绘图。将热变性温度(解链温度(meltingtemperature);tm值)定义为作为温度函数的荧光强度曲线的一阶微分(图7(b)的y轴上所示的“-d(荧光)/dt”)的极小值。使用实时pcr附带的分析软件cfxmanager(bio-rad社制造),进行数据分析。各测算通过3次独立的试验而进行,求出平均值及标准误差。

图7中示出了通过dsf法的测算的wn12-a3-v6-4-10-11的酶蛋白表现的、伴随热变性而引起的宝石橙蛋白染色试剂的荧光强度变化。图7(a)为实测数据,图7(b)表示图7(a)的荧光强度变化曲线的一阶微分“-d(荧光)/dt”。

wn12-a3-v6-4-10-11的荧光强度的一阶微分,在68℃附近有极小点,表示在该温度下发生热变性。此外,在加入cacl2的条件下,在74℃附近表现出极小点。热变性温度的平均值分别为67.6±0℃(未添加cacl2)与74.1±0.1℃(添加cacl2),显而易见,通过钙离子,热变性温度上升了6.5℃。

序列表

<110>本田技研工业株式会社

<120>耐热性纤维二糖水解酶

<130>khp172110279.0

<160>8

<210>1

<211>784

<212>prt

<213>未知

<220>

<223>wn-12-a3-v6-4-10-11

<400>1

metmetglnglyilevalargseralaserargargserleuserleu

151015

leuleualavalserleualametalaalailealaserleutrpile

202530

alaproproglnargalaglualaalaserilehisglnglnargphe

354045

leuglnleutyrasnglnilelysaspproalaasnglytyrpheser

505560

progluglyileprotyrhisalavalgluthrleuilesergluala

65707580

proasptyrglyhismetthrthrserglualatyrsertyrtrpleu

859095

trpleugluthrleutyrglytyrtyrthrglyasptrpserargleu

100105110

glualaalatrpaspasnmetglulystyrileileproileasnglu

115120125

glyaspglyvalglugluglnprothrmetasntyrtyrasnproasn

130135140

serproalathrtyralaalagluhisprotyrproaspargtyrpro

145150155160

sergluleuserglyglntyrproalaglyargaspproleuaspala

165170175

gluleulysalathrtyrglyasnasnglnthrtyrleumethistrp

180185190

leuleuaspvalaspasntrptyrglypheglyasnleuleuasnpro

195200205

serhisthralathrtyrvalasnthrpheglnargglygluglnglu

210215220

servaltrpglualaileprohisproserglnaspasplysthrphe

225230235240

glylysproasngluglyphemetserleuphethrlysgluasngln

245250255

alaproalaalaglntrpargtyrthralaalathraspalaaspala

260265270

argalavalglnvalmetphetrpalaglnlysleuglytyrasnasn

275280285

provaltyrleuasnlysalalyslysmetglyasppheleuargtyr

290295300

glymettyrasplystyrpheglnglnileglyseralaseraspgly

305310315320

serprothrproglyasnglylysaspalasermettyrleuleuala

325330335

trptyrthralatrpglyglyglyleuglyproserglyglntrpala

340345350

trpargileglyserserhisalahisglnalatyrglnasnproval

355360365

alaalatyralaleuserglnproglyglyglyleuileproleuser

370375380

prothralaglnserasptrpalaglnserleuthrargglnleuglu

385390395400

phetyrthrtrpleuglnthralagluglyglyileglyglyglyala

405410415

thrasnsertrpasnglyasptyrserprotyrproalaglyvalser

420425430

thrphetyrglyleualatyraspglualaprovaltyrhisasppro

435440445

aspserasnsertrppheglypheglnalatrpprometgluargval

450455460

alagluleutyrtyrileleualaglnserglyaspthrthrsergln

465470475480

asnpheglnmetalalysglnvalilethrlystrpileasptrpser

485490495

metasptyrvalphealaasngluargproleuthraspaspglugly

500505510

tyrtyrleuaspthrserglyargargilevalglyglythrasnpro

515520525

servalalathrthrproalaproglygluphetrpleuproserthr

530535540

leuglytrpthrglyglnproaspprotrpargglyphealasertyr

545550555560

thrglyasnproasntyrhisvaltyrvalthrasnproserglnasp

565570575

valglyvalleuglysertyrilelysalaleuthrphephealaala

580585590

glythrargalagluthrglysertyrthralaleuglyasnglnala

595600605

lysasnleualaglugluleuleugluvalalatrpasntyrasnasp

610615620

glyileglyilealathrprogluproarggluasptyrtyrargtyr

625630635640

phethrlysgluiletyrpheproasnglytrpserglythrtyrgly

645650655

glnglyasnthrileproglyasnglyglyvalproseraspproala

660665670

lysglyglyasnglyvaltyrilesertyralagluleuargprolys

675680685

ilelysglnaspproasntrpalatyrleugluasnleutyrleuasn

690695700

sertyrasnproalathrglylystrpgluasnglyvalprothrphe

705710715720

valtyrhisargphetrpalaglnvalaspmetalathralatyrala

725730735

glupheaspargleuileglyserseralaprothrvalproalaala

740745750

prothrglyleuthralathralaglyaspglyglnvalthrleuala

755760765

trpasnalaserthralaalathrsertyrthrvallysargalathr

770775780

<210>2

<211>2352

<212>dna

<213>未知

<220>

<223>wn-12-a3-v6-4-10-11

<400>2

atgatgcagggaatcgttcgatcggcttcgcggcggagcctgtcgctccttctcgccgtt60

tcgctggcgatggccgcgatcgccagcctttggatcgctcccccgcagcgggcggaagcg120

gcctcgattcatcaacagcggtttctgcagctttacaaccagatcaaggatccggccaac180

ggctatttttcgccggagggcatcccttatcacgccgtggagacgctgatcagcgaagcg240

ccggattacggccacatgaccacttccgaggcgtacagctactggctatggctggagacg300

ctgtacggatactataccggcgactggagccggctggaagcggcgtgggacaacatggaa360

aagtacatcattccgatcaacgagggagacggcgtcgaagaacagccgaccatgaactac420

tacaatccgaacagtccggccacctacgcggcggagcatccgtatcccgaccgctatccc480

tccgaactgagcgggcaatatccggcgggacgggatccgcttgacgccgagctgaaggcg540

acctacggcaacaaccagacctatctcatgcactggctgctggatgtcgacaactggtac600

ggctttggcaatctgctcaacccgtcgcatacggccacgtacgtgaacaccttccaacgc660

ggcgagcaagagtccgtgtgggaagcgatcccgcatccgtcgcaggatgacaaaacgttc720

ggcaaaccgaacgaagggttcatgagcctgttcaccaaggaaaaccaggcgcccgccgcc780

caatggcggtacaccgcggcgacggacgccgacgcccgggccgtccaggtcatgttctgg840

gcccagaagctggggtataacaatccggtttacctgaacaaggccaaaaagatgggcgac900

tttttgcgctacggcatgtatgacaagtatttccaacaaatcggcagcgccagcgacggc960

tcgcccacgccgggcaacggcaaggacgccagcatgtatttgttggcctggtacaccgcg1020

tggggcggcggtctcggtcccagcggccaatgggcgtggcgcatcggttccagtcacgcg1080

caccaggcgtaccagaacccggtcgcggcttacgccctgtcccaacccggcggcgggctg1140

attccgctgtcgccgacggcccagagcgactgggcccaatcgctcacgcgccaactggaa1200

ttctacacctggctgcagacggcagaaggcggaatcggcggcggggcgaccaacagttgg1260

aacggggactacagtccgtaccccgcgggcgtcagcacgttttacggtctggcgtacgac1320

gaggcgccggtttaccacgacccggattcgaactcctggttcgggttccaggcgtggccg1380

atggaacgcgtggccgagctctactacattctcgcgcaaagcggcgacacgacgtcgcaa1440

aacttccagatggccaagcaggtcatcaccaaatggatcgactggtcgatggactatgtg1500

ttcgccaatgagcgcccgttgaccgacgatgaaggctactacctcgacacgtcgggacgg1560

cggattgtcggcggcacgaatccgtcagtggcgacgacgcccgcgcccggcgaattctgg1620

cttccgagcacgctgggctggaccgggcagccggacccgtggcgcgggtttgcctcctat1680

accggcaatccgaattatcacgtgtacgtgacgaatcccagtcaggacgtcggcgtgctg1740

ggcagctacatcaaggcgctcaccttctttgcggccggaacccgggccgaaaccgggagc1800

tataccgctctgggcaaccaggcgaaaaatctcgcggaagagctgctggaagtggcctgg1860

aattacaacgacggcatcggcatcgcgacgccggagccccgtgaggactactatcgttat1920

ttcaccaaagaaatttacttccccaacggttggagcggcacgtacggccagggcaacacc1980

attccgggcaacggcggcgttccgtccgatccggccaaaggcggcaacggcgtctacatc2040

agctacgccgagcttcgtccaaagatcaagcaggacccgaactgggcgtatctggaaaat2100

ctttacctgaactcttacaacccggcgacgggcaaatgggagaacggcgtgccgaccttc2160

gtctaccaccgtttctgggcgcaagtggatatggccaccgcatacgccgagttcgaccgg2220

ttgatcggctcgtccgcaccgacggtgccggcggcgccgacggggttgaccgccacggcg2280

ggcgacggccaggtgacgctcgcgtggaacgcctccaccgcagcgacgagctacacggtg2340

aagcgcgccacc2352

<210>3

<211>21

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>3

atgatgcagggaatcgttcga21

<210>4

<211>19

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>4

ggtggcgcgcttcaccgtg19

<210>5

<211>24

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>5

gtgatgatgcagggaatcgttcga24

<210>6

<211>33

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>6

atgcaaagcttttaggtggcgcgcttcaccgtg33

<210>7

<211>1091

<212>prt

<213>类芽孢杆菌fslh7-689亚种

<220>

<223>纤维素1,4-β-纤维二糖苷酶

<400>7

metleulysseralaalalyslysserleuthralametleualagly

151015

thrvalmetleuthrglytyrthrglyleutrpalaglyproglnthr

202530

alahisalaalaaspglnalailegluileglnalaaspserileasn

354045

glualaargpheleuglnleutyraspglnleulysaspproalaasn

505560

glytyrpheserprogluglyleuprotyrhisserilegluthrleu

65707580

leuserglualaproasptyrglyhismetthrthrserglualatyr

859095

sertyrtrpleutrpleugluthrmettyrglyhistyrthrglyasp

100105110

trpserglnleuglualaalatrpaspsermetglulystyrileile

115120125

provalasngluglyaspglylysglugluglnprothrmetserser

130135140

tyrasnproasnserproalathrtyralaalaglulysprophepro

145150155160

aspglntyrproserglnleuasnglyglntyralaalaglylysasp

165170175

proileaspalagluleulysalathrtyrglyaspasnglnthrtyr

180185190

leumethistrpleuvalaspvalaspasptrptyrglytyrglyasn

195200205

leuleuasnproserhisthralathrtyrvalasnthrpheglnarg

210215220

glygluglngluservaltrpglualaileprohisproserglnasp

225230235240

asplysserpheglylysalaasngluglyphemetserleuphethr

245250255

lysgluasnglnvalproseralaglntrpargtyrthrasnalathr

260265270

aspalaaspalaargalavalglnvalleutyrtrpalalysglumet

275280285

glytyrasnasnproglutyrleuasplysalalyslysmetglyasp

290295300

tyrleuargtyrglymettyrasplystyrpheglnlysileglyser

305310315320

alalysasnglythrprothrproglythrglylysaspserasnmet

325330335

tyrleumetalatrptyrthrsertrpglyglyglyleuglyglngly

340345350

glyasptrpalatrpargileglyalaserhisthrhisglnalatyr

355360365

glnasnprovalalaalatyralaleuseraspproalaglyglyleu

370375380

ileprolysseralathralalysalaasptrpasnalathrleulys

385390395400

argglnleugluphetyrthrtrpleuglnserhisgluglyalaile

405410415

glyglyglyalathrasnserleuaspglysertyrlysalatyrpro

420425430

alaglyvalserthrphetyraspmetalatyrglnglualaproval

435440445

tyrargaspproaspserasnthrtrppheglypheglnalatrppro

450455460

leugluargvalalaglumettyrtyrileleualagluserglyasp

465470475480

leuthrsergluasnpheglnmetalalyslysvalilethrlystrp

485490495

ileasptrpserlysasptyrvalphevalglygluargprovalthr

500505510

aspalaglnglytyrtyrleuasnalaalaglyglnargileleugly

515520525

glythrasnvalglnvalalathrthrproalaproglygluphetrp

530535540

ileproglyglyglnglutrpglnglyglnproasplystrpasngly

545550555560

pheserserphethrgluasnproasnpheargvalthrthrlysasp

565570575

provalglnaspthrglyvalleuglysertyrvallysalaleuthr

580585590

phephealaalaglythrglnalagluasnglythrleuasnalaglu

595600605

glyglnglualalysaspleualaglualaleuleuaspthralatrp

610615620

asptyrasnaspglyvalglyilevalthrgluglugluarglysasp

625630635640

tyrpheargphephealalysgluiletyrileproalaasntrpser

645650655

glythrpheglyglnglyasnthrileproglythralaglyvalpro

660665670

seraspproalalysglyglyasnglyvaltyrileglytyrserasp

675680685

leuargproalailelysglnaspproalatrpalatyrleuaspasn

690695700

leutyrlysthrsertyrasnprothrthrlysglntrpgluasngly

705710715720

alaprothrphethrtyrhisargphetrpserglnvalaspmetala

725730735

thralatyrglyglutyraspargleuleuglyaspseraspserpro

740745750

gluvalgluvalproalaalaproalaglyvalthralathrglygly

755760765

sergluglnvalvalleuasntrpasnalaalaalaglyalaalaser

770775780

tyrthrvallysargalagluvalasnglyglyprotyrthrserval

785790795800

alathrglyvalthrglyserthrphethraspthrglyleuthrasn

805810815

glythrthrtyrtyrtyrvalvalthralavalasnalavalglyglu

820825830

seralaproserthrglnalaseralathrproleualaglythrval

835840845

valproglyvalpheasnleuthrglythralaglyaspalaglnala

850855860

valleuthrtrpthralaserthrglyalasersertyrlysvalgln

865870875880

argservalglyserglyalatyralaaspleualathrglyleuthr

885890895

alaleuthrtyrthraspalathralavalasnglythralatyrasn

900905910

tyrargvalvalalaserasnthrserglyglnthrasnserasnval

915920925

leuvalleuthrproleualaproprovalthrthrglythrleuglu

930935940

valglntyrargasnglyserserglythrservalasnalailethr

945950955960

proglnpheasnvallysasnthrglythrthralavalaspleuser

965970975

lysvallysvalargtyrtyrphethrlysaspseralaalaaspleu

980985990

serphetrpcysasptyralaglnileglyserglyasnvalglugly

99510001005

hisphevalserileaspproalalysglythralaaspthrtyrleu

101010151020

gluilegluphelysserglyalaglyserleualaalaglyalaglu

1025103010351040

thrglyileileglnglyargpheserlysasnasntrpthrasnphe

104510501055

aspglnthrasnasptyrserpheaspserthrglnthralapheser

106010651070

alatrpthrlysvalthralatyrglnaspglyalalysvaltrpgly

107510801085

ileglupro

1090

<210>8

<211>427

<212>prt

<213>未知

<220>

<223>ar19g-166ra

<400>8

leuaspasnpropheileglyalaileglytyrvalasnproasptrp

151015

alathrasnvalileserglnalaasnglnthralaaspprothrleu

202530

alaalaglnmetarglysvalalathrtyrserthralavaltrpleu

354045

aspargilealaalailethralaglyargglyleuargglyhisleu

505560

aspglualaleuargglnmetglnglnalaglyglnprovalvalile

65707580

thrleuvaliletyraspleuproasnargaspcysseralaalaala

859095

serasnglygluleuleuvalalaglnasnglyleualaargtyrlys

100105110

alaglupheileaspproilevalalaileleuseraspproargtyr

115120125

alaglyleuargilevalthrileilegluproaspserleuproasn

130135140

leuvalthrasnleuserileproalacysalaglualaglnasnala

145150155160

tyrilegluglyileargtyralavalasnargleuargthrilepro

165170175

asnvaltyriletyrleuaspilealahisserglytrpleuglytrp

180185190

aspasnasnpheasnglyalavalasnleutyrthrglnvalvalgln

195200205

glymetaspglnglypheasnserileaspglypheilethrasnval

210215220

alaasntyrthrproleuglugluprotyrleuproaspproasnleu

225230235240

thrilealaglyglnprovalargseralaserphetyrglutrpasn

245250255

protyrpheaspgluleuasptyralaleualaleuargasnalaphe

260265270

ileglyargglypheproserthrileglymetleuileaspthrser

275280285

argasnglytrpglyglycyssertyrglyargcysargprothrgly

290295300

proserseraspthrserservalasnalatyrvalaspglyserarg

305310315320

valaspargargtyrhisargglyasntrpcysasnglnalaglygly

325330335

ileglygluargproglnalaalaproargserglyileaspalatyr

340345350

valtrpvallysproproglygluseraspglyvalserglnprogly

355360365

ilevalaspproaspaspproasnlyslyspheaspprometcysasp

370375380

proasnglyglnserargtyrasnseralatyrprothrglyalaleu

385390395400

proasnalaprohisalaglyargtrppheproglnglnphegluile

405410415

leuvalargasnalatyrproproileglnpro

420425

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1