耐热性纤维二糖水解酶的制作方法

文档序号:11212253阅读:540来源:国知局
耐热性纤维二糖水解酶的制造方法与工艺

本发明涉及一种耐热性纤维二糖水解酶、编码所述耐热性纤维二糖水解酶的多核苷酸、用于表达所述耐热性纤维二糖水解酶的表达载体、整合有所述表达载体的转化体及使用有所述耐热性纤维二糖水解酶的制备纤维素分解产物的方法。

本申请要求基于2016年3月28日在日本进行申请的日本特愿2016-064519号的优先权,并在本文中引用其内容。



背景技术:

除了全球变暖以及大气污染等环境上的问题以外,由于对于原油价格的大幅上升以及不久将来的原油枯竭的预测(石油峰值)等运输用能源供给的担忧,近年来,开发代替石油的能源成为非常重要的课题。植物生物质或木质纤维素是地球上最为丰富的可再生能源,其作为代替石油的资源而备受期待。植物生物质干重的主要构成要素为由纤维素或半纤维素等多糖类与木质素构成的木质纤维素。例如,多糖类在通过使作为糖苷水解酶的纤维素酶或半纤维素酶水解为葡萄糖或木糖等单糖后,可作为生物燃料或化学产品的原料而被利用。

木质纤维素具有复杂的结构,为难分解性,以单一的糖苷水解酶难以分解、糖化(水解(hydrolysis))。在木质纤维素的全分解中,通常认为需要内切葡聚糖酶(纤维素酶或内切-1,4-β-d-葡聚糖酶、ec3.2.1.4)、外切型的纤维二糖水解酶(1,4-β-纤维二糖苷酶(cellobiosidase)或纤维二糖水解酶、ec3.2.1.91、ec3.2.1.176)、β-葡萄糖苷酶(ec3.2.1.21)这三种酶,此外还需要适当添加还包含作为半纤维素酶的木聚糖酶(内切-1,4-β-木聚糖酶、ec3.2.1.8)或β-木糖苷酶(ec3.2.1.37)等其他植物细胞壁分解酶的多种酶。

在以往的将木质纤维素作为资源的生物乙醇制备中,以乙醇的高能量效率转化为目的,尝试了通过高固相含量(solidloading)(30~60%固相含量)的糖化处理(水解处理(hydrolysisprocess))。这种通过高固相含量的木质纤维素的酶糖化(酶水解(enzymatichydrolysis)),其生物质糖化液(生物质水解液(hydrolyzedbiomasssolution))的粘性高,难以进行木质纤维素的水解反应。于是,通过使用耐热性酶,在例如65℃以上的高温下进行酶糖化处理,由此提高水解反应速度,同时降低生物质糖化液的粘性,因此预期能够实现缩短糖化反应时间(水解反应时间(hydrolysisreactiontime))及削减酶量。此外,通过在高温下进行反应,还具有能够防止酶反应中的杂菌繁殖的优点。因此,对于各种糖苷水解酶,期望开发出耐热性更优异的酶。

对于在高温环境下发挥功能的纤维素酶,迄今为止,尝试过从嗜热性丝状真菌或嗜热性细菌等中进行分离,它们大多为具有内切葡聚糖酶活性、木聚糖酶活性、木糖苷酶活性、或葡萄醣苷酶活性的酶,在木质纤维素水解过程中起到重要作用的纤维二糖水解酶并不多。例如,对于从纤维素的非还原末端开始进行水解的纤维二糖水解酶,报道了在gh6家族中最适温度超过75℃的纤维二糖水解酶(例如,参照专利文献1)。

在纤维二糖水解酶中,不仅具有对纤维素进行水解的催化域,还存在具有持有与纤维素结合的功能的模块(碳水化合物结合模块(carbohydrate-bindingmodule),以下有时称作cbm)。cbm本身不具有分解活性,但具有单独与纤维素结合的能力。作为cbm的功能,已知有:通过吸附在不溶性的底物上,使底物周围的催化域的浓度上升而提高纤维素的分解速度,或通过cbm的结合而切断纤维素链间的氢键使结晶结构崩坏(非专利文献1、2)。此外,若从分解结晶性纤维素的纤维二糖水解酶中去除cbm,尽管对可溶性底物的反应性不变,但对结晶性纤维素的分解活性或亲和性会极度降低,因此认为为了使酶作用于结晶性纤维素,cbm是必要的域(非专利文献3)。

现有技术文献

专利文献

专利文献1:国际公开第2014/157492号

非专利文献

非专利文献1:bolam等,《biochemicaljournal(生化杂志)》,1998年,第331卷,第775-781页。

非专利文献2:din等,《proceedingsofthenationalacademyofsciencesusa(美国国家科学院院报)》,1994年,第91卷,第11383-11387页。

非专利文献3:riedel等,《femsmicrobiologyletters(fems微生物通讯)》,第1998年,第164卷,第261-267页。



技术实现要素:

本发明要解决的技术问题

本发明的目的在于,提供一种至少在95℃下表现出纤维二糖水解酶活性、进一步在存在钙离子时在105℃下表现出纤维二糖水解酶活性的、具有cbm的新型耐热性纤维二糖水解酶;编码具有所述cbm的耐热性纤维二糖水解酶的多核苷酸;用于表达所述耐热性纤维二糖水解酶的表达载体;整合有所述表达载体的转化体及使用了所述耐热性纤维二糖水解酶的制备纤维素分解产物的方法。

解决技术问题的技术手段

本发明的发明人们为了解决上述课题,通过从温泉高温土壤中直接提取dna来进行难培养性微生物菌群的大规模宏基因组测序,成功获取具有新的氨基酸序列的耐热性纤维二糖水解酶,从而完成本发明。

即,本发明的耐热性纤维二糖水解酶、多核苷酸、表达载体、转化体、制备耐热性纤维二糖水解酶的方法、纤维素酶混合物及制备纤维素分解产物的方法包括下述[1]~[12]的实施方式。

[1]一种耐热性纤维二糖水解酶,其具有纤维素结合基序区域及纤维二糖水解酶催化区域,且至少在95℃、且ph5.5的条件下具有以磷酸溶胀微晶纤维素(phosphoricacidswollenavicel)为底物的水解活性,其中,所述纤维素结合基序区域由以下(a1)、(b1)或(c1)构成:

(a1)由序列号1所表示的氨基酸序列构成的多肽;

(b1)由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且具有与纤维素结合的功能的多肽;或

(c1)由与序列号1所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且具有与纤维素结合的功能的多肽。

[2]根据所述[1]所述的耐热性纤维二糖水解酶,其中所述纤维二糖水解酶催化区域由以下(a2)、(b2)或(c2)构成:

(a2)由序列号3所表示的氨基酸序列中的第164位的亮氨酸残基到第590位的脯氨酸残基的部分序列构成的多肽;

(b2)由序列号3所表示的氨基酸序列中的第164位的亮氨酸残基到第590位的脯氨酸残基的部分序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽;或

(c2)由与序列号3所表示的氨基酸序列中的第164位的亮氨酸残基到第590位的脯氨酸残基的部分序列具有70%以上序列一致性的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽。

[3]根据所述[1]所述的耐热性纤维二糖水解酶,其由以下(a3)、(b3)或(c3)构成:

(a3)由序列号3所表示的氨基酸序列构成的多肽;

(b3)由序列号3所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽;或

(c3)由与序列号3所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽。

[4]根据所述[1]~[3]中任一项所述的耐热性纤维二糖水解酶,其中,在存在钙离子时,至少在105℃、且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性。

[5]一种多核苷酸,其具有下列(a1)~(e1)中任一种碱基序列及编码具有纤维二糖水解酶催化活性的多肽的碱基序列:

(a1)编码由序列号1所表示的氨基酸序列构成的多肽的碱基序列;

(b1)编码由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且具有与纤维素结合的功能的多肽的碱基序列;

(c1)编码由与序列号1所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且具有与纤维素结合的功能的多肽的碱基序列;

(d1)与序列号2所表示的碱基序列具有80%以上序列一致性、且编码具有与纤维素结合的功能的多肽的碱基序列;或

(e1)为在严格条件下与由序列号2所表示的碱基序列构成的多核苷酸进行杂交的多核苷酸的碱基序列、且编码具有与纤维素结合的功能的多肽的碱基序列。

[6]根据所述[5]所述的多核苷酸,其由以下(a2)、(b2)、(c2)、(d2)或(e2)构成:

(a2)编码由序列号3所表示的氨基酸序列构成的多肽的碱基序列;

(b2)编码由序列号3所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(c2)编码由与序列号3所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(d2)与序列号4所表示的碱基序列具有80%以上序列一致性、且编码至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;或

(e2)为在严格条件下与由序列号4所表示的碱基序列构成的多核苷酸进行杂交的多核苷酸的碱基序列、且编码至少在95℃ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列。

[7]根据所述[5]或[6]所述的多核苷酸,其中,所述多肽在存在钙离子时,至少在105℃、且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性。

[8]一种表达载体,其整合有所述[5]~[7]中任一项所述的多核苷酸,在宿主细胞中,能够表达具有纤维二糖水解酶活性的多肽。

[9]一种转化体,其导入有所述[8]所述的表达载体。

[10]一种制备耐热性纤维二糖水解酶的方法,其包括:在所述[9]所述的转化体内,生产耐热性纤维二糖水解酶。

[11]一种糖苷水解酶混合物,其含有所述[1]~[4]中任一项所述的耐热性纤维二糖水解酶、所述[5]~[7]中任一项所述的多核苷酸所编码的耐热性纤维二糖水解酶、或通过所述[10]所述的制备耐热性纤维二糖水解酶的方法制备的耐热性纤维二糖水解酶、及至少一种其他糖苷水解酶。

[12]一种制备纤维素分解产物的方法,其包括:使含有纤维素的材料,与所述[1]~[4]中任一项所述的耐热性纤维二糖水解酶、所述[5]~[7]中任一项所述的多核苷酸所编码的耐热性纤维二糖水解酶、所述[9]所述的转化体、通过所述[10]所述的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶、或所述[11]所述的糖苷水解酶混合物接触,生产纤维素分解产物。

发明效果

本发明的耐热性纤维二糖水解酶至少在95℃、且ph5.5下具有纤维二糖水解酶活性,进一步在存在钙离子时至少在105℃、且ph5.5下具有纤维二糖水解酶活性。因此,所述耐热性纤维二糖水解酶适合于高温条件下的含有纤维素的材料的糖化处理(水解处理(hydrolysisprocess))。

此外,本发明的多核苷酸、整合有所述多核苷酸的表达载体、导入有所述表达载体的转化体适用于本发明的耐热性纤维二糖水解酶的制备。

附图说明

图1为被推测为开放阅读框ar19g-166c4a所编码的多肽的氨基酸序列(序列号3)与放线菌小双孢菌亚种(microbisporasubspecies)的α-l-阿拉伯呋喃糖苷酶的cbm2区域的氨基酸序列的比对图。

图2为表示实施例1中,使ar19g-166c4a-19-2基因在大肠杆菌中表达而得到的ar19g-166c4a-19-2蛋白质的sds-page分析结果的图,图2(a)为cbb染色的结果、图2(b)为蛋白质印迹法(westernblotting)的结果。

图3为表示在实施例1中,对使ar19g-166c4a-19-2基因在大肠杆菌中表达而得到的ar19g-166c4a-19-2蛋白质、与使ar19g-166-qa基因在大肠杆菌中表达而得到的ar19g-166-qa蛋白质的、在存在钙离子时或不存在钙离子时的各温度下的psa水解活性(ph5.5)进行测算的结果的图。

图4为表示在实施例1中,对使ar19g-166c4a-19-2基因在大肠杆菌中表达而得到的ar19g-166c4a-19-2蛋白质、与使ar19g-166-qa基因在大肠杆菌中表达而得到的ar19g-166-qa蛋白质的、在存在钙离子时或不存在钙离子时的各温度下的微晶纤维素(avicel)水解活性(ph5.5)进行测算的结果的图。

图5为表示在实施例1中,对使ar19g-166c4a-19-2基因在大肠杆菌中表达而得到的ar19g-166c4a-19-2蛋白质、与使ar19g-166-qa基因在大肠杆菌中表达而得到的ar19g-166-qa蛋白质所表现出的、在存在钙离子时或不存在钙离子时的伴随热变性而引起的宝石橙蛋白染色试剂(syproorange)的荧光强度变化的图,图5(a)表示荧光强度的实测值,图5(b)表示一阶微分“-d(荧光)/dt”。

图6为表示在实施例1中,对ar19g-166-ra蛋白质与向ar19g-166-ra蛋白质添加了ar19g-166c4a-19-2蛋白质的cbm的ar19g-166c4a-19-2-1蛋白质的、在存在钙离子时或不存在钙离子时的各温度下的微晶纤维素水解活性(ph5.5)进行测算的结果的图。

具体实施方式

[耐热性纤维二糖水解酶]

众所周知,包括丝状真菌、细菌、及古细菌的多数微生物为难培养性,生存在土壤等微生物环境中的菌中约99%为未知的菌。尤其公认生存在高温环境下的微生物的培养是极其困难的,在现有的以分离微生物为目标的培养技术中,仅对生存在从自然界中采集的天然样本中的微生物的0.1%以下进行了分离。该微生物的难培养性为无法推进耐热性纤维二糖水解酶的开发的原因之一。因此,对于耐热性纤维二糖水解酶的开发,需要研究不依赖以往的分离培养技术的方法。

近年来,通过开发可大量序列解码千兆碱基对的新一代测序仪,可完整解码土壤等中所含有的微生物菌群的基因组。提出了利用该分析技术的宏基因组分析法,从而使难培养性微生物的基因组解码得到了飞速发展,所述宏基因组分析法即制备来自于土壤等环境样本的微生物菌落的基因组dna,对基因组结构不均匀且多杂的菌落直接进行基因组的全面解码,通过并行计算机进行解码数据的拼接,再度构成微生物群基因组序列。

本发明的发明人们如后述实施例1所示,从在日本国内采集的高温温泉土壤(例如可列举出58~78℃的含有土、泥、生物垫(biomat)、生物膜等的温泉水等)中提取微生物菌落的基因组dna,进行基因组dna的鸟枪法测序及注释,得到具有与已知的纤维二糖水解酶相似的氨基酸序列的开放阅读框(orf)。根据得到的orf的碱基序列信息设计引物,通过pcr法由来自高温温泉土壤的基因组dna克隆候补基因。将经过pcr克隆的dna整合到大肠杆菌中,使所述碱基序列所编码的蛋白质表达,通过磷酸溶胀微晶纤维素(phosphoricacidswollenavicel,以下有时简称为psa)分解活性测定进行功能筛选。最后,从这些orf中,得到具有psa分解活性的耐热性纤维二糖水解酶(以下有时称为“ar19g-166c4a-19-2”)。分别将ar19g-166c4a-19-2的氨基酸序列表示为序列号3,将编码ar19g-166c4a-19-2的氨基酸序列的碱基序列表示为序列号4,

ar19g-166c4a-19-2具有纤维二糖水解酶催化区域与纤维素结合模块(以下有时简称为cbm)。在序列号3的氨基酸序列中,从第2位的半胱氨酸残基到第103位的半胱氨酸残基的102个氨基酸残基为cbm区域,从第164位的亮氨酸残基到第590位的脯氨酸残基的427个氨基酸残基为纤维二糖水解酶催化区域。分别将ar19g-166c4a-19-2的cbm区域的氨基酸序列表示为序列号1,将编码ar19g-166c4a-19-2的cbm区域的氨基酸序列的碱基序列表示为序列号2。即ar19g-166c4a-19-2为具有纤维二糖水解酶活性的糖苷水解酶。

此外,在本说明书中,“纤维二糖水解酶活性”是指,以选自由由β-1,3键与β-1,4键形成的化合物及结晶性纤维素所组成的组中的至少一种化合物、及psa为底物,通过从非还原末端侧开始水解所述底物,而生成纤维二糖的活性。作为“由β-1,3键与β-1,4键形成的化合物”,可列举出由β-1,3键与β-1,4键形成的葡聚糖,或由β-1,3键与β-1,4键形成的寡糖。

此外,本说明书中“具有活性”或“表现出活性”是指,对至少一种底物起作用,与阴性对照(negativecontrol)相比,在经过水解的底物的还原末端量或显色反应中存在显著差异。

因此,“具有纤维二糖水解酶活性”是指,以选自由由β-1,3键与β-1,4键形成的化合物及结晶性纤维素组成的组中的至少一种化合物、及psa为底物,对所述底物起作用,与阴性对照(negativecontrol)相比,在经过水解的所述底物的还原末端量或显色反应中存在显著差异。

cbm其本身不具有分解活性,但具有单独与纤维素结合的能力。作为cbm的功能,已知有,通过吸附在不溶性的底物上,使底物周围的催化域的浓度上升而提高纤维素的分解速度,或通过cbm的结合而切断纤维素链间的氢键使结晶结构崩坏。

在公知的氨基酸序列数据库检索ar19g-166c4a-19-2的氨基酸序列时,纤维二糖水解酶催化区域与专利文献1所记载的作为ar19g-166ra的一个氨基酸变异体(r299q)的ar19g-166-qa的氨基酸序列(序列号10)相同。此外,cbm的氨基酸序列与放线菌小双孢菌亚种(小双孢菌sp.(microbisporasp.))的α-l-阿拉伯呋喃糖苷酶(genbank登记号:etk36906.1)(序列号9)的cbm(碳水化合物结合模块)2区域的序列一致性最高,两者表现出64%的序列一致性(相似性)。

ar19g-166c4a-19-2具有与ar19g-166ra的一个氨基酸变异体(r299q)相同的纤维二糖水解酶催化区域,因此,与ar19g-166ra或ar19g-166qv同样对psa表现出高水解活性,对于由具有β-1,3键与β-1,4键的葡聚糖构成的地衣聚糖(lichenan)及结晶性纤维素的微晶纤维素,表现出弱分解活性。另一方面,对于羧甲基纤维素(以下有时简称为cmc)及由具有β-1,3键与β-1,6键的葡聚糖构成的昆布糖(laminarin),基本不显示出分解活性。

ar19g-166c4a-19-2至少在95℃、且ph5.5的条件下具有纤维二糖水解酶活性。实际上,如后述实施例1所示,ar19g-166c4a-19-2在ph5.5的条件下、在50~105℃的较广温度范围内表现出psa水解活性,在50~99℃的较广温度范围内表现出微晶纤维素水解活性。

此外,与无金属离子存在时相比,ar19g-166c4a-19-2在存在2价的金属离子时,在高温下表现出更高的纤维二糖水解酶活性。实际上,如后述实施例1所示,ar19g-166c4a-19-2在75℃以上的高温下,与不存在钙离子时相比,在存在钙离子时表现出高的纤维二糖水解酶活性。尤其是,ar19g-166c4a-19-2在存在钙离子时,至少在105℃、且ph5.5的条件下具有psa水解活性。

通常,具有某些生理活性的蛋白质能够在不损害其生理活性的前提下,进行至少一个氨基酸的缺失、取代或添加。即,对于ar19g-166c4a-19-2,能够在不失去纤维二糖水解酶活性的前提下,进行至少一个或多个氨基酸的缺失、取代或添加。

即,本发明的耐热性纤维二糖水解酶具有由下述(a1)~(c1)中的任一种构成的cbm和纤维二糖水解酶催化区域,且至少在95℃、且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性。本发明的耐热性纤维二糖水解酶通过具有cbm,与仅由纤维二糖水解酶催化区域构成的耐热性纤维二糖水解酶相比,表现出高的纤维二糖水解酶活性。

(a1)由序列号1所表示的氨基酸序列构成的多肽;

(b1)由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且具有与纤维素结合的功能的多肽;或

(c1)由与序列号1所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且具有与纤维素结合的功能的多肽。

本发明的耐热性纤维二糖水解酶所具有的纤维二糖水解酶催化区域,只要是通过与本发明的cbm(即,由所述(a1)~(c1)中的任一种构成的cbm)连接,至少在95℃、且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽,则没有特别限定,可从公知的耐热性纤维二糖水解酶中适当选择使用。

作为本发明的耐热性纤维二糖水解酶所具有的纤维二糖水解酶催化区域,优选为下述(a2)~(c2)中的任一种。

(a2)由序列号3所表示的氨基酸序列中的第164的位亮氨酸残基到第590位的脯氨酸残基的部分序列构成的多肽;

(b2)由序列号3所表示的氨基酸序列中的第164位的亮氨酸残基到第590位的脯氨酸残基的部分序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽;或

(c2)由与序列号3所表示的氨基酸序列中的第164位的亮氨酸残基到第590位的脯氨酸残基的部分序列具有70%以上序列一致性的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽。

本发明的耐热性纤维二糖水解酶所具有的cbm与纤维二糖水解酶催化区域可以直接连接,也可以通过由至少一个氨基酸残基构成的连接肽(linker)进行连接。此外,cbm与纤维二糖水解酶催化区域,可以以cbm为n末端侧的方式连接,也可以以cbm为c末端侧的方式连接。

作为本发明的耐热性纤维二糖水解酶,例如可列举,由下述(a3)~(c3)中的任一种构成的多肽,或是含有它们的多肽。

(a3)由序列号3所表示的氨基酸序列构成的多肽;

(b3)由序列号3所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成的、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽;或

(c3)由与序列号3所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽。

在所述(b1)、(b2)、及(b3)的多肽中,对于序列号1或序列号3所表示的氨基酸序列,缺失、取代或添加的氨基酸的数量优选为1~20个,更优选1~10个,进一步优选1~5个。

在所述(c1)、(c2)、及(c3)的多肽中,与序列号1或序列号3所表示的氨基酸序列的序列一致性,只要是70%以上且小于100%,则没有特别限定,优选为80%以上且小于100%,更优选为85%以上且小于100%,进一步优选为90%以上且小于100%,特别优选为95%以上且小于100%。

此外,以使所对应的氨基酸为最多一致的方式,对两个氨基酸序列,在相当于插入及缺失的部分加入空位(gap),同时使这两个氨基酸序列并列而得到比对,以一致的氨基酸相对于除去所得比对中的空位的氨基酸序列整体的比例的形式,求出氨基酸序列相互之间的序列一致性(相似性)。氨基酸序列相互之间的序列一致性可使用本技术领域中公知的各种相似性检索软件求出。本发明中氨基酸序列的序列一致性的值,通过以使用公知的相似性检索软件blastp而得到的比对为基础进行计算而得到。

作为所述(b1)~(b3)及(c1)~(c3)的多肽,可以是人工设计的多肽,也可以是ar19g-166c4a-19-2等的同源物(homologue)或其部分蛋白质。

所述(a1)~(a3)、(b1)~(b3)、(c1)~(c3)的多肽可分别基于氨基酸序列而进行化学合成,也可以使用后述本发明的多核苷酸,通过蛋白质表达系统而进行生产。此外,所述(b1)~(b3)及(c1)~(c3)的多肽还可分别基于由序列号1或序列号3所表示的氨基酸序列构成的多肽,使用导入有氨基酸变异的基因重组技术而进行人工合成。

本发明的耐热性纤维二糖水解酶以psa为底物。除了psa,所述耐热性纤维二糖水解酶还可以进一步以psa以外的其他β葡聚糖或寡糖作为底物。作为该其他β葡聚糖或寡糖,例如可列举出微晶纤维素(avicel)、结晶性细菌纤维素(细菌微晶纤维素(bacterialmicrocrystallinecellulose),以下,有时简称为bmcc)、滤纸等结晶性纤维素;cmc;纤维二糖等由β-1,4键形成的寡糖;木聚糖;对硝基苯基-β-d-吡喃半乳糖苷(有时简称为pnpgal);对硝基苯基-β-d-吡喃木糖苷(有时简称为pnpx);地衣聚糖等由β-1,3键与β-1,4键形成的葡聚糖;昆布糖等由β-1,3键与β-1,6键形成的葡聚糖;由β-1,3键形成的葡聚糖;由β-1,6键形成的葡聚糖;龙胆二糖等由β-1,6键形成的寡糖等。作为本发明的耐热性纤维二糖水解酶,优选为除了psa之外还以微晶纤维素及地衣聚糖为底物的耐热性纤维二糖水解酶。

本发明的耐热性纤维二糖水解酶,至少在ph5.5的条件下,优选在70~100℃的温度范围内、更优选在70~105℃的温度范围、进一步优选在50~105℃的温度范围内表现出以psa为底物的水解活性。本发明的耐热性纤维二糖水解酶的最适温度优选在85~100℃的范围内,更优选在90~100℃的范围内。

作为本发明的耐热性纤维二糖水解酶,优选至少在ph4.5~6.0的范围内表现出纤维二糖水解酶活性,更优选在ph4.0~6.5的范围内表现出纤维二糖水解酶活性。

此外,本发明的耐热性纤维二糖水解酶优选与无金属离子存在时相比,在存在2价的金属离子时,即使在更高的高温下也表现出高的纤维二糖水解酶活性。本发明的耐热性纤维二糖水解酶,在存在2价的金属离子时,优选至少在80~100℃的温度范围内、且ph4.5~6.0下具有纤维二糖水解酶活性,更优选在80~105℃的温度范围内、且ph4.5~6.5的ph范围内表现出纤维二糖水解酶活性,进一步优选在50~105℃的温度范围内、且ph4.5~6.5的ph范围内表现出纤维二糖水解酶活性。

此外,本发明的耐热性纤维二糖水解酶的“耐热性”是指,例如在50~105℃的温度范围内具有纤维二糖水解酶活性。

本发明的耐热性纤维二糖水解酶可以进一步具有除纤维二糖水解酶活性以外的纤维素水解活性。作为其他纤维素水解活性,可列举出木聚糖酶活性、β-半乳糖苷酶活性、内切葡聚糖酶活性、木糖苷酶活性、或β-葡萄醣苷酶活性等。

本发明的耐热性纤维二糖水解酶可以是仅由本发明的cbm与耐热性纤维二糖水解酶催化区域构成的酶,也可以包含其他区域。作为其他区域,可列举出公知的纤维二糖水解酶具有的除纤维二糖水解酶催化区域以外的区域。例如在本发明的耐热性纤维二糖水解酶中,对于公知的纤维二糖水解酶,也含有通过将纤维二糖水解酶催化区域取代为所述(a3)~(c3)的多肽而得到的酶,或对公知的纤维二糖水解酶中添加有所述(a1)~(c1)的多肽的酶。

此外,本发明的耐热性纤维二糖水解酶可以在n末端或c末端上具有能够转移并定位于细胞内的特定区域的信号肽、或向细胞外分泌的信号肽。作为这样的信号肽,例如有非原质体转运信号肽、内质网驻留信号肽、核转运信号肽、分泌型信号肽等。作为内质网驻留信号肽,例如有由hdel的氨基酸序列构成的信号肽等。

此外,为了在使用表达系统进行生产时能够简便地纯化,本发明的耐热性纤维二糖水解酶可例如在n末端或c末端上添加各种标记。作为所述标记,例如可使用his标记、ha(血凝素(hemagglutinin))标记、myc标记、及flag标记等在重组蛋白质的表达及纯化中广泛使用的标记。

即,本发明的耐热性纤维二糖水解酶的一个方面在于:含有所述(a3)~(c3)中的任一种多肽;及根据所需,含有选自由信号肽及标记组成的组中的至少一种。

[编码耐热性纤维二糖水解酶的多核苷酸]

本发明的多核苷酸编码本发明的耐热性纤维二糖水解酶。所述耐热性纤维二糖水解酶可通过将整合有所述多核苷酸的表达载体导入宿主,利用所述宿主的表达系统而进行生产。

具体而言,本发明的多核苷酸为具有下述(a1)~(e1)中任一种碱基序列及编码具有纤维二糖水解酶催化活性的多肽的碱基序列的多核苷酸。

(a1)编码由序列号1所表示的氨基酸序列构成的多肽的碱基序列;

(b1)编码由序列号1所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且具有与纤维素结合的功能的多肽的碱基序列;

(c1)编码由与序列号1所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且具有与纤维素结合的功能的多肽的碱基序列;

(d1)与序列号2所表示的碱基序列具有80%以上序列一致性、且具有与纤维素结合的功能的多肽的碱基序列;或

(e1)为在严格条件下与由序列号2所表示的碱基序列构成的多核苷酸进行杂交的多核苷酸的碱基序列、且编码具有与纤维素结合的功能的多肽的碱基序列。

作为本发明的多核苷酸,可列举出由下述(a2)~(e2)中任一种碱基序列构成的多核苷酸、或由含有下述(a2)~(e2)中任一种碱基序列的碱基序列所构成的多核苷酸。

(a2)编码由序列号3所表示的氨基酸序列构成的多肽的碱基序列;

(b2)编码由序列号3所表示的氨基酸序列中的至少一个氨基酸的缺失、取代或添加而形成的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(c2)编码由与序列号3所表示的氨基酸序列具有70%以上序列一致性的氨基酸序列所构成、且至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;

(d2)与序列号4所表示的碱基序列具有80%以上序列一致性、且编码至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列;或

(e2)为在严格条件下与由序列号4所表示的碱基序列构成的多核苷酸进行杂交的多核苷酸的碱基序列、且编码至少在95℃且ph5.5的条件下具有以磷酸溶胀微晶纤维素为底物的水解活性的多肽的碱基序列。

此外,在本申请说明书中,“多核苷酸中碱基的缺失”是指构成多核苷酸的核苷酸的一部份失去(被去除)。

在本申请说明书中,“多核苷酸中碱基的取代”是指构成多核苷酸的碱基被其他的碱基替换。

在本申请说明书中,“多核苷酸中碱基的添加”是指在多核苷酸中插入新的碱基。

在本申请说明书中,“严格条件”例如可列举出《分子克隆-实验室手册第三版》(sambrook等,冷泉港实验室出版社)中所记载的方法。例如可列举出在由6×ssc(20×ssc的组成:3m氯化钠、0.3m柠檬酸溶液、ph7.0)、5×邓哈特溶液(denhardt'ssolution)(100×邓哈特溶液的组成:2质量%牛血清白蛋白、2质量%ficoll(聚蔗糖)、2质量%聚乙烯吡咯烷酮)、0.5质量%的sds、0.1mg/ml鲑鱼精子dna、及50%甲酰胺构成的杂交缓冲液中,在42~70℃下进行数小时至一夜的温育,从而使其杂交的条件。作为在温育后清洗时所使用的清洗缓冲液,优选为含有0.1质量%sds的1×ssc溶液,更优选为含有0.1质量%sds的0.1×ssc溶液。

在所述(a1)~(e1)及(a2)~(e2)的碱基序列中,简并密码子优选宿主中使用频率高的密码子。例如,作为所述(a1)的碱基序列,可以是序列号2所表示的碱基序列,也可以是在不改变所编码的氨基酸序列的前提下,将序列号2所表示的碱基序列变更为在宿主中使用频率高的密码子的碱基序列。密码子的改变可通过公知的基因序列突变技术或人工基因合成来进行。

由序列号2或序列号4所表示的碱基序列构成的多核苷酸,可以根据碱基序列信息进行化学合成,也可以是通过基因重组技术从自然界中取得的编码ar19g-166c4a-19-2的基因(以下有时称为“ar19g-166c4a-19-2”基因或“基因克隆ar19g-166c4a-19-2”。)的全长或含有纤维二糖水解酶催化区域及cbm的部分区域。ar19g-166c4a-19-2基因的全长或其部分区域例如可通过以下方式获得:从自然界中取得含有微生物的样本,以从所述样本中回收的基因组dna为模版,根据序列号2所表示的碱基序列,使用通过常规方法而设计的正向引物与反向引物,进行pcr。也可以将从所述样本中回收的mrna作为模版通过逆转录反应而合成的cdna作为模版。

在所述(d1)及(d2)的碱基序列中,与序列号2或序列号4所表示的碱基序列的序列一致性只要是80%以上且小于100%则没有特别限定,优选为85%以上且小于100%,更优选为90%以上且小于100%,进一步优选为95%以上且小于100%,更进一步优选为98%以上且小于100%。

此外,以使所对应的氨基酸为最多一致的方式,对两个氨基酸序列,在相当于插入及缺失的部分加入空位,同时使这两个氨基酸序列并列而得到比对,以一致的氨基酸相对于除去所得比对中的空位的氨基酸序列整体的比例的形式,求出氨基酸序列相互之间的序列一致性(相似性)。氨基酸序列相互之间的序列一致性可使用本技术领域中公知的各种相似性检索软件求出。本发明中的氨基酸序列的序列一致性的值,通过以使用公知的相似性检索软件blastn而得到的比对为基础进行计算而得到。

例如,对于由所述(b1)、(b2)、(c1)、(c2)、(d1)或(d2)的碱基序列构成的多核苷酸,分别可通过对由序列号2或序列号4所表示的碱基序列构成的多核苷酸进行1个或2个以上碱基的缺失、取代或添加而人工合成。此外,作为所述(b1)、(b2)、(c1)、(c2)、(d1)或(d2)的碱基序列,可以是ar19g-166c4a-19-2基因的同源基因的全长序列或其部分序列。ar19g-166c4a-19-2基因的同源基因可通过在获取碱基序列已知的基因的同源基因时所使用的基因重组技术而取得。

本发明的多核苷酸可以仅具有编码纤维二糖水解酶催化区域与cbm的区域,也可以除了所述区域,还具有编码连接序列、各种信号肽、各种标记等的区域。

即,本发明的多核苷酸的一个方面在于,含有:所述(a2)~(e2)中任一种碱基序列;及根据需要编码选自由信号肽及标记组成的组中的至少一种的区域。

[表达载体]

本发明的表达载体整合有所述本发明的多核苷酸,在宿主细胞中,至少在95℃、且ph5.5的条件下,能够表达具有纤维二糖水解酶活性的多肽。即,本发明的表达载体为以能够表达所述本发明的耐热性纤维二糖水解酶的状态而整合有所述本发明的多核苷酸的表达载体。更具体而言,需要将由从上游开始的具有启动子序列的dna、所述本发明的多核苷酸、具有终止子序列的dna构成的表达盒整合入表达载体。此外,向多核苷酸的表达载体的整合可通过使用众所周知的基因重组技术进行,也可使用市售的表达载体制作试剂盒。

作为所述表达载体,可以是向大肠杆菌等原核细胞导入的表达载体,也可以是向酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、植物细胞等真核细胞导入的表达载体。作为这些表达载体,可根据各自的宿主,使用通常所用的任意的表达载体。

本发明的表达载体优选不仅整合有所述本发明的多核苷酸,还整合有耐药性基因等。这是由于能够通过表达载体容易地筛选进行了转化的细胞与未转化细胞。

作为所述耐药性基因,例如可列举出卡那霉素抗性基因、潮霉素抗性基因、双丙氨磷抗性基因等。

[转化体]

本发明的转化体导入有本发明的表达载体。在所述转化体中,能够使本发明的耐热性纤维二糖水解酶表达。以往公知的纤维二糖水解酶的现有宿主的范围窄,即,大多难以异种表达。对此,本发明的耐热性纤维二糖水解酶能够在大肠杆菌、酵母、丝状真菌、高等植物叶绿体等广泛的表达宿主中表达。因此,作为导入表达载体的宿主,可以是大肠杆菌等原核细胞,也可以是酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、或植物细胞等真核细胞。即,作为本发明的转化体,为导入有本发明的表达载体的大肠杆菌、酵母、丝状真菌、昆虫培养细胞、哺乳动物培养细胞、植物细胞等。通过培养大肠杆菌的转化体,可更简便且大量的生产本发明的耐热性纤维二糖水解酶。另一方面,在真核细胞内,由于对蛋白质实施糖链修饰,因此,通过使用真核细胞的转化体,与使用原核细胞的转化体时相比,能够生产耐热性更优异的耐热性纤维二糖水解酶。

使用表达载体制作转化体的方法没有特别限定,可通过在制作转化体时通常使用的方法来进行。作为所述方法,例如有农杆菌介导法、基因枪法、电穿孔法、及peg(聚乙二醇)法等。其中,在宿主为植物细胞时,优选使用基因枪法或农杆菌介导法来进行。

在使用原核细胞、酵母、丝状真菌、昆虫培养细胞、或哺乳动物培养细胞等作为宿主时,得到的转化体通常可以与转化前的宿主相同的方式,使用常规方法进行培养。

[耐热性纤维二糖水解酶的制备方法]

本发明的耐热性纤维二糖水解酶的制备方法为在所述本发明的转化体内生产耐热性纤维二糖水解酶的方法。若使用将所述本发明的多核苷酸整合到不具有控制表达时期等能力的启动子下游的表达载体制备转化体,并对该转化体进行培养,则能够在所述转化体内恒常性地表达本发明的耐热性纤维二糖水解酶。另一方面,对于使用通过特定的化合物或温度条件等诱导表达的所谓表达诱导型启动子而制备的转化体,通过进行适于各自表达诱导条件的诱导处理,能够在所述转化体内表达本发明的耐热性纤维二糖水解酶。

由转化体生产的耐热性纤维二糖水解酶,能够在留存于所述转化体内的状态下使用,也可以从所述转化体中提取、纯化。

从转化体提取或纯化耐热性纤维二糖水解酶的方法,只要是不损害耐热性纤维二糖水解酶的活性的方法,则没有特别的限定。可通过在从细胞或生物体组织中提取多肽时通常使用的方法进行提取。作为所述方法,例如可列举出将转化体浸渍在适当的提取缓冲液中,提取耐热性纤维二糖水解酶后,将提取液与固体残渣分离的方法。作为所述提取缓冲液,优选为含有表面活性剂等增溶剂的提取缓冲液。在转化体为植物时,可在浸渍在提取缓冲液中之前,预先将所述转化体切碎或粉碎。此外,作为分离提取液与固体残渣的方法,例如可使用过滤方法、压缩过滤方法、或离心分离处理方法等公知的固液分离处理,也可对浸渍在提取缓冲液中的状态下的转化体进行挤压。提取液中的耐热性纤维二糖水解酶可使用盐析法、超滤法、或层析法等公知的纯化方法进行纯化。

在转化体内具有分泌型信号肽的状态下使本发明的耐热性纤维二糖水解酶表达时,在培养所述转化体后,通过回收从得到的培养物中除去了转化体的培养液上清液,能够简便地得到含有耐热性纤维二糖水解酶的溶液。此外,在本发明的耐热性纤维二糖水解酶具有his标记等标记时,通过利用了所述标记的亲和色谱法,能够简便地对提取液或培养上清液中的耐热性纤维二糖水解酶进行纯化。

即,本发明的制备耐热性纤维二糖水解酶的方法包括:在所述本发明的转化体内生产耐热性纤维二糖水解酶;及根据所需从所述转化体中提取、纯化所述耐热性纤维二糖水解酶。

[糖苷水解酶混合物]

本发明的糖苷水解酶混合物含有:所述本发明的耐热性纤维二糖水解酶、或通过所述本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶、与至少一种的其他糖苷水解酶。通过所述本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶可以为包含在转化体内的状态的耐热性纤维二糖水解酶,也可以是由转化体中提取或纯化的耐热性纤维二糖水解酶。通过将本发明的耐热性纤维二糖水解酶以与其他糖苷水解酶的混合物的形式用于纤维素的分解反应,可高效地分解由含有难分解性的纤维素的木质纤维素构成的材料。

作为所述糖苷水解酶混合物中含有的所述耐热性纤维二糖水解酶以外的其他糖苷水解酶,只要具有纤维素的水解活性则没有特别限定。作为所述糖苷水解酶混合物中含有的所述纤维二糖水解酶以外的其他糖苷水解酶,例如可列举出木聚糖酶、或β-木糖苷酶等半纤维素酶、本申请中的耐热性纤维二糖水解酶以外的纤维二糖水解酶、β-葡萄醣苷酶、或内切葡聚糖酶等。作为本发明的糖苷水解酶混合物,除了所述本发明的耐热性纤维二糖水解酶以外,优选进一步还含有半纤维素酶与内切葡聚糖酶中的至少一种,更优选含有半纤维素酶与内切葡聚糖酶这两者。其中,除了含有所述本发明的耐热性纤维二糖水解酶以外,优选进一步还含有选自由木聚糖酶、β-木糖苷酶、本发明的耐热性纤维二糖水解酶以外的纤维二糖水解酶、及内切葡聚糖酶组成的组中的至少一种糖苷水解酶,更优选含有木聚糖酶、β-木糖苷酶、本发明的耐热性纤维二糖水解酶以外的纤维二糖水解酶、及内切葡聚糖酶全部。

所述糖苷水解酶混合物所含有的其他糖苷水解酶,优选为至少在70℃下具有糖苷水解活性的耐热性糖苷水解酶,更优选为在70~95℃下具有糖苷水解活性的耐热性糖苷水解酶,进一步优选为在70~105℃下具有糖苷水解活性的耐热性糖苷水解酶。通过使所述糖苷水解酶混合物中所含有的所有酶为耐热性(例如,酶活性的最适温度或酶蛋白的热变性温度为70℃以上),能够在高温条件下高效地进行基于所述糖苷水解酶混合物的纤维素的分解反应。即,在所述糖苷水解酶混合物只含有耐热性糖苷水解酶时,通过将所述糖苷水解酶混合物用于含有纤维素的材料、例如由含有纤维素的木质纤维素构成的材料的糖化处理,则能够在糖化温度70~95℃的高温环境下进行木质纤维素水解反应(高温糖化:高温水解(hightemperaturehydrolysis))。通过该高温糖化,能够显著减少酶量与糖化时间,大幅降低糖化成本(水解成本(hydrolysiscost))。

[制备纤维素分解产物的方法]

本发明的制备纤维素分解产物的方法为,通过本发明的耐热性纤维二糖水解酶,分解含纤维素的材料,得到其分解产物的方法。具体而言,使含有纤维素的材料,与本发明的耐热性纤维二糖水解酶、本发明的转化体、或通过本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶、或本发明的糖苷水解酶混合物接触,由此生产纤维素分解产物(例如含有纤维二糖、葡萄糖等的分解产物)。

作为含有纤维素的材料,只要含有纤维素则没有特别限定。作为所述材料,例如可列举出杂草或农业类废弃物等纤维素类生物质、或废纸等。优选使所述含有纤维素的材料在与本发明的耐热性纤维二糖水解酶接触前,先进行破碎或切碎等物理处理、利用酸或碱等的化学处理、或者浸渍或溶解于适当的缓冲液中的处理等。

利用本发明的耐热性纤维二糖水解酶的纤维素的水解反应的反应条件只要是使所述耐热性纤维二糖水解酶表现出纤维二糖水解酶活性的条件即可。例如在无二价金属离子存在下时,优选在60~100℃、且ph4.5~6.5下进行反应,更优选在50~100℃、且ph4.5~6.5下进行反应。此外,在二价金属离子的存在下,优选在80~105℃、且ph4.5~6.5下进行反应,更优选在70~105℃、且ph4.5~6.5下进行反应。对于所述水解反应的反应时间,可考虑供水解的含有纤维素的材料的种类、预处理方法、或用量等进行适当的调整。例如,在以10分钟~100小时对纤维素类生物质进行分解时,可以1~100小时的反应时间进行所述水解反应。

在含有所述纤维素的材料的水解反应中,优选除了使用本发明的耐热性纤维二糖水解酶以外,进一步还使用至少一种其他糖苷水解酶。作为所述其他糖苷水解酶,可使用与所述糖苷水解酶混合物中含有的糖苷水解酶相同的糖苷水解酶,优选的是,至少在70℃、优选至少在70~100℃下具有糖苷水解活性的耐热性糖苷水解酶。此外,所述纤维素分解产物的制备方法一个方面为使用本发明的耐热性纤维二糖水解酶、本发明的转化体、或通过本发明的制备耐热性纤维二糖水解酶的方法而制备的耐热性纤维二糖水解酶,另一个方面为使用所述糖苷水解酶混合物。

实施例

以下示出实施例,对本发明进行更详细说明,但本发明并不受以下的实施例所限。

[实施例1]来自温泉土壤的新型耐热性纤维二糖水解酶的克隆

<1>来自温泉土壤的dna提取与全基因组序列(wholegenomesequence,wgs)

以耐热性纤维二糖水解酶(最适温度:55℃以上)、超耐热性纤维二糖水解酶(最适温度:80℃以上)的基因探索为目的,从中性~弱碱性温泉中采集土壤dna,对这些构成土壤的微生物菌群宏基因组dna的碱基序列进行解码。

作为中性~弱碱性温泉土壤样本,从在野外喷出高温温泉的日本国内的3处的5个地点(宏基因组dna样本n2、ar19、ar15、oj1、及h1),采集含有土壤、泥、生物垫的温泉水。这些温泉土壤样本采集时的温度在58~78℃的范围、且在ph7.2~8的范围。

使用dna提取试剂盒(isoillargeforbeadsver.2,nippongene社制造),从采集的温泉土壤样本各10g中提取dna。对提取的dna中的5μg,使用rochediagnosticsk.k.制造的测序仪gsflxtitanium454,进行宏基因组dna的鸟枪法测序。

对于温泉土壤样本ar15,进行宏基因组dna的序列解码,得到平均解码长度(readlength)为396bp、总解码数(totalreadnumber)为2,766,332个、总基因组解码量(atotalquantityofsequencedgenomes)为1,106,243,280bp的全基因组序列(wgs)数据集。

<2>温泉宏基因组数据的拼接与统计量

使用genomicsworkbenchver.4软件(clc社制造),对罗氏(roche)454的输出(sff文件)进行低品质解码的修剪(trimming)及从头拼接(denovoassemble)。

拼接为500bp以上的总重叠群(contig)长度合计为159,587,150bp,将该数据集用于纤维素酶基因分析。修剪后的解码总数为2,766,328个解码,拼接为平均1,230bp的重叠群(计129,742个重叠群),其中最大重叠群长度为105,977bp。

<3>纤维二糖水解酶的开放阅读框(orf)预测

从uniprot数据库(http://www.uniprot.org/)上下载ec号为3.2.1.4(纤维素酶)、3.2.1.21(β-葡萄糖苷酶)、3.2.1.37(β-木糖苷酶)、3.2.1.91(纤维素1,4-β-纤维二糖苷酶)、3.2.1.8(内切1,4-β-木聚糖酶)的序列(访问日:2011/12/9),构建这些糖苷水解酶基因的蛋白质组本地数据库。使用注释软件metegeneanotator(noguchi等,宏基因注释:用于未命名原核基因组和噬菌体基因组中的精确的基因预测的、对核糖体结合位点的物种特异性模式的检测,(metageneannotator:detectingspecies-specificpatternsofribosomalbindingsiteforprecisegenepredictioninanonymousprokaryoticandphagegenomes)《dna研究》,2008,15,387-396。),由在所述<2>中得到的重叠群序列推测基因区域(=开放阅读框)。为了从推测的orf中提取糖苷水解酶基因,使用blastp(blastallver.2.2.18),参照了所述本地数据库。blastp的选项条件为:设置“过滤查询序列=假,”“期待值(e)<1e-20”[以下为默认值:空位开放罚分=-1,空位扩展罚分=-1,空位比对的x下降值=0,阈值拓展命中=0,字段长度=默认(costtoopenagap=-1,costtoextendedgap=-1,xdropoffvalueforgappedalignment=0,thresholdforextendinghits=0,wordsize=default)],以命中的序列作为糖苷水解酶基因进行收集。

<4>基因的糖苷水解酶(gh)家族分类

对于含有在所述<3>中所收集的纤维素酶、内切半纤维素酶、脱支酶等糖苷水解酶的序列,以蛋白质的功能区域序列数据库pfamhmms(pfam23.0版和hmmerv2.3;finn等,《核酸研究数据库》2010年,第38卷,第d211-222页)为标准,进行功能分类。具体而言,使用蛋白质基序检索程序hmmer(durbin等,“概形hmm理论。生物序列分析:蛋白质和核酸的概率模型(thetheorybehindprofilehmms.biologicalsequenceanalysis:probabilisticmodelsofproteinsandnucleicacids)”,1998年,剑桥大学出版社;hmmpfam(2.3.2版)中,e值截止值<1e-5;数据库=pfam_fs(可用于查找所表示的结构域在序列中的片段的模型。)),从与pfam区域数据库的相似性确定糖苷水解酶(gh)家族。

通过利用使用了温泉土壤样本ar19的序列数据的blastp的相似性检索及pfamhmms,61个orf预测为纤维二糖水解酶基因。其中的一个在已知的ar19g-166ra的一个氨基酸变异体(r299q)ar19g-166-qa的序列的n末端侧上添加有新的cbm2家族的序列。对该orf设计引物,以通过基因组dna扩增试剂盒(genomiphiv2dna扩增试剂盒,gehealthcare社制造)进行扩增的温泉土壤dna为模板,通过pcr克隆基因。其结果,从在5’末端侧带有具有cbm2家族的gh6家族的纤维二糖水解酶序列的开放阅读框ar19g-166c4a上,分离出纤维二糖水解酶基因ar19g-166c4a-19-2。

<5>开放阅读框ar19g-166c4a

开放阅读框ar19g-166c4a编码由590个氨基酸残基构成的多肽(序列号3),所述多肽为从第1位的氨基酸残基丙氨酸(a)开始、3’末端以终止密码子终止的非全长序列(序列号4)。从基序的序列相似性推测出:在开放阅读框ar19g-166c4a所编码的氨基酸序列中,从第2位的半胱氨酸(c)到第103位的半胱氨酸(c)的102个氨基酸残基为cbm2家族的域,从第164位的亮氨酸(l)到第590位的脯氨酸的427个氨基酸残基为糖苷水解酶第6家族催化域。该cbm2家族的域对放线菌小双孢菌亚种的α-l-阿拉伯呋喃糖苷酶的cbm2区域(由序列号9的第29~128位的氨基酸构成的区域)与cbm区域,表现出64%的氨基酸序列一致性,为新的序列。序列相似性通过clustalw算法来计算。

图1表示被推测为开放阅读框ar19g-166c4a所编码的多肽的氨基酸序列(序列号3)与小双孢菌亚种的α-l-阿拉伯呋喃糖苷酶(序列号9)的cbm2区域的氨基酸序列的比对。图1中,黑白对比的氨基酸表示在这些全氨基酸序列中的相同的氨基酸残基(一致序列),“-”表示缺失(空位)。

<6>纤维二糖水解酶基因ar19g-166c4a-19-2

通过pcr克隆,从开放阅读框ar19g-166c4a中分离出纤维二糖水解酶基因ar19g-166c4a-19-2。ar19g-166c4a-19-2基因含有由与开放阅读框ar19g-166c4a完全相同的1,773bp构成的碱基序列。

<7>纤维二糖水解酶酶蛋白的表达及纯化

使用由序列号7所表示的碱基序列构成的正向引物(5’-gtgatggctgccaggtgtcctac-3’:在序列号5所表示的碱基序列的5’末端侧上添加6个碱基(gtgatg),将5’末端磷酸化而成的引物)与由序列号8所表示的碱基序列构成的反向引物(5’-atgcagagctcttagggttggatcggcggatag-3’:在序列号6所表示的碱基序列的5’末端侧上添加限制酶saci识别序列而成的引物,saci为对载体进行插入中所使用的序列),将用kod-plus-neo(toyobo社制造)扩增的pcr产物插入至plead5载体(nippongeneco.,ltd.制)中,转化到大肠杆菌jm109株中。此外,序列号5所表示的碱基序列为与由序列号4所表示的碱基序列的第1~18位的碱基构成的部分序列相同的(一致的)碱基序列。此外,序列号6所表示的碱基序列为与由序列号4所表示的碱基序列的第1,752~1,773位的碱基构成的部分序列互补的碱基序列。通过菌落pcr选出阳性克隆,使用含有100mg/l氨苄青霉素的lb液体培养基,以37℃、200rpm培养17~20小时后,使用小量提取试剂盒(wizardplussvminiprepsdna纯化系统,promega社制造)进行质粒的制备。使用测序仪(lifetechnologiescorporation的3730dna分析仪),对制备的质粒进行序列确认。通过pcr克隆,从开放阅读框ar19g-166c4a得到基因克隆ar19g-166c4a-19-2。

将带有经过序列确认的ar19g-166c4a-19-2/plead5质粒的转化大肠杆菌克隆接种到含有50mg/l氨苄青霉素的turbobroth培养基(athenaenvironmentalsciences,inc制造)中,通过培养约20小时,使目标蛋白质表达。培养后,进行离心分离处理,回收大肠杆菌,加入培养液的1/10容量的50mmtris-hcl缓冲液(ph8.0)进行悬浊。然后,使用超声波破碎装置astrason3000(misonix社制造),循环重复7~8次破碎5分钟-停止5分钟的步骤,得到含有目标蛋白质的基因重组大肠杆菌的粗提取物。使用滤纸(孔径millipore社制造)过滤所述基因重组大肠杆菌的粗提取物,将得到的滤液作为基因重组大肠杆菌破碎上清液。

将所述基因重组大肠杆菌破碎上清液填充(load)到用50mmtris-hcl缓冲液(ph8.0)平衡的离子交换柱hitrapqhp(gehealthcare社制造)中,使用中高压液相色谱系统aktadesign(gehealthcare社制造),在含有1m的nacl的50mmtris-hcl缓冲液(ph8.0)中以0~50%的浓度梯度对蛋白质进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,通过离心式的超滤膜vivaspin20(sartoriusstedim社制造)与含有750mm的硫酸铵的50mmtris-hcl缓冲液(ph8.0)进行溶液交换。将溶液交换后的纤维二糖水解酶活性级分填充到以相同液体平衡的疏水性相互作用分离柱hitrapphnenylhp(gehealthcare社制造)中,通过50mmtris-hcl缓冲液(ph8.0)以0~100%的浓度梯度对蛋白质进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,使用vivaspin20进行浓缩,直至液量为8ml左右。将浓缩的样本添加到以含有150mm的nacl的50mmtris-hcl缓冲液(ph8.0)平衡的凝胶过滤柱hiload26/60superdex200pg(gehealthcare社制造)中,以流速2~3ml/分钟使柱体积的1~1.5倍体积的相同缓冲液流过,由此进行分级。在将具有纤维二糖水解酶活性的级分收集并混合后,进行与50mmtris-hcl缓冲液(ph8.0)的溶液交换与浓缩,得到最终浓度约1mg/ml的纯化酶。

通过sds-page分析(sds聚丙烯酰胺凝胶电泳(sds-polyacrylamidegelelectrophoresis))确认基因重组大肠杆菌破碎上清液与纯化酶(纯化的纤维二糖水解酶酶蛋白)。基因重组大肠杆菌破碎上清液与纯化酶的sds电泳使用mini-proteantgx免染预制胶(bio-rad社制造)进行。将所述上清液或纯化酶分别与tris-sdsβ-me处理液(cosmobioco.,ltd.制造)以1:1混合而成的电泳用样本,在100℃下处理10分钟后,对于每个样本,分别使10μl基因重组大肠杆菌破碎上清液、0.5μg纯化酶进行电泳。电泳完成后,通过cbb染色与蛋白质印迹法检测蛋白质的条带。

对于蛋白质印迹法,在进行sds电泳后,使用转印装置trans-blotsd(bio-rad社制造)与trans-blotturbo转印包(bio-rad社制造),转印到聚偏二氟乙烯膜上。使膜上的蛋白质与1000倍稀释的兔一抗反应。所述兔一抗通过合成由ar19g-166-ra所编码的第384~403位的20个氨基酸残基(cdpngqsrynsayptgalpn)构成的多肽,对兔进行免疫而得到的血清进行亲和纯化而制备(operonbiotechnology社制造)。对于与蛋白质结合的第一抗体的检测,使用快速蛋白质印迹法试剂盒(fastwesternblottingkit)(pierce社制造)进行,对于化学发光信号的检测,使用成像装置ez-capturemg(atto社制造)。

图2表示由导入有ar19g-166c4a-19-2基因的转化大肠杆菌制备的基因重组大肠杆菌破碎上清液及由所述基因重组大肠杆菌破碎上清液纯化而成的纯化酶的sds-page分析的cbb染色的结果(图2(a))与蛋白质印迹法的结果(图2(b))。泳道1为蛋白质质量标准的电泳图案,泳道2为基因重组大肠杆菌破碎上清液的电泳图案,泳道p为纯化酶的电泳图案。其结果,在cbb染色与蛋白质印迹法这两者中,在所述基因重组大肠杆菌破碎上清液(泳道2)中,确认到由氨基酸序列(序列号3)预测的质量63.4kda附近的强条带,在纯化酶(泳道p)中,确认到所述条带所对应的单一条带(图中的箭头)。

<8>纤维二糖水解酶活性

调查以ar19g-166c4a-19-2基因所编码的酶蛋白(ar19g-166c4a-19-2)的psa及微晶纤维素为底物的纤维二糖水解酶活性。在测算中,使用0.05m的tris-hcl缓冲液(ph8.0)将所述<7>中得到的纯化酶稀释为1mg/ml而使用。

用作底物的psa通过以下方式制备:先使用磷酸溶液将微晶纤维素粉末(微结晶性纤维素粉末,merck社制造)溶解,然后加入灭菌蒸馏水(纯化水(purifiedwater))使其析出,然后进行清洗直至ph为5以上。此外,在以后的试验中使用的psa全部按照所述方法制备。

关于反应,使用恒温混匀仪(thermomixer,eppendorfag.制造),关于反应容器则使用1.5ml容量的样本管,反应液的组成为10μl经稀释的纯化酶、40μl纯化水、50μl的200mm乙酸缓冲液(ph5.5)、100μl的1质量%底物溶液。在以psa为底物时的95~110℃的反应中,使用reacti-therm(gls社制造),关于反应容器则使用1.5ml容量的玻璃小瓶,将反应液量设为400μl。反应液的组成为20μl经稀释的纯化酶、80μl纯化水、100μl的200mm乙酸缓冲液(ph5.5)、200μl的1质量%psa溶液。

在所有的测算中,将加入50mmtris-hcl缓冲液(ph8.0)代替纯化酶溶液并在同条件使其反应的混合液作为对照区。此外,底物溶液、以及纯化酶溶液和纯化水和缓冲液的混合液分别在反应温度下,各自保温(预培养)5分钟后进行混合,开始反应。对于psa,在20分钟的反应结束后,对于微晶纤维素,在60分钟的反应结束后,向各反应液加入等量的3,5-二硝基水杨酸试剂(dns溶液),在100℃下进行5分钟加热处理,在5分钟冰冷却后,以17500×g、5分钟在室温下进行离心分离处理,得到上清液。使用分光光度计,测量上清液中的还原糖量的540nm的吸光度,使用以葡萄糖制作的校准曲线进行计算,由与对照区的差求出通过酶的水解生成的还原糖量。将在1分钟生成1μmol的还原糖(reducedsugar)的酶活性设为1u,将其除以蛋白质量的值设为比活性(u/mg)。各测算通过三次独立的试验进行,求出平均值与标准误差(standarderrors)。

<9>ar19g-166c4a-19-2的温度依赖性

调查ar19g-166c4a-19-2的psa水解活性及微晶纤维素水解活性的温度依赖性。

具体而言,对于psa水解活性的温度依赖性的测定,除了将反应温度设为50、60、65、70、75、80、85、90、95、100、105或110℃以外,以与所述<8>相同的方式进行,求出通过酶的水解而生成的还原糖量,计算psa水解活性(u/mg)。

对于微晶纤维素水解活性的温度依赖性的测定,除了将反应温度设为50、60、70、75、80、85、90或99℃以外,以与所述<8>相同的方式进行,求出通过酶的水解而生成的还原糖量,计算微晶纤维素水解活性(u/mg)。

此外,对代替纯化水而加入10mmcacl2水溶液的反应液也进行相同测定,求出通过酶的水解而生成的还原糖量,计算psa水解活性(u/mg)与微晶纤维素水解活性(u/mg)。

进一步,作为比较对象,对不具有cbm部分的ar19g-166-qa进行相同的测定。

psa水解活性的测定结果如图3所示。ar19g-166c4a-19-2在温度范围50~105℃中表现出psa水解活性(图3)。尤其在存在钙离子时,即使在100~105℃中也表现出高psa水解活性。

表现出最高活性的最适温度(topt)在不存在钙离子时(图中“ar19g-166c4a-19-2”)与存在钙离子时(图中“ar19g-166c4a-19-2+ca2+”),分别为95℃与105℃。另一方面,ar19g-166-qa的最适温度在不存在钙离子时(图中“ar19g-166-qa”)与存在钙离子时(图中“ar19g-166-qa+ca2+”),分别为70℃与80℃。这些结果显示,通过cbm,psa分解活性的最适温度上升了25℃。

微晶纤维素水解活性的测定结果如图4所示。在ar19g-166c4a-19-2与ar19g-166-qa的两者中,无论有无钙离子,最适温度均为85℃。然而,在ar19g-166c4a-19-2中发现了微晶纤维素分解活性的大幅上升。ar19g-166-qa的最适温度85℃下的微晶纤维素分解活性的平均值在不存在钙离子时与存在钙离子时,分别为0.17±0.05u/mg与0.12±0.04u/mg,对此,在ar19g-166c4a-19-2中,分别为0.34±0.03u/mg与0.43±0.02u/mg。这些结果显示,通过cbm,微晶纤维素分解活性在不存在钙离子时上升至2倍,在存在钙离子时则上升至3.6倍。

<10>利用差示扫描荧光测定法(differentialscanningfluorimetry)的纤维二糖水解酶的热稳定性测定

差示扫描荧光测定法(dsf)是一种使用荧光色素与实时pcr装置的、测算蛋白质的热变性的方法之一,可应用于各种蛋白质。宝石橙蛋白染色试剂等用于dsf的荧光色素在与疏水性部位结合的非极性条件下发出荧光,另一方面,在溶于水的极性条件下抑制发光。通常,蛋白质在其热变性温度中折叠结构发生解聚,位于内部的疏水性部位暴露在蛋白质表面。若宝石橙蛋白染色试剂结合在该暴露的疏水性部位,则通过波长470~480nm的激发光,在波长595nm附近发出带有峰的强荧光。使蛋白质溶液的温度在一定间隔内逐步上升,通过测算荧光强度,计算出热变性温度(=荧光强度的变化点)。

测算中使用以水将由所述<7>中得到的纯化酶ar19g-166c4a-19-2调整至1mg/ml的纯化酶溶液,或以水将ar19g-166-qa调整至1mg/ml的纯化酶溶液。

具体而言,在96孔pcr板(multiplate96孔pcr板mll-9651,bio-rad社制造)的孔中,加入2μl经过100倍稀释的宝石橙蛋白染色试剂(lifetechnologiescorporation制造)、1μl浓度为1mg/ml的纯化酶溶液、5μl200mm乙酸缓冲液(ph6)、12μl纯化水或纯化水与10mmcacl2以2:1混合的溶液,使各孔的溶液体积为20μl。pcr板以平顶8联管盖(bio-rad社制造)密封,使用实时pcr装置(cfx96touch实时pcr系统,bio-rad社制造),以每次0.2℃,使孔的温度从30℃上升至100℃,在达到目标温度后再经过10秒钟后,同时测算各孔的荧光强度。通过波长带450~490nm的光的发光二极管(led)激发宝石橙蛋白染色试剂,宝石橙蛋白染色试剂放射光通过560~580nm范围的带通滤波器,用ccd相机进行荧光强度的测算,将荧光强度变化以温度的函数的形式而制图。将热变性温度(解链温度(meltingtemperature);tm值)定义为作为温度函数的荧光强度曲线的一阶微分(图5(b)的y轴上所示的“-d(荧光)/dt”)的极小值。使用实时pcr附带的分析软件cfxmanager(bio-rad社制造),进行数据分析,各测算通过3次独立的试验而进行,求出平均值及标准误差。

图5中示出了通过dsf法的测算的ar19g-166c4a-19-2及ar19g-166-qa的酶蛋白表现的伴随热变性而引起的宝石橙蛋白染色试剂的荧光强度变化。图5(a)为实测数据,图5(b)表示图5(a)的荧光强度变化曲线的一阶微分“-d(荧光)/dt。”

ar19g-166c4a-19-2(未添加cacl2)的荧光强度的一阶微分在93.0±0℃具有极小点,表示在该温度下发生热变性。该温度接近由psa水解活性求得的该酶的最适温度95℃。此外,在添加cacl2的条件下,即使到达100℃也未出现极小点,因此推测热变性温度为100℃以上。另一方面,ar19g-166-qa的热变性温度的平均值分别为75.3±0.1℃(未添加cacl2)与80.9±0.2℃(添加cacl2),显示出接近由psa水解活性求得的所述酶的最适温度70℃(未添加cacl2)与80℃(添加cacl2)的值。

<11>cbm区域带来的对纤维二糖水解酶活性的效果

为了对将ar19g-166c4a-19-2带有的cbm区域添加到其他酶时的效果进行确认,制作将所述cbm区域添加到ar19g-166-ra的状态的纤维二糖水解酶(ar19g-166c4a-19-2-1,序列号11),进行微晶纤维素分解活性的测定。使用quickchange单点突变试剂盒(quickchangesite-directedmutagenesiskit,agilenttechnologies社制造),将ar19g-166c4a-19-2的第462位的谷氨酰胺取代为精氨酸,制作ar19g-166c4a-19-2-1基因(序列号12)。具体而言,以ar19g-166c4a-19-2/plead5为模板,使用由序列号13所表示的碱基序列构成的突变诱导引物1及由序列号14所表示的碱基序列构成的突变诱导引物2,进行制作。ar19g-166c4a-19-2-1的表达与纯化以与所述<7>相同的方式进行,纤维二糖水解酶活性的温度依赖性以与所述<9>相同的方式进行。进一步,作为比较对象,对于不具有cbm的ar19g-166-ra,也进行相同的测定。

微晶纤维素分解活性的测算结果如图6所示。对于ar19g-166c4a-19-2-1,与不具有cbm的ar19g-166-ra相比,发现在60~85℃的范围,微晶纤维素分解活性的大幅上升。对于ar19g-166c4a-19-2-1的80℃下的微晶纤维素分解活性的平均值,在不存在钙离子与存在钙离子时,分别为0.26±0.06u/mg与0.31±0.01u/mg,对此,在ar19g-166-ra中,分别为0.06±0.06u/mg与0.10±0.01u/mg。这表示通过cbm,微晶纤维素分解活性上升至4.3倍(在存在钙离子时为3.1倍)。

如这些结果所示,通过将本发明的耐热性纤维二糖水解酶带有的cbm添加至其他纤维二糖水解酶中,能够使所述酶的纤维二糖水解酶活性上升。

序列表

<110>本田技研工业株式会社

<120>耐热性纤维二糖水解酶

<130>khp172110288.0

<160>13

<210>1

<211>102

<212>prt

<213>未知

<220>

<223>ar19g-166c4a-19-2的cbm

<400>1

cysglnvalsertyrthrvalalaasnglntrpproglyglyalathr

151015

valasnvalthrilethrasnthrthrserserproileasnglytrp

202530

thrleuglutrpasppheproasnproserglnglnilethrasnleu

354045

trpasnglysertyrserglnthrglyglnhisvalthrvalthrasn

505560

alaalatrpasnglythrileproalaglyserservalthrphegly

65707580

pheasnmetsertrpserglyserasnproalaproserserphethr

859095

leuasnglyglnprocys

100

<210>2

<211>306

<212>dna

<213>未知

<220>

<223>ar19g-166c4a-19-2的cbm

<400>2

tgccaggtgtcctacacggtagccaaccagtggcccggcggcgccaccgtgaacgtgaca60

attaccaacaccaccagcagccccatcaacggctggacgctggaatgggacttccccaac120

cccagccagcagatcaccaacctctggaacggctcctactcccaaaccggacagcacgtg180

acagtgaccaatgccgcctggaacggaacaatcccagccggcagctccgtaaccttcgga240

ttcaacatgagctggagcggatcgaacccggcgcccagcagcttcaccctgaacggacaa300

ccgtgc306

<210>3

<211>590

<212>prt

<213>未知

<220>

<223>ar19g-166c4a-19-2

<400>3

alacysglnvalsertyrthrvalalaasnglntrpproglyglyala

151015

thrvalasnvalthrilethrasnthrthrserserproileasngly

202530

trpthrleuglutrpasppheproasnproserglnglnilethrasn

354045

leutrpasnglysertyrserglnthrglyglnhisvalthrvalthr

505560

asnalaalatrpasnglythrileproalaglyserservalthrphe

65707580

glypheasnmetsertrpserglyserasnproalaproserserphe

859095

thrleuasnglyglnprocysglyglythralaglyglyglyprogln

100105110

prothrprothrprothrargthrprothrproalaalaprothrala

115120125

thrprothrprovalalaprothralathrprothrargthrprothr

130135140

prothrleuthrserthrproglyprothrprothrproproproser

145150155160

glythrhisleuaspasnpropheileglyalaileglytyrvalasn

165170175

proasptrpalathrasnvalileserglnalaasnglnthralaasp

180185190

prothrleualaalaglnmetarglysvalalathrtyrserthrala

195200205

valtrpleuaspargilealaalailethralaglyargglyleuarg

210215220

glyhisleuaspglualaleuargglnmetglnglnalaglyglnpro

225230235240

valvalilethrleuvaliletyraspleuproasnargaspcysser

245250255

alaalaalaserasnglygluleuleuvalalaglnasnglyleuala

260265270

argtyrlysalaglupheileaspproilevalalaileleuserasp

275280285

proargtyralaglyleuargilevalthrileilegluproaspser

290295300

leuproasnleuvalthrasnleuserileproalacysalagluala

305310315320

glnasnalatyrilegluglyileargtyralavalasnargleuarg

325330335

thrileproasnvaltyriletyrleuaspilealahisserglytrp

340345350

leuglytrpaspasnasnpheasnglyalavalasnleutyrthrgln

355360365

valvalglnglymetaspglnglypheasnserileaspglypheile

370375380

thrasnvalalaasntyrthrproleuglugluprotyrleuproasp

385390395400

proasnleuthrilealaglyglnprovalargseralaserphetyr

405410415

glutrpasnprotyrpheaspgluleuasptyralaleualaleuarg

420425430

asnalapheileglyargglypheproserthrileglymetleuile

435440445

aspthrserargasnglytrpglyglycyssertyrglyglncysarg

450455460

prothrglyproserseraspthrserservalasnalatyrvalasp

465470475480

glyserargvalaspargargtyrhisargglyasntrpcysasngln

485490495

alaglyglyileglygluargproglnalaalaproargserglyile

500505510

aspalatyrvaltrpvallysproproglygluseraspglyvalser

515520525

glnproglyilevalaspproaspaspproasnlyslyspheasppro

530535540

metcysaspproasnglyglnserargtyrasnseralatyrprothr

545550555560

glyalaleuproasnalaprohisalaglyargtrppheproglngln

565570575

phegluileleuvalargasnalatyrproproileglnpro

580585590

<210>4

<211>1773

<212>dna

<213>未知

<220>

<223>ar19g-166c4a-19-2

<400>4

gcctgccaggtgtcctacacggtagccaaccagtggcccggcggcgccaccgtgaacgtg60

acaattaccaacaccaccagcagccccatcaacggctggacgctggaatgggacttcccc120

aaccccagccagcagatcaccaacctctggaacggctcctactcccaaaccggacagcac180

gtgacagtgaccaatgccgcctggaacggaacaatcccagccggcagctccgtaaccttc240

ggattcaacatgagctggagcggatcgaacccggcgcccagcagcttcaccctgaacgga300

caaccgtgcggcggcaccgccggcggtggcccccagcccacccccacccccacgcgcacg360

cccacaccggcggcacctaccgccacccccacgccggtggcgcccaccgccacccccacc420

cgcacgcccacaccgacactcacctctacgccggggcctacaccaacgccacccccttca480

ggaacccatttggacaatccattcatcggagccatcggatacgtgaatccggactgggca540

accaatgtgatcagccaagcgaaccaaacggctgatccaaccttggcggctcaaatgcgt600

aaggtggccacctactccacagctgtctggttggatcgtatcgccgccatcaccgctggc660

cgcggattgcgcgggcatttggatgaagcactacgccaaatgcagcaagctggccagccg720

gttgtgatcacccttgtgatctatgatctgccaaatcgagattgctctgctgctgcctcc780

aatggcgaattactggtcgcccagaatggactggcccgctacaaagcggagttcatcgat840

cccatcgtagccattctctcagatccccgatatgccgggctacgcatcgtcaccatcatc900

gaaccggactccttacccaacctggtcacgaacctcagcatcccggcatgcgcagaagct960

cagaatgcatatatcgaagggatccgctatgcggtgaaccggctgcggacaattcccaac1020

gtctacatctatctggatatcgcccactcaggctggttgggctgggataataactttaat1080

ggggcagtaaatctctacacccaagttgtgcaaggaatggatcaagggtttaacagtatc1140

gatggattcatcaccaacgttgccaactatacccccctcgaagaaccctatttgcccgat1200

cccaacctgaccatcgctgggcaacccgttcgctctgccagcttctacgaatggaacccc1260

tactttgatgagctggattacgctctggctctgcgcaacgcttttatcggacgaggcttc1320

cccagcaccattgggatgctcatcgataccagccgaaacgggtggggcggatgcagctat1380

gggcaatgcaggcccacgggtcccagttcagataccagcagcgtgaatgcctacgtggac1440

ggctcgcgagtagaccgacgctatcatcggggcaactggtgtaaccaggcgggtgggatc1500

ggcgagcgccctcaggccgcaccgcggtccggtatcgacgcctacgtgtgggtgaaacca1560

cctggggagtccgatggggtcagccaacccgggatcgtcgatcccgacgatcccaacaag1620

aagttcgatcctatgtgtgatcccaacggacagagccggtataactccgcatacccaact1680

ggggctctgcccaacgcgccccacgctgggcggtggttcccgcagcagttcgaaatcctg1740

gtgcggaacgcctatccgccgatccaaccctaa1773

<210>5

<211>18

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>5

gcctgccaggtgtcctac18

<210>6

<211>22

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>6

ttagggttggatcggcggatag22

<210>7

<211>24

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>7

gtgatggcctgccaggtgtcctac24

<210>8

<211>33

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>8

atgcagagctcttagggttggatcggcggatag33

<210>9

<211>480

<212>prt

<213>小双孢菌亚种

<220>

<223>α-l-阿拉伯呋喃糖苷酶

<400>9

metseralaalaalavalalathrleuvalthralaalaalaglyval

151015

alaglythrhisalaalaseralaalaalaalaglycysglnvalthr

202530

tyrthrvalthrasnglntrpproglyglypheglythrasnvalthr

354045

ileserasnleuglyaspprovalasnglytrpargleuthrtrpser

505560

pheproalaglyglnthrvalthrglnleutrpasnglythrtyrthr

65707580

glnserglyserglnvalthrvalthrasnalasertyrasnalathr

859095

ileprothrglyglyserthrasnpheglypheasnglysertrpasn

100105110

glyserasnproalaproserserphealaleuasnglyvalthrcys

115120125

thrglyglyvalthrserprothrprothrprothrprothrprothr

130135140

prothrprothrprothrprothrprothrproserproserproser

145150155160

proserthrargglnprocysaspiletyralaserglyglythrpro

165170175

cysvalalaalahisserthrthrargalaleutyralaalatyrthr

180185190

glyproleutyrglnvalargargserseraspasnthrthrargasp

195200205

ileglyvalleuseralaglyglyvalalaaspseralaalaglnasp

210215220

serphecysalaasnthrasncysvalilethrvaliletyraspgln

225230235240

serglyargasnasnargleuthrglnalaproproglyglypheala

245250255

glyproalaalaglyglytyraspasnleualaaspalalysalaala

260265270

prothrthrvalglyglyhislysalatyrglyvaltyrvalalaala

275280285

glythrglytyrargasnasnalathrasnglyvalalalysglyasp

290295300

glnprogluglymettyralailepheaspglythrhistyrasngly

305310315320

glycyscyspheasptyrglyasnalagluthrasnserargaspasn

325330335

glyasnglythrmetglualailetyrpheglyasnilelysvaltrp

340345350

glytyrglythrglyasnglyprotrpilemetalaaspleugluasn

355360365

glyleupheserglyvalasnalaglytyrasnalaasnaspprothr

370375380

valasntyrargtyrleuthralaileilelysglygluserasnhis

385390395400

trpalaileargglyglyasnalaglnserglyglyleuserthrphe

405410415

tyraspglylysargproasnvalserglytyrasnprometlyslys

420425430

gluglyalaileileleuglyileglyglyaspasnserhisglyser

435440445

alaglythrphetyrgluglyvalmetthrserglytyrproserasp

450455460

alathrgluseralavalglnalaasnilevalalaalaglytyrarg

465470475480

<210>10

<211>427

<212>prt

<213>未知

<220>

<223>ar19g-166-qa

<400>10

leuaspasnpropheileglyalaileglytyrvalasnproasptrp

151015

alathrasnvalileserglnalaasnglnthralaaspprothrleu

202530

alaalaglnmetarglysvalalathrtyrserthralavaltrpleu

354045

aspargilealaalailethralaglyargglyleuargglyhisleu

505560

aspglualaleuargglnmetglnglnalaglyglnprovalvalile

65707580

thrleuvaliletyraspleuproasnargaspcysseralaalaala

859095

serasnglygluleuleuvalalaglnasnglyleualaargtyrlys

100105110

alaglupheileaspproilevalalaileleuseraspproargtyr

115120125

alaglyleuargilevalthrileilegluproaspserleuproasn

130135140

leuvalthrasnleuserileproalacysalaglualaglnasnala

145150155160

tyrilegluglyileargtyralavalasnargleuargthrilepro

165170175

asnvaltyriletyrleuaspilealahisserglytrpleuglytrp

180185190

aspasnasnpheasnglyalavalasnleutyrthrglnvalvalgln

195200205

glymetaspglnglypheasnserileaspglypheilethrasnval

210215220

alaasntyrthrproleuglugluprotyrleuproaspproasnleu

225230235240

thrilealaglyglnprovalargseralaserphetyrglutrpasn

245250255

protyrpheaspgluleuasptyralaleualaleuargasnalaphe

260265270

ileglyargglypheproserthrileglymetleuileaspthrser

275280285

argasnglytrpglyglycyssertyrglyglncysargprothrgly

290295300

proserseraspthrserservalasnalatyrvalaspglyserarg

305310315320

valaspargargtyrhisargglyasntrpcysasnglnalaglygly

325330335

ileglygluargproglnalaalaproargserglyileaspalatyr

340345350

valtrpvallysproproglygluseraspglyvalserglnprogly

355360365

ilevalaspproaspaspproasnlyslyspheaspprometcysasp

370375380

proasnglyglnserargtyrasnseralatyrprothrglyalaleu

385390395400

proasnalaprohisalaglyargtrppheproglnglnphegluile

405410415

leuvalargasnalatyrproproileglnpro

420425

<210>11

<211>590

<212>prt

<213>未知

<220>

<223>ar19g-166c4a-19-2-1

<400>11

alacysglnvalsertyrthrvalalaasnglntrpproglyglyala

151015

thrvalasnvalthrilethrasnthrthrserserproileasngly

202530

trpthrleuglutrpasppheproasnproserglnglnilethrasn

354045

leutrpasnglysertyrserglnthrglyglnhisvalthrvalthr

505560

asnalaalatrpasnglythrileproalaglyserservalthrphe

65707580

glypheasnmetsertrpserglyserasnproalaproserserphe

859095

thrleuasnglyglnprocysglyglythralaglyglyglyprogln

100105110

prothrprothrprothrargthrprothrproalaalaprothrala

115120125

thrprothrprovalalaprothralathrprothrargthrprothr

130135140

prothrleuthrserthrproglyprothrprothrproproproser

145150155160

glythrhisleuaspasnpropheileglyalaileglytyrvalasn

165170175

proasptrpalathrasnvalileserglnalaasnglnthralaasp

180185190

prothrleualaalaglnmetarglysvalalathrtyrserthrala

195200205

valtrpleuaspargilealaalailethralaglyargglyleuarg

210215220

glyhisleuaspglualaleuargglnmetglnglnalaglyglnpro

225230235240

valvalilethrleuvaliletyraspleuproasnargaspcysser

245250255

alaalaalaserasnglygluleuleuvalalaglnasnglyleuala

260265270

argtyrlysalaglupheileaspproilevalalaileleuserasp

275280285

proargtyralaglyleuargilevalthrileilegluproaspser

290295300

leuproasnleuvalthrasnleuserileproalacysalagluala

305310315320

glnasnalatyrilegluglyileargtyralavalasnargleuarg

325330335

thrileproasnvaltyriletyrleuaspilealahisserglytrp

340345350

leuglytrpaspasnasnpheasnglyalavalasnleutyrthrgln

355360365

valvalglnglymetaspglnglypheasnserileaspglypheile

370375380

thrasnvalalaasntyrthrproleuglugluprotyrleuproasp

385390395400

proasnleuthrilealaglyglnprovalargseralaserphetyr

405410415

glutrpasnprotyrpheaspgluleuasptyralaleualaleuarg

420425430

asnalapheileglyargglypheproserthrileglymetleuile

435440445

aspthrserargasnglytrpglyglycyssertyrglyargcysarg

450455460

prothrglyproserseraspthrserservalasnalatyrvalasp

465470475480

glyserargvalaspargargtyrhisargglyasntrpcysasngln

485490495

alaglyglyileglygluargproglnalaalaproargserglyile

500505510

aspalatyrvaltrpvallysproproglygluseraspglyvalser

515520525

glnproglyilevalaspproaspaspproasnlyslyspheasppro

530535540

metcysaspproasnglyglnserargtyrasnseralatyrprothr

545550555560

glyalaleuproasnalaprohisalaglyargtrppheproglngln

565570575

phegluileleuvalargasnalatyrproproileglnpro

580585590

<210>12

<211>1773

<212>dna

<213>未知

<220>

<223>ar19g-166c4a-19-2-1

<400>12

gcctgccaggtgtcctacacggtagccaaccagtggcccggcggcgccaccgtgaacgtg60

acaattaccaacaccaccagcagccccatcaacggctggacgctggaatgggacttcccc120

aaccccagccagcagatcaccaacctctggaacggctcctactcccaaaccggacagcac180

gtgacagtgaccaatgccgcctggaacggaacaatcccagccggcagctccgtaaccttc240

ggattcaacatgagctggagcggatcgaacccggcgcccagcagcttcaccctgaacgga300

caaccgtgcggcggcaccgccggcggtggcccccagcccacccccacccccacgcgcacg360

cccacaccggcggcacctaccgccacccccacgccggtggcgcccaccgccacccccacc420

cgcacgcccacaccgacactcacctctacgccggggcctacaccaacgccacccccttca480

ggaacccatttggacaatccattcatcggagccatcggatacgtgaatccggactgggca540

accaatgtgatcagccaagcgaaccaaacggctgatccaaccttggcggctcaaatgcgt600

aaggtggccacctactccacagctgtctggttggatcgtatcgccgccatcaccgctggc660

cgcggattgcgcgggcatttggatgaagcactacgccaaatgcagcaagctggccagccg720

gttgtgatcacccttgtgatctatgatctgccaaatcgagattgctctgctgctgcctcc780

aatggcgaattactggtcgcccagaatggactggcccgctacaaagcggagttcatcgat840

cccatcgtagccattctctcagatccccgatatgccgggctacgcatcgtcaccatcatc900

gaaccggactccttacccaacctggtcacgaacctcagcatcccggcatgcgcagaagct960

cagaatgcatatatcgaagggatccgctatgcggtgaaccggctgcggacaattcccaac1020

gtctacatctatctggatatcgcccactcaggctggttgggctgggataataactttaat1080

ggggcagtaaatctctacacccaagttgtgcaaggaatggatcaagggtttaacagtatc1140

gatggattcatcaccaacgttgccaactatacccccctcgaagaaccctatttgcccgat1200

cccaacctgaccatcgctgggcaacccgttcgctctgccagcttctacgaatggaacccc1260

tactttgatgagctggattacgctctggctctgcgcaacgcttttatcggacgaggcttc1320

cccagcaccattgggatgctcatcgataccagccgaaacgggtggggcggatgcagctat1380

gggcgatgcaggcccacgggtcccagttcagataccagcagcgtgaatgcctacgtggac1440

ggctcgcgagtagaccgacgctatcatcggggcaactggtgtaaccaggcgggtgggatc1500

ggcgagcgccctcaggccgcaccgcggtccggtatcgacgcctacgtgtgggtgaaacca1560

cctggggagtccgatggggtcagccaacccgggatcgtcgatcccgacgatcccaacaag1620

aagttcgatcctatgtgtgatcccaacggacagagccggtataactccgcatacccaact1680

ggggctctgcccaacgcgccccacgctgggcggtggttcccgcagcagttcgaaatcctg1740

gtgcggaacgcctatccgccgatccaaccctaa1773

<210>13

<211>30

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>13

atgcagctatgggcgatgcaggcccacggg30

<210>14

<211>30

<212>dna

<213>人工序列

<220>

<223>人工序列描述:引物.

<400>14

cccgtgggcctgcatcgcccatagctgcat30

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1