一种编码糖基水解酶家族9的纤维素酶的基因及其应用的制作方法

文档序号:455067阅读:290来源:国知局
专利名称:一种编码糖基水解酶家族9的纤维素酶的基因及其应用的制作方法
技术领域
本发明涉及一种新的编码糖基水解酶家族9的纤维素酶的基因,特别是涉及克隆自堆肥未培养微生物的一种新的编码糖基水解酶家族9的纤维素酶的基因,该基因编码的蛋白质可用于纤维素的降解。
背景技术
纤维素主要是植物用二氧化碳和水在太阳能作用下通过光合作用合成的地球上最丰富的可再生的生物质(biomass)资源。据报道,全球每年通过光合作用产生的纤维素高达1.55×109吨,其中89%尚未被人类利用(DunlapC.Chiang G C.Utilization and recycle of agriculture wastes and residues.ShulerM L.Boca Raton,Florida.USACRC Press Inc.1980.19)。纤维素是多个葡萄糖残基以β-1,4-糖苷链连接而成的多聚物,其基本重复单位为纤维二糖。天然纤维素的基本结构是由原纤维构成的微纤维束集合而成。原纤维是由15-40根有结晶区和非结晶区构成的纤维素分子长链所组成。纤维素的结晶部分是由纤维素分子进行非常整齐规划地折迭排列形成。在天然纤维素中,木质素和半纤维素形成牢固结合层,紧密地包围纤维素。纤维素酶是能将纤维素转化成葡萄糖的一系列酶的总称,包括三类酶即内切-β-1,4-葡聚糖酶(endo-β-1,4-glucanase,EC 3.2.1.4)、外切葡聚糖酶(exoglucanase,又叫纤维二糖水解酶cellobiohydrolase,EC3.2.1.91)和β-葡萄糖苷酶(β-glucosidase,EC3.2.1.21),这三种酶协同作用能将纤维素转化成葡萄糖。内切葡聚糖酶作用于纤维素长链分子的内部将长纤维切成短纤维,外切葡聚糖酶作用于纤维素分子的一端,以两个葡萄糖残基为单位进行切割生成纤维二糖,β-葡萄糖苷酶切割纤维二糖生成葡萄糖(Tomme P,Warren R A J,Gilkes N R.1995.Cellulose hydrolysis bybacteria and fungi.Adv.Microbiol.Physiol.,371-81.1995;BhatM K,Bhat S.1997.Cellulose degrading enzymes and their potentialindustrial applications.Biotechnology Advances,15583-620)。葡萄糖可作为重要的工业原料生产酒精、丙酮等化工产品。纤维素的利用与转化对于解决世界能源危机、粮食和饲料短缺、环境污染等问题具有重要意义。纤维素酶可广泛应用于酿酒、饲料、食品、纺织、造纸等行业。如纤维素酶作为饲料添加剂可增加饲料的可消化性,减少排泄的粪便量。纤维素酶可取代浮石进行牛仔裤的“石洗”处理,也可处理其它含纤维织物以降低粗糙度和增加光亮。纤维素酶可添加到洗涤剂中以提高洗涤剂的清洁能力(Bhat M K.2000.Cellulases and related enzymes inbiotechnology.Biotechnology Advances,18355-383)。由于纤维素酶的广泛用途以及针对不同的用途需要使用不同性质的纤维素酶,更由于纤维素酶的效率低、价格高而使以纤维素为原料生产燃料酒精的成本太高以至于无法真正实现产业化,因此,需要新的纤维素酶。
纤维素酶属于糖基水解酶类(glycosyl hydrolases),许多糖基水解酶由一个催化功能域和一个或更多个其它的功能域如碳水化合物结合组件(carbohydrate-bindingmodules,CBMs)组成,根据催化功能域的氨基酸序列相似性,糖基水解酶类被划分成不同的家族(families)(Davies G.,Henrissat B.1995.Structures and mechanisms of glycosyl hydrolases.Structure3853-859;Henrissat B.1991.A classification of glycosyl hydrolases based onamino-acid sequence similarities.Biochem.J.280309-316;Henrissat B.,Bairoch A.1993 New families in the classification of glycosyl hydrolases basedon amino-acid sequence similarities.Biochem.J.293781-788;Henrissat B.,Bairoch A.1996.Updating the sequence-based classification of glycosylhydrolases.Biochem.J.316695-696)。根据Expasy服务器(server)(http://www.expasy.org/cgi-bin/lists?glycosid.txt)上所列糖基水解酶类的最新清单,目前糖基水解酶类有68个家族,纤维素酶分属于糖基水解酶类家族3、5、6、7、8、9、12、44、45、48、61。将未知的纤维素酶与已知的纤维素酶做序列同源性比较可对其进行分类。
目前除Rees等(Rees HC,Grant S,Jones B,Grant WD,Heaphy S.2003.Detecting cellulase and esterase enzyme activities encoded by novel genespresent in environmental DNA libraries.Extremophiles.7(5)415-421)报道从湖水和湖床沉积物未培养微生物中克隆到2个纤维素酶基因CRATCEL和HKCEL以及Voget等(Voget S,Leggewie C,Uesbeck A,Raasch C,Jaeger KE,Streit WR.2003.Prospecting for novel biocatalysts in a soil metagenome.ApplEnviron Microbiol.,69(10)6235-6242)报道从土壤未培养微生物中克隆到2个纤维素酶基因gnuB和uvs080外,人类所克隆的所有其它纤维素酶基因都是从人类所培养的微生物中来的,但并不是自然界中所有微生物都是可以被分离、培养的,一般认为可培养的微生物种类只占自然界中微生物种类的1%(Amann R I,Ludwig W,Schleifer K H.1995.Phylogeneticidentification and in situ detection of individual microbial cells withoutcultivation.Microbiol.Rev.59143-169),那么剩余的99%的不可培养的微生物中蕴藏着大量的基因资源。近年来从环境样品未培养微生物提取基因组DNA然后构建混合基因组DNA文库以分离基因已是成熟技术(LorenzP.Schleper C.2002.Metagenome-a challenging source of enzyme discovery.Journal of Molecular Catalysis BEnzymatic 19-2013-19)。由于堆肥是纤维素等被活跃降解的地方,有大量的微生物在进行纤维素、半纤维素、果胶物质等的分解,但这些分解性的微生物只有极少部分已被培养,还有极大部分未被培养,这些未培养微生物中一定含有大量的基因资源如纤维素酶基因资源,其中很可能有些就是优于目前所发现的最好的纤维素酶的高效酶的基因。通过构建堆肥未培养微生物的混合基因组DNA文库,极有可能从中筛选得到比目前已知的最好的纤维素酶还要好的酶的基因。
本发明通过构建堆肥未培养微生物的混合基因组DNA文库和文库克隆的纤维素酶活性平板检测筛选法,得到了新的编码纤维素酶的基因,可在宿主细胞中大量表达该基因以生产该纤维素酶,用于纤维素的降解。

发明内容
本发明涉及一种新的编码纤维素酶的基因umce19A(SEQ ID NO2),其是从堆肥未培养微生物中分离得到。堆肥未培养微生物的DNA(SEQ ID NO1)由2200个碱基组成,含完整的纤维素酶基因umce19A,自5’端的第150-1997位核苷酸为umce19A的开放阅读框(Open Reading Frame,ORF),自5’端的第150-152位核苷酸为umce19A基因的起始密码子ATG,自5’端的第1998-2000位核苷酸为umce19A基因的终止密码子TAA。自5’端的第46-91位核苷酸为启动子;自5’端的第48-53位核苷酸为启动子的-35区;自5’端的第72-77位核苷酸为启动子的-10区;自5’端的第140-145位核苷酸为SD序列。携带该基因的质粒pGXN9001已在中国普通微生物菌种保藏管理中心保存,保存编号为CGMCC No.1039,保存日期为2003年11月24日,保藏的微生物为大肠埃希氏菌(Escherichiacoli)EPI100/pGXN9001。
SEQ ID NO3的蛋白质是基因umce19A编码的纤维素酶产物Umce19A,由616个氨基酸组成,自N端的第1-29位氨基酸为信号肽,自N端的第63-154位氨基酸为纤维素酶的N-末端类ig功能域(N-terminal ig-likedomain of cellulase),自N端的第162-611位氨基酸为家族9糖基水解酶(glycosyl hydrolase)功能域,和Umcel9A催化功能域同源性最高的为野油菜黄单胞菌野油菜致病变种(Xanthomonas campestrispv.campestris)的内切-1,4-β-D-葡聚糖酶前体EGL2(TrEMBL索引号Q9RBJ4;da Silva AC et al.2002,Comparison of the genomes of twoXanthomonas pathogens with differing host specificities.Nature.417459-463)的催化功能域(e-值为e-165),两者的相似性为75%、相同性为60%。
基因umce19A在大肠杆菌中表达的重组产物Umce19A能降解羧甲基纤维素。
本发明还涉及含有本发明基因的表达载体,及用于转化本发明基因的宿主。
本发明提供了一种新的纤维素酶基因,该基因所编码的纤维素酶在纤维素的降解中具有广泛的用途。


图1为从堆肥样品中提取的未培养微生物的混合基因组DNA。1λMix(片段大小从大到小依次为48.5kb,38.4kb,33.5kb,29.9kb,24.5kb,24.0kb,19.4kb,17.1kb,15.0kb,12.2kb,10.1kb,8.6kb,8.3kb);2BamHI酶切的混合基因组DNA;3未酶切的混合基因组DNA;4未酶切的λDNA(48.5kb)。
图2为堆肥未培养微生物基因文库克隆的限制性内切酶BamHI酶切分析以判断文库质量。M1λ/EcoRI(片段大小从大到小依次为21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);M21kb ladder(片段大小从大到小依次为10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);M3λ/HindIII(片段大小从大到小依次为23.1kb,9.4kb,6.6kb,4.4kb,2.3kb,2.0kb);其它泳道分别为文库克隆。
图3为堆肥未培养微生物基因文库克隆的筛选。
图4为能降解羧甲基纤维素的文库克隆质粒pGXN9001的BamHI酶切带型。1λ/EcoRI(片段大小从大到小依次为21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);21kb ladder(片段大小从大到小依次为10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);3pGXN9001/BamHI。
图5为初筛获得的重组质粒pGXN9001转化大肠杆菌后得到的转化子能降解羧甲基纤维素(右),而空载体pWEB∷TNC转化大肠杆菌后得到的转化子不能降解羧甲基纤维素(左)。
具体实施例方式
下述实施方式是为了更好的解释本发明,而不应被解释为限制本发明的目的。
在本发明的实施例中所用到的材料包括大肠杆菌(Escherichia coli)株系EPI100(属购自Epicentre公司的文库制备试剂盒pWEB∷TNC cosmidcloning kit(目录号WEBC931)的一个组分);载体为购自Epicentre公司的柯斯质粒载体pWEB∷TNC;购自Epicentre公司的文库制备试剂盒(pWEB∷TNC cosmid cloning kit,目录号WEBC931)和缺失柯斯质粒转座试剂盒(pWEB∷TNC deletion cosmid transposition kit,目录号WEBC942),购自Promega、Stratagene、SIGMA、QIAGEN的限制性内切酶、修饰酶等试剂。
实施例1.堆肥的堆制堆肥的堆制是在一个自制的1米×1米×1.2米的水泥槽中进行,该槽内置通风管道。管道和槽外的一个鼓风机相连。堆肥的配方为稻草,50kg;牛粪,50kg;猪粪,10kg;鸡粪,10kg;废报纸,5kg;农村堆肥,80kg;森林土,2.5kg;青草皮,5kg;果园土,2.5kg;菜园土,5kg;竹林土,5kg;酵母粉,0.065kg;硫酸铵,1kg;尿素,0.411kg;水,67kg。把稻草切成5cm左右长,按照上述配方称取各原材料,把除稻草以外的各配方材料混合均匀,然后再和稻草秸秆混匀,在此过程中添加适量的水,使堆肥的最终含水量控制在59%左右。混合均匀后装填堆肥发酵池。供气方式采用鼓风机强制通气,从发酵池底部供气。加水为从堆肥顶部淋适量的自来水。
实施例2.堆肥未培养微生物的基因组文库的构建取50g堆肥土壤,悬浮在100ml的0.18M磷酸钾缓冲液(pH7.2)中,充分混匀后在Beckman Coulter Avanti J-E离心机(购自Beckman Coulter公司,目录号369003)JA-10转头上用600g离心力离心10分钟,收集上清液,加入40ml PVPP(聚乙烯聚吡咯烷酮,polyvinylpolypyrrolidone)溶液(PVPP溶液每100mgPVPP(购自Sigma公司,目录号P-6755)与1ml0.18M磷酸钾缓冲液(pH7.2)混匀),振荡30秒,再加入200μl 3M CaCl2溶液,振荡30秒后,600g离心力离心5分钟,收集上清液于另一个离心管中。再用同样的离心机、转头用8000g离心力离心15分钟收集上清液中的细菌细胞。将收集到的菌体充分悬浮在1ml TE(10mM Tris/HCl,pH8.0,1mM EDTA,pH8.0)溶液中,加入100μl溶菌酶(20mg/ml,溶于TE溶液),在37℃下作用30分钟,在Eppendorf5417C离心机(购自Eppendorf公司,目录号19718)上以10000g离心1分钟以沉淀细胞,再将细胞充分悬浮在600μl PUREGENE公司的基因组DNA纯化试剂盒(Genomic DNAPurification Kit,目录号R-5500A)的细胞裂解缓冲液(Cell Lysis Solution)中,置80℃水浴锅5分钟以裂解细胞,待样品冷却到室温后,加入200μl上述试剂盒中的蛋白质沉淀溶液(Protein Precipitation Solution),充分混匀后13000g离心3分钟,将上清液转移到一个新的1.5ml微量离心管中,加入600μl 100%异丙醇,充分混匀后即见DNA絮状沉淀析出,挑出DNA絮状沉淀,用70%乙醇洗2次DNA,干燥后将DNA溶于500μl TE溶液即得DNA粗提物。
将DNA粗提物加到含有Sephadex G200(购自Pharmacia公司,目录号17-0080-01)和2%PVPP(购自Sigma公司,目录号P-6755)的层析柱(200mm×10mm)上,用TE缓冲液洗脱,按每组分1ml分部收集洗脱液,每一组分加入100μl的3M醋酸钠溶液(pH4.8)及1ml异丙醇沉淀DNA,把沉淀物溶于TE中,合并所得DNA溶液(见图1),0.7%琼脂糖凝胶电泳后切下含20kb以上的DNA的凝胶,用电洗脱法回收纯化DNA。为了用这些纯化的DNA制做基因文库,首先对这些DNA进行末端修补以产生平头末端而和文库制备试剂盒中已处理好的同样具平头末端的pWEB∷TNC载体相连,依次在冰上向一个新的灭过菌的微量离心管中加入6μl 10X末端修补缓冲液(330mM Tris-醋酸[pH7.8],660mM醋酸钾,100mM醋酸镁,5mMDTT),6μl 2.5mM dNTP混合物(每种2.5mM),6μl 10mM ATP,40μl DNA(0.2μg/μl),2μl末端修补酶混合物(T4 DNA聚合酶和T4多聚核苷酸激酶)。25℃下放置45分钟,再转移到70℃水浴锅放置10分钟以终止酶反应,1.0%低熔点琼脂糖凝胶电泳后切下含25kb-45kb的DNA的凝胶进行DNA回收,为了使回收片段与文库制备试剂盒中已处理好的具平头末端的载体在T4 DNA连接酶的作用下连接起来,依次在冰上向一个新的灭过菌的微量离心管中加入12μl无菌水,2μl 10倍快速连接缓冲液(10X Fast-Link Ligation Buffer),1μl 10mM ATP,1μlpWEB∷TNC载体(0.5μg),3μl低熔点琼脂糖凝胶回收的25kb-45kb的DNA(0.1μg/μl),1μl快速连接DNA连接酶(Fast-Link DNA Ligase,2单位/μl),混匀后在25℃下放置2个小时,再在70℃放置10分钟以终止酶反应。为了将连接反应产物用λ包装提取物(属购自Epicentre公司的文库制备试剂盒pWEB∷TNC cosmid cloning kit(目录号WEBC931)的一个组分)包装,将在冰上刚刚溶化的λ包装提取物(属购自Epicentre公司的文库制备试剂盒pWEB∷TNC cosmid cloning kit(目录号WEBC931)的一个组分)25μl立即转移到一个新的灭过菌的微量离心管中并快速置于冰上,再往其中加入10μl连接反应产物,充分混匀后置于30℃ 90分钟后,再往其中加入25μl溶化的λ包装提取物,充分混匀后置于30℃90分钟,向其中加入500μl噬菌体稀释缓冲液(10mM Tris-HCl[pH8.3],100mM NaCl,10mM MgCl2),再将该560μl包装反应产物加入到5.6mL的OD600=1.0的宿主大肠杆菌EPI100培养液(培养基为LB[每升含胰蛋白胨(Oxoid),10g;酵母浸出粉(Difco),5g;NaCl,5g;pH7.0]+10mM MgSO4)中,25℃下放置20分钟让上述得到的包装的λ噬菌体吸附和侵染宿主细胞E.coli EPI100,在含氨苄青霉素(100μg/mL)的LA平板上筛选转化子。结果共获得约10万个转化子,任意提取24个克隆的质粒DNA,限制性内切酶BamHI酶切后0.7%琼脂糖凝胶电泳分析,结果所有质粒除都有一个5.8kb的载体片段外,都含有插入片段,且没有发现有两个质粒具有相同的酶切带型(见图2),说明文库含有非常随机的插入DNA片段,插入片段最大的为44.2kb,最小的为20.0kb,平均大小为31.1kb。说明文库的克隆容量也是相当大的,文库的质量相当好。
实施例3.从堆肥未培养微生物的基因组文库中筛选表达纤维素酶活性的克隆用平板影印法将含氨苄青霉素的LA平板上得到的转化子(每平板约200个菌落左右)分别影印到含0.5%羧甲基纤维素(carboxylmethylcellulose,CMC)(购自Sigma公司,目录号C-5678)的LA平板、含氨苄青霉素(100μg/mL)的LA平板上,将平板倒置于37℃培养箱培养24小时后,将长满菌落的含氨苄青霉素的LA平板置于4℃冰箱保存,将长满菌落的含羧甲基纤维素的LA平板用0.5%刚果红溶液染色15分钟,用1M的NaCl溶液脱色15分钟,然后检测菌落周围有无水解圈(见图3),结果共筛选到4个菌落周围有水解圈的克隆,本发明只涉及其中一个克隆,进一步提取该克隆的质粒DNA并将其命名为pGXN9001,用限制性内切酶BamHI完全酶切pGXN900l后,进行0.7%琼脂糖凝胶电泳分析,结果pGXN9001除有一个5.8kb的载体片段外,还给出另外3条BamHI片段,大小分别为30kb、8.2kb和3.1kb(见图4),说明pGXN9001含有41.3kb的插入片段。
为了证实pGXN9001的插入片段确实含有纤维素酶基因,用pGXN9001质粒DNA和空载体pWEB∷TNC分别转化E.coliEPI100,在含氨苄青霉素(100μg/mL)的LA平板上筛选转化子,随机挑取由每个质粒转化得到的10个转化子点接到含0.5%羧甲基纤维素的LA平板上,37℃培养24小时后,用0.5%刚果红溶液染色15分钟,用1M的NaCl溶液脱色,然后观察菌落周围有无水解圈,结果所有10个由空载体pWEB∷TNC转化得到的转化子周围都没有水解圈,所有10个由pGXN9001转化得到的转化子周围都有水解圈,图5给出各一个转化子的检测结果。从而证明重组质粒pGXN9001的插入片段上确实含有纤维素酶基因。将重组质粒pGXN9001于2003年11月24日保存在中国普通微生物菌种保藏管理中心,保藏号为CGMCC No.1039。
实施例4、重组质粒pGXN9001上纤维素酶基因的测序为了测定重组质粒pGXN9001上纤维素酶基因的DNA序列,首先用Epicentre公司生产的缺失柯斯质粒转座试剂盒(pWEB∷TNC deletioncosmid transposition kit,目录号WEBC942)来获得pGXN9001沿着一个方向缺失不同长度的DNA的缺失克隆。为了这个目的,先进行体外转座反应,按顺序向一个新的灭过菌的EP管中加入1μl EZ∷TN 10倍反应缓冲液(0.5M Tris-醋酸(pH7.5),1.5M醋酸钾,100mM醋酸镁和40mM亚精胺)、1μl pGXN9001质粒DNA(0.2μg/μl)、7μl无菌水和1μl EZ∷TN转座酶,充分混匀后于37℃水浴保温2小时,再加入1μl EZ∷TN 10X终止溶液(1%SDS溶液),混匀后置70℃水浴10分钟。用1μl反应液转化E.coli EPI100,在含氨苄青霉素(50μg/mL)的LA平板上筛选转化子。再将转化子分别点接到含氨苄青霉素(50μg/mL)的LA平板、氯霉素(12μg/mL)LA平板上,筛选并留取氯霉素敏感、氨苄青霉素抗性的转化子,进一步将这些转化子点接到含0.5%羧甲基纤维素的LA平板上,检测哪些转化子能降解羧甲基纤维素和哪些不能,随机挑选一些转化子提取质粒,用BamHI、NotI进行酶切分析,从能降解羧甲基纤维素的转化子中选取一个最小的质粒(pGXN9001-G27)进行测序。对于不能降解羧甲基纤维素的转化子,其大小比pGXN9001小1.7kb的质粒,是因1.7kb氯霉素抗性基因转座过程中重组缺失造成的,而pGXN9001上的插入片段没有发生缺失,因而不予考虑,将其它质粒的大小和pGXN9001-G27进行比较,挑取大小和pGXN9001-G27比较接近的质粒进行测序。用双脱氧核苷酸法在ABI 377DNA自动测序仪(购自PE Biosystems公司,目录号100002252)上测定DNA核苷酸序列。用软件DNAStar(DNASTAR公司,版本5)对序列进行拼接,得到SEQ ID NO1的核苷酸序列,用NCBI(National Center forBiotechnology Information,http://www.ncbi.nlm.nih.gov)上的软件如ORFfinder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html),Blast(http://www.ncbi.nlm.nih.gov/BLAST)对DNA序列进行分析。
实施例5、纤维素酶基因umce19A的核苷酸序列分析
SEQ ID NO1的DNA的自5’端的第150-1997位核苷酸为基因umce19A的开放阅读框(open reading frame,ORF),由1848个核苷酸组成,自5’端的第150-152位核苷酸为umce19A基因的起始密码子ATG,自5’端的第1998-2000位核苷酸为umce19A基因的终止密码子TAA。在其推测的起始密码子ATG(核苷酸位置150)的上游相隔4bp处有一个潜在的核糖体结合位点(ribosome binding site,RBS,又叫Shine-Dalgarno序列)序列CGGAGA,该序列可使mRNA和细菌核糖体16S rRNA的3’端碱基互补配对。ORF在自5’端的第1998-2000位核苷酸为赭石(Ochre)终止密码子TAA。在其编码区上游,我们发现一个可能的启动子序列即自5’端的第46-91位核苷酸为启动子;自5’端的第48-53位核苷酸为启动子的-35区;自5’端的第72-77位核苷酸为启动子的-10区;即-35区为TTGATT,-10区为AAGGAT,两者相隔18bp,该序列和大肠杆菌的σ70所识别的保守的启动子序列(相隔17bp的TTGACA和TATAAT)非常相似。实施例6、纤维素酶基因umce19A编码的产物Umce19A的氨基酸序列分析纤维素酶基因umce19A编码一个含616个氨基酸的蛋白质,用DNAStar软件预测该蛋白质的理论分子量大小为66046.3道尔顿,等电点pI为5.36。
用简单组件结构研究工具(Simple Modular Architecture ResearchTool,SMART,http://smart.embl-heidelberg.de)分析由DNA序列推测的堆肥未培养微生物的纤维素酶Umce19A的组件结构,结果是自N端的第1-29位氨基酸为信号肽,自N端的第63-154位氨基酸为纤维素酶的N-末端类ig功能域(N-terminal ig-like domain of cellulase),自N端的第162-611位氨基酸为家族9糖基水解酶(glycosyl hydrolase)功能域。搜寻TrEMBL、PIR-PSD、SWISS-PROT和PDB数据库,发现Umce19A的家族9催化功能域和家族9的其它内切-β-1,4-葡聚糖酶的催化功能域具有一定的同源性,如和野油菜黄单胞菌野油菜致病变种的内切-1,4-β-D-葡聚糖酶前体EGL2(TrEMBL索引号Q9RBJ4)的催化功能域的相似性为75%、相同性为60%(e-值为e-165)。和Xanthomonasaxonopodis pv.citri的纤维素酶EGL2(TrEMBL索引号Q8PJK9)的催化功能域的相似性为75%、相同性为61%(e-值为e-164。和Pseudomonassp.SK38的内切-1,4-β-D-葡聚糖酶前体CEL9A(TrEMBL索引号Q9APG3)的催化功能域的相似性为71%、相同性为60%(e-值为e-154)。和Fibrobacter succinogenes的内切-1,4-β-D-葡聚糖酶CMCASE(TrEMBL索引号Q59442)的催化功能域的相似性为64%、相同性为48%(e-值为e-113)。和Pseudomonas fluorescens的内切葡聚糖酶A前体CELA(Swiss-Prot索引号P10476)的催化功能域的相似性为50%、相同性为34%(e-值为7e-66)。和Clostridium thermocellum的纤维素酶D(PIR-PSD索引号A65281,PDB索引号1CLC)的催化功能域的相似性为51%、相同性为32%(e-值为6e-69)。
纤维素酶Umce19A的纤维素酶N-末端类ig功能域(N-terminal ig-like domain of cellulase)和其它纤维素酶的N-末端类ig功能域具有一定的相似性,如和野油菜黄单胞菌野油菜致病变种的内切-1,4-β-D-葡聚糖酶前体EGL2(TrEMBL索引号Q9RBJ4)的N-末端类ig功能域的相似性为55%、相同性为38%(e-值为1e-10)和Clostridiumthermocellum的纤维素酶D(PIR-PSD索引号A65281,PDB索引号1CLC)的N-末端类ig功能域的相似性为52%、相同性为30%(预期值为0.001)。
SEQUENCE LISTING<110>广西大学<120>一种编码糖基水解酶家族9的纤维素酶的基因及其应用<130>I030469<160>3<170>Patent In version 3.1<210>1<211>2200<212>DNA<213>堆肥未培养微生物<220>
<221>启动子<222>(46)..(91)<223>
<220>
<221>CDS<222>(150)..(2000)<223>
<400>1ggtttcccgc tcacactcct ggtgcctgtt tttggcgtca ccacttcttg attttgctta 60aaccgggacg caaggatttt gcgtgccgct taatataagt ttgcgtagcg cagtcattac120aaacataacg aaattcacgc ggagacttt atg cta ata act aac aaa aaa att 173Met Leu Ile Thr Asn Lys Lys Ile1 5atg ttg ccg ggc ctg ggt aag gcg ctg gcg ttg gcc gga gta tcg agt 221Met Leu Pro Gly Leu Gly Lys Ala Leu Ala Leu Ala Gly Val Ser Ser10 15 20tta ctg ctc gca tgc ggt ggc ggc ggc ggt agt aat agc ggt tcg aca 269Leu Leu Leu Ala Cys Gly Gly Gly Gly Gly Ser Asn Ser Gly Ser Thr25 30 35 40ccg gga tca aaa agc gct gcg agc agt aaa gcg gtc agt tcc gtg gtg 317Pro Gly Ser Lys Ser Ala Ala Ser Ser Lys Ala Val Ser Ser Val Val45 50 55
gtt agt tct gcc ggg gtt agc tca gca gca agt tca agc gcg gcc ccc 365Val Ser Ser Ala Gly Val Ser Ser Ala Ala Ser Ser Ser Ala Ala Pro60 65 70aag ctg att aaa gtt aat caa ctc gga ttt ttg ccg gat tcc acc aag 413Lys Leu Ile Lys Val Asn Gln Leu Gly Phe Leu Pro Asp Ser Thr Lys75 80 85ttg tcc ttg gtc ccc gat gtg ccc gcg ccc cgt ttt caa gtg att caa 461Leu Ser Leu Val Pro Asp Val Pro Ala Pro Arg Phe Gln Val Ile Gln90 95 100gtg gat act gat caa gag gtt ctg agt ggc gat ttg act gct gcc act 509Val Asp Thr Asp Gln Glu Val Leu Ser Gly Asp Leu Thr Ala Ala Thr105 110 115 120cgt tgg gag ccc gca agc gat agc gta aaa ctg gct gat ttt tcc agc 557Arg Trp Glu Pro Ala Ser Asp Ser Val Lys Leu Ala Asp Phe Ser Ser125 130 135ctg aat gcg cca ggc gat tac ctg att cgc gtt gaa ggc ttg ccc gat 605Leu Asn Ala Pro Gly Asp Tyr Leu Ile Arg Val Glu Gly Leu Pro Asp140 145 150tcc cac cca ttc acc att gcc gag aat gcc tat gag tca tta ctc gct 653Ser His Pro Phe Thr Ile Ala Glu Asn Ala Tyr Glu Ser Leu Leu Ala155 160 165gcg agc atc aag gcc ttt tat ttc agt cgt tcg ggt aca gaa ttg tta 701Ala Ser Ile Lys Ala Phe Tyr Phe Ser Arg Ser Gly Thr Glu Leu Leu170 175 180gag gaa cat gct gga aaa ttt gct cgc cca ctc ggc cat gcc gac tcc 749Glu Glu His Ala Gly Lys Phe Ala Arg Pro Leu Gly His Ala Asp Ser85 190 195 200aat gta ttg att cat gag tca gca gcc agc gcc gct cgc ccg gct gga 797Asn Val Leu Ile His Glu Ser Ala Ala Ser Ala Ala Arg Pro Ala Gly205 210 215acc cca atc tcc agt ccc aag ggt tgg tat gac gca ggc gat tac aac 845Thr Pro Ile Ser Ser Pro Lys Gly Trp Tyr Asp Ala Gly Asp Tyr Asn220 225 230aag tac ata gtc aac tca gga atc tcg act tac acc ttg ctt gcc acc 893Lys Tyr Ile Val Asn Ser Gly Ile Ser Thr Tyr Thr Leu Leu Ala Thr235 240 245
tac gag cac ttc ccc gaa ttg ttt gcc gat caa aac ctg gca atc ccc941Tyr Glu His Phe Pro Glu Leu Phe Ala Asp Gln Asn Leu Ala Ile Pro250 255 260gaa agc acc aat tca ttg cct gat ctg ctg gat gag atc aaa tgg aat989Glu Ser Thr Asn Ser Leu Pro Asp Leu Leu Asp Glu Ile Lys Trp Asn265 270 275 280ctc gac tgg atg ctg act atg caa gac cca gct gac ggt ggg gtt tat1037Leu Asp Trp Met Leu Thr Met Gln Asp Pro Ala Asp Gly Gly Val Tyr285 290 295cac aag ctg acc aac aaa aat ttt gat ggc acg gtt atg ccg cac cag1085His Lys Leu Thr Asn Lys Asn Phe Asp Gly Thr Val Met Pro His Gln300 305 310gca act agc ccg cgt tat gtg gtg cag aaa acc act gct gct gct ttg1133Ala Thr Ser Pro Arg Tyr Val Val Gln Lys Thr Thr Ala Ala Ala Leu315 320 325aat ttc gct gcg gta atg gcg act gcg agc cgg gtg ttt gcc gct cag1181Asn Phe Ala Ala Val Met Ala Thr Ala Ser Arg Val Phe Ala Ala Gln330 335 340gat gaa aca cta gcg caa caa atg tta gat gcg gct gaa gct gcc tgg1229Asp Glu Thr Leu Ala Gln Gln Met Leu Asp Ala Ala Glu Ala Ala Trp345 350 355 360gct tgg gct aaa gcc aat cct tca att act tat acc cag cct gcg gat1277Ala Trp Ala Lys Ala Asn Pro Ser Ile Thr Tyr Thr Gln Pro Ala Asp365 370 375ata aaa acc ggt gaa tac ggg gac agc aat ctc gcc gat gaa ttt gcc1325Ile Lys Thr Gly Glu Tyr Gly Asp Ser Asn Leu Ala Asp Glu Phe Ala380 385 390tgg gct gcg gcg gag tta tat atc acc act aag aag gat gat tac tac1373Trp Ala Ala Ala Glu Leu Tyr Ile Thr Thr Lys Lys Asp Asp Tyr Tyr395 400 405acc gaa atc aaa cca aat caa act tac aac acg gtt ccc tcc tgg ggg1421Thr Glu Ile Lys Pro Asn Gln Thr Tyr Asn Thr Val Pro Ser Trp Gly410 415 420gat gtg cgc ggc ctg gcc tgg gtg tca ctc gct cat cat cgc gag caa1469Asp Val Arg Gly Leu Ala Trp Val Ser Leu Ala His His Arg Glu Gln425 430 435 440tta acg aca gca gca gat aaa gct ttg atc ggc aca cgt att gaa agc1517
Leu Thr Thr Ala Ala Asp Lys Ala Leu Ile Gly Thr Arg Ile Glu Ser445 450 455ctg gcg aat aat ctt ttg tcg gta tgg aaa ctt tca ccg tac aaa atc1565Leu Ala Asn Asn Leu Leu Ser Val Trp Lys Leu Ser Pro Tyr Lys Ile460 465 470acc atg cag aac agc gat ttt gta tgg ggc agc aat gca gtg gtg ctg1613Thr Met Gln Asn Ser Asp Phe Val Trp Gly Ser Asn Ala Val Val Leu475 480 485aat cag gcg atg atg ctg gtg cag gcg tac cga cta aac ggc aag cgc1661Asn Gln Ala Met Met Leu Val Gln Ala Tyr Arg Leu Asn Gly Lys Arg490 495 500gag ttt ctg gat gct gcg caa tca cag ctg gat tac gtg ttg ggt cgc1709Glu Phe Leu Asp Ala Ala Gln Ser Gln Leu Asp Tyr Val Leu Gly Arg505 510 515 520aat gca gtg gac aca tca ttt gtg acc ggc ttt ggt cac aag tcg ccg1757Asn Ala Val Asp Thr Ser Phe Val Thr Gly Phe Gly His Lys Ser Pro525 530 535ctc cat ccg cac cat cgc ccc tct gaa gca gac ggg att gcg gag ccg1805Leu His Pro His His Arg Pro Ser Glu Ala Asp Gly Ile Ala Glu Pro540 545 550atc cca ggt tat gtt gtt ggt ggt ccg caa ccg ggg cag cag gat aaa1853Ile Pro Gly Tyr Val Val Gly Gly Pro Gln Pro Gly Gln Gln Asp Lys555 560 565gcg gat tgc ccc ctt gct tat ccg agc aat atc acc gct aaa tcc tat1901Ala Asp Cys Pro Leu Ala Tyr Pro Ser Asn Ile Thr Ala Lys Ser Tyr570 575 580ctc gat cat tac tgt agt tat gcg agt aat gag att gcg atc aac tgg1949Leu Asp His Tyr Cys Ser Tyr Ala Ser Asn Glu Ile Ala Ile Asn Trp585 590 595 600aac gcg ccc ctt gta tat gtg act gca gcc atc cag gcg ctg acc aag1997Asn Ala Pro Leu Val Tyr Val Thr Ala Ala Ile Gln Ala Leu Thr Lys605 610 615taa tttcaaaaat gtttttgatt ctttaacgcc agctttttgc tggcgttttt 2050tttaaattcc tgatgacaat tactgttcgg aagttgtcta taaaactggc tttatccttt 2110catgactgat catcgatcgc agtaggcgtt tataacacct gatcccgtca accttcattc 2170
gggagaaaca ccatgcaagc ctgcgcaata 2200<210>2<211>1851<212>DNA<213>堆肥未培养微生物<400>2atgctaataa ctaacaaaaa aattatgttg ccgggcctgg gtaaggcgct ggcgttggcc60ggagtatcga gtttactgct cgcatgcggt ggcggcggcg gtagtaatag cggttcgaca 120ccgggatcaa aaagcgctgc gagcagtaaa gcggtcagtt ccgtggtggt tagttctgcc 180ggggttagct cagcagcaag ttcaagcgcg gcccccaagc tgattaaagt taatcaactc 240ggatttttgc cggattccac caagttgtcc ttggtccccg atgtgcccgc gccccgtttt 300caagtgattc aagtggatac tgatcaagag gttctgagtg gcgatttgac tgctgccact 360cgttgggagc ccgcaagcga tagcgtaaaa ctggctgatt tttccagcct gaatgcgcca 420ggcgattacc tgattcgcgt tgaaggcttg cccgattccc acccattcac cattgccgag 480aatgcctatg agtcattact cgctgcgagc atcaaggcct tttatttcag tcgttcgggt 540acagaattgt tagaggaaca tgctggaaaa tttgctcgcc cactcggcca tgccgactcc 600aatgtattga ttcatgagtc agcagccagc gccgctcgcc cggctggaac cccaatctcc 660agtcccaagg gttggtatga cgcaggcgat tacaacaagt acatagtcaa ctcaggaatc 720tcgacttaca ccttgcttgc cacctacgag cacttccccg aattgtttgc cgatcaaaac 780ctggcaatcc ccgaaagcac caattcattg cctgatctgc tggatgagat caaatggaat 840ctcgactgga tgctgactat gcaagaccca gctgacggtg gggtttatca caagctgacc 900aacaaaaatt ttgatggcac ggttatgccg caccaggcaa ctagcccgcg ttatgtggtg 960cagaaaacca ctgctgctgc tttgaatttc gctgcggtaa tggcgactgc gagccgggtg 1020tttgccgctc aggatgaaac actagcgcaa caaatgttag atgcggctga agctgcctgg 1080gcttgggcta aagccaatcc ttcaattact tatacccagc ctgcggatat aaaaaccggt 1140gaatacgggg acagcaatct cgccgatgaa tttgcctggg ctgcggcgga gttatatatc 1200
accactaaga aggatgatta ctacaccgaa atcaaaccaa atcaaactta caacacggtt 1260ccctcctggg gggatgtgcg cggcctggcc tgggtgtcac tcgctcatca tcgcgagcaa 1320ttaacgacag cagcagataa agctttgatc ggcacacgta ttgaaagcct ggcgaataat 1380cttttgtcgg tatggaaact ttcaccgtac aaaatcacca tgcagaacag cgattttgta 1440tggggcagca atgcagtggt gctgaatcag gcgatgatgc tggtgcaggc gtaccgacta 1500aacggcaagc gcgagtttct ggatgctgcg caatcacagc tggattacgt gttgggtcgc 1560aatgcagtgg acacatcatt tgtgaccggc tttggtcaca agtcgccgct ccatccgcac 1620catcgcccct ctgaagcaga cgggattgcg gagccgatcc caggttatgt tgttggtggt 1680ccgcaaccgg ggcagcagga taaagcggat tgcccccttg cttatccgag caatatcacc 1740gctaaatcct atctcgatca ttactgtagt tatgcgagta atgagattgc gatcaactgg 1800aacgcgcccc ttgtatatgt gactgcagcc atccaggcgc tgaccaagta a 1851<210>3<211>616<212>PRT<213>堆肥未培养微生物<400>3Met Leu Ile Thr Asn Lys Lys Ile Met Leu Pro Gly Leu Gly Lys Ala1 5 10 15Leu Ala Leu Ala Gly Val Ser Ser Leu Leu Leu Ala Cys Gly Gly Gly20 25 30Gly Gly Ser Asn Ser Gly Ser Thr Pro Gly Ser Lys Ser Ala Ala Ser35 40 45Ser Lys Ala Val Ser Ser Val Val Val Ser Ser Ala Gly Val Ser Ser50 55 60Ala Ala Ser Ser Ser Ala Ala Pro Lys Leu Ile Lys Val Asn Gln Leu65 70 75 80
Gly Phe Leu Pro Asp Ser Thr Lys Leu Ser Leu Val Pro Asp Val Pro85 90 95Ala Pro Arg Phe Gln Val Ile Gln Val Asp Thr Asp Gln Glu Val Leu100 105 110Ser Gly Asp Leu Thr Ala Ala Thr Arg Trp Glu Pro Ala Ser Asp Ser115 120 125Val Lys Leu Ala Asp Phe Ser Ser Leu Asn Ala Pro Gly Asp Tyr Leu130 135 140Ile Arg Val Glu Gly Leu Pro Asp Ser His Pro Phe Thr Ile Ala Glu145 150 155 160Asn Ala Tyr Glu Ser Leu Leu Ala Ala Ser Ile Lys Ala Phe Tyr Phe165 170 175Ser Arg Ser Gly Thr Glu Leu Leu Glu Glu His Ala Gly Lys Phe Ala180 185 190Arg Pro Leu Gly His Ala Asp Ser Asn Val Leu Ile His Glu Ser Ala195 200 205Ala Ser Ala Ala Arg Pro Ala Gly Thr Pro Ile Ser Ser Pro Lys Gly210 215 220Trp Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Ile Val Asn Ser Gly Ile225 230 235 240Ser Thr Tyr Thr Leu Leu Ala Thr Tyr Glu His Phe Pro Glu Leu Phe245 250255Ala Asp Gln Asn Leu Ala Ile Pro Glu Ser Thr Asn Ser Leu Pro Asp260 265 270
Leu Leu Asp Glu Ile Lys Trp Asn Leu Asp Trp Met Leu Thr Met Gln275 280 285Asp Pro Ala Asp Gly Gly Val Tyr His Lys Leu Thr Asn Lys Asn Phe290 295 300Asp Gly Thr Val Met Pro His Gln Ala Thr Ser Pro Arg Tyr Val Val305 310 315 320Gln Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Met Ala Thr325 330 335Ala Ser Arg Val Phe Ala Ala Gln Asp Glu Thr Leu Ala Gln Gln Met340 345 350Leu Asp Ala Ala Glu Ala Ala Trp Ala Trp Ala Lys Ala Asn Pro Ser355 360 365Ile Thr Tyr Thr Gln Pro Ala Asp Ile Lys Thr Gly Glu Tyr Gly Asp370 375 380Ser Asn Leu Ala Asp Glu Phe Ala Trp Ala Ala Ala Glu Leu Tyr Ile385 390 395 400Thr Thr Lys Lys Asp Asp Tyr Tyr Thr Glu Ile Lys Pro Asn Gln Thr405 410 415Tyr Asn Thr Val Pro Ser Trp Gly Asp Val Arg Gly Leu Ala Trp Val420 425 430Ser Leu Ala His His Arg Glu Gln Leu Thr Thr Ala Ala Asp Lys Ala435 440 445Leu Ile Gly Thr Arg Ile Glu Ser Leu Ala Asn Asn Leu Leu Ser Val450 455 460Trp Lys Leu Ser Pro Tyr Lys Ile Thr Met Gln Asn Ser Asp Phe Val
465 470 475 480Trp Gly Ser Asn Ala Val Val Leu Asn Gln Ala Met Met Leu Val Gln485 490 495Ala Tyr Arg Leu Asn Gly Lys Arg Glu Phe Leu Asp Ala Ala Gln Ser500 505 510Gln Leu Asp Tyr Val Leu Gly Arg Asn Ala Val Asp Thr Ser Phe Val515 520 525Thr Gly Phe Gly His Lys Ser Pro Leu His Pro His His Arg Pro Ser530 535 540Glu Ala Asp Gly Ile Ala Glu Pro Ile Pro Gly Tyr Val Val Gly Gly545 550 555 560Pro Gln Pro Gly Gln Gln Asp Lys Ala Asp Cys Pro Leu Ala Tyr Pro565 570 575Ser Asn Ile Thr Ala Lys Ser Tyr Leu Asp His Tyr Cys Ser Tyr Ala580 585 590Ser Asn Glu Ile Ala Ile Asn Trp Asn Ala Pro Leu Val Tyr Val Thr595 600 605Ala Ala Ile Gln Ala Leu Thr Lys610 61权利要求
1.一种编码纤维素酶的基因,其特征在于具有SEQ ID NO2的核苷酸序列或其同源序列。
2.权利要求1的基因,其中所述同源序列与SEQ ID NO2的核苷酸序列具有80%以上的同源性。
3.一种权利要求1的基因所编码的蛋白质,其特征在于具有SEQ ID NO3的氨基酸序列。
4.一种表达载体,其特征在于含有权利要求1所述的基因。
5.一种宿主细胞,其特征在于含有权利要求1所述的基因。
6.权利要求3所述的蛋白质在纤维素降解和对含纤维素材料的处理中的应用。
全文摘要
本发明涉及一种编码纤维素酶的基因umcel9A,其特征在于含有SEQID NO2的核苷酸序列或其同源序列,其中所述同源序列具有与SEQ ID NO2的核苷酸序列80%以上的同源性。本发明还涉及该基因编码的纤维素酶(SEQ ID NO3)及该酶在降解纤维素中的应用。
文档编号C12S3/00GK1621525SQ200310116908
公开日2005年6月1日 申请日期2003年11月28日 优先权日2003年11月28日
发明者冯家勋, 庞浩, 张鹏, 靳振江, 李诚斌, 段承杰, 唐纪良 申请人:广西大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1