新的纤维素酶及其应用的制作方法

文档序号:434023阅读:492来源:国知局

专利名称::新的纤维素酶及其应用的制作方法
技术领域
:本发明涉及生物领域。更具体地,本发明涉及一种新的纤维素酶、编码该酶的多核苷酸和经DNA重组技术产生这种酶的方法。本发明还涉及含该纤维素酵的载体和宿主细胞及其在生产简单糖和葡萄糖方面的用途。
背景技术
:纤维素是自然界最丰富的可再生的能源。将未经任何化学处理的纤维素生物转化成简单糖或葡萄糖,作为发酵碳源生产酒精,是最理想和有效利用天然纤维素资源的方法之一。通常认为,生物转化纤维素生成葡萄糖至少需要三种不同的酶的协同作用(l)葡聚糖内切酶(Endo-l,4-p-D-glucanase,E.C.3.2丄4,也称之为纤维素内切酶)。它作用于纤维素的非结晶区,随机水解p-l,4-糖苷键生成带非还原端的较短的寡聚糖,(2)葡聚糖外切酶(Exo-l,4-P-D-glucanase,E.C.3.2丄91),它作用于纤维素分子的非还原末端水解P-l,4-糖苷键产生纤维二糖,(3)(3-葡萄糖苷酶(p-D-glucosidase,E.C.3.2丄21),它将纤维二糖水解为葡萄糖。目前,研究较为集中的是真菌和细菌的纤维素酶系。丝状真菌中的李氏木霉(T./"ee化z')和绿色木霉(T.wWde)以及热纤梭菌(C.Aenwoce〃w/n)和ce〃"/omwjos^n/等物种的纤维素酶系较复杂,有多种亚类的内切酶,外切酶及葡萄糖苷酶[ThomasM.Wood,股ochemical.SocietyTransactions.1992,20,46-53],例如绿色木霉有6种亚型的内切酶[Beldman,G.etalEur.J.股ochem.1985,146:301-308]。热纤梭菌的纤维素酶需要同多个蛋白质形成分子量巨大的纤维体(Cellulosome)才能起催化反应[FelixC.RandL.G丄jiungdahl,Annu.Rev.Microbiol.1993,47:791-819],显然这样复杂的酶系必然会给研究和应用带来极大的困难。另一方面,纯化的单一组分的内切酶和外切酶要么不能水解未经化学处理的天然纤维素生成简单糖,要么水解活力极低,如李氏木霉(T.A"ee^0的纤维素酶系统中至少需14类纤维素酶的协同作用才能水解将未经化学处理的植物纤维。传统的观点认为动物没有自己的纤维素酶系,需依赖共生菌的纤维素酶将纤维素水解成单糖,供生命活动需要。但是90年代末发现了白蚁和小龙虾内在的纤维素内切酶[Hirofiimi,W.Gaku,T,nathan,LNature,1998,394:330-33l;KerenA.B.etal"Gene,1999,239,317-324]。此外,在拟南芥中也发现了12种内切酶基因[delCompillo,Curr.Top.Dev.Boil.1999,46:39-61]。动物纤维素酶可能成为新的应用研究的热点。在地球上每年由固定CO2的光合作用就能形成100亿吨以是上的干植物物质,其中这些物质的组成一半以上是由纤维素,其次是半纤维素(主要由木聚糖所构成)。如果再加上人类活动所造成的废弃的纤维素,如稻草,麦秸等,其存在量则要以天文数字来计算。如何釆用生物技术综合利用植物干物质或废弃的纤维素的问题上,纤维素酶起着关键作用。有效地将这些天然的纤维素转化为简单糖是纤维素作为再生能源的关键。目前的纤维素酶还远不能适应将植物纤维素转化为简单糖作为再生能源的需求。因此,本领域迫切需要开发不同来源的具有能高效率水解纤维素的新的纤维素酶,以及新的生产葡萄糖的工艺。
发明内容本发明的目的就是提供一种新的纤维素酶以及其片段、类似物和衍生物,及其编码序列。本发明的另一目的是提供生产纤维素酶的方法以及其用途。本发明的另一目的是提供新的生产简单糖和葡萄糖的工艺。本发明一方面提供一种分离的纤维素酶,该纤维素酶选自(a)具有SEQIDNO:2第1-713位氨基酸序列的多肽;(b)具有SEQIDNO:4第l-723位氨基酸序列的多肽;(c)具有SEQIDNO:6第l-722位氨基酸序列的多肽;(d)具有SEQIDNO:8、9、10、11或12所述多核苷酸序列编码的氨基酸序列的多肽;(e)将SEQIDNO:2、4、6的氨基酸序列或(d)的氨基酸序列经过1-10个氨基酸残基的取代、缺失或添加而形成的,且具有纤维素酶功能的由(a)、(b)、(c)或(d)衍生的多肽。在一个优选实施例中,所述纤维素酶的氨基酸序列为SEQIDNO:2、4或6所示的氨基酸序列。本发明另一方面涉及一种分离的多核苷酸,该多核苷酸选自(a)编码本发明分离的纤维素酶的多核苷酸;(b)在严格条件下与(a)所述多核苷酸序列杂交且编码具有纤维素酶活性的蛋白质的多核苷酸。在一个优选的实施例中,所述纤维素酶选自((a)具有SEQIDNO:2第1-713位氨基酸序列的多肽;(b)具有SEQIDNO:4第l-723位氨基酸序列的多肽;(c)具有SEQIDNO:6第l-722位氨基酸序列的多肽;(d)具有SEQIDNO:8、9、10、11或12所述多核苷酸序列编码的氨基酸序列的多肽;(e)将SEQIDNO:2、4、6的氨基酸序列或(d)的氨基酸序列经过l-10个氨基酸残基的取代、缺失或添加而形成的,且具有纤维素酶功能的由(a)、(b)、(c)或(d)衍生的多肽。在另一优选实施例中,所述的多核苷酸选自下组(i)具有SEQIDNO:1中1-2142位的核苷酸序列;(ii)具有SEQIDNO:3中1-2172位的核苷酸序列;(iii)具有SEQIDNO:5中卜2169位的核苷酸序列;(iv)具有SEQIDNO:8中1-2172位的核苷酸序列;(v)具有SEQIDNO:9中1-2172位的核苷酸序列;(vi)具有SEQIDNO:10中l-2169位的核苷酸序歹ij;(vii)具有SEQIDNO:11中1-2169位的核苷酸序列;或(viii)具有SEQIDNO:12中1-2169位的核苷酸序列;在另一方面,本发明涉及一种含有本发明多核苷酸序列的重组表达载体。在另一方面,本发明涉及一种含有本发明重组载体的转化的宿主细胞。在又一方面,本发明涉及一种制备本发明纤维素酶的方法,该方法包含(a)在适合表达所述纤维素酶的条件下,培养本发明所述的宿主细胞;和(b)从培养物中分离出所述的纤维素酶。又一方面,本发明涉及所述的纤维素酶用于生产简单糖的工艺,所述的简单糖是纤维二糖、葡萄糖及其混合物中的用途。本发明还涉及一种生产简单糖的方法,该方法包括步骤(a)用本发明所述的纤维素酶或宿主细胞处理纤维素,从而产生简单糖;(b)分离出所述的简单糖,所述的简单糖包括纤维二糖、葡萄糖及其混合物。所述的纤维素材料是未经任何化学预处理的纤维素材料。本发明还涉及一种提高本发明纤维素酶的酶活力的方法,该方法包括用含N03-、HS03—、S042—、S2032—、Mn2+、06115073-或£0丁八的溶液处理所述纤维素酶,从而提高其酶活力。本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。图1显示从软体动物福寿螺(^^"//0^^0^")的胃液中分离纯化到的纤维素酶的组份的SDS-PAGE结果。图中,泳道"M"表示分子质量标准,包括兔磷酸化酶B(97.4kD)、牛血清白蛋白(66.2kD)、兔肌动蛋白(43.0kD)、牛碳酸酐酶(31.0kD)和胰蛋白酶抑制剂(20.1kD)。泳道1为纯化的纤维素酶EG65。图2A显示EG65在15。C在不同pH中培养不同时间所得的相对活力(%)。图2B显示RG65在5(TC在不同pH中培养15分钟的相对活力(Q/。)。图3显示在5(TC测量的纯化的EG65在不同时间的相对酶活性。图4显示甲醇酵母表达载体pPIC9K,共9276个核苷酸,其中,5'AOXl启动子片段第l-948核苷酸碱基;5'AOXl引物位点第855-875位碱基;a-因子分泌信号第949-1218位碱基;a-因子引物位点第1152-1172位碱基;多克隆位点第1216-1241位碱基3'AOXl引物位点第1327-1347位碱基;3'AOXl转录终止(TT):第1253-1286位碱基;HIS4ORF:第4514-1980位碱基;卡那霉素抗性基因(Kanamycin):第5743-4928位碱基;3'AOXl片段第6122-6879位碱基;pBR322起点第7961-7288位碱基;氨苄青霉素抗性基因(Ampicillin):第8966-8106位碱基。图5显示用引物Fl和Rl扩增得到的cDNA片段及其预测的氨基酸序列。图6显示eg65-a、eg65-b、eg65-c的图谱及测序策略。图7显示EG65-a、EG65-b、EG65-c蛋白的同源性比较。图8显示EG-65a的氨基酸序列与其它纤维素酶的氨基酸序列的比较结果。其中,Termite.1:家白蚁(Coptotoroes/0/7nosa"MS,BAB40697);Termite.2:达尔文澳白蚁(Mw她/w51c/a簡'm',/s,CAD54729);Crayfish:鳌虫下(C7zera;n:,dr/cflr!'wfl加,AA061672);Acray;ye。"EG65-a;Haliotis:自鲍鱼(7/a//0^cfoow,BAC67186)。图9显示EG65-a、EG65-b和EG65-c的结构域。途中,"Glyco—hydro—9"表示糖苷水解酶第9家族。图10A-10F显示采用NetNGlyc1.0进行的EG65-a、EG65-b和EG65-c的0-糖基化和N-糖基化预测,其中图10A-10C分别显示EG65-a、EG65-b和EG65-c的0-糖基化预测位点,而图10D-10F分别显示EG65-a、EG65-b和EG65-c的N-糖基化预测位点。图llA-llC分别显示EG65-a、EG65-b和EG65-c的SignalP-NN预测结果。图中,较浅曲线代表S分值(Sscore),较深曲线代表C分值(Cscore),竖线(I)代表Y分值(Yscore)。图IIA显示,在EG65-a中在位置16和17之间存在最有可能的解离位点VLS-SV;图11B显示,在EG65-b中在位置16和17之间存在最有可能的解离位点GFG-SI;图11C显示在EG65-c中在位置16和17之间存在最有可能的解离位点SFA-IT。图12显示纯化的重组酶的SDS-PAGE分析。图中泳道l为EG65-b-16;泳道2为EG65-b-18;泳道3为EG65-a-137;泳道4为EG65-c-147;M为分子质量标准,包括兔磷酸化酶B(97.4kD)、牛血清白蛋白(66.2kD)、兔肌动蛋白(43.0kD)、牛碳酸酐酶(31.0kD)。左面的凝胶(10。/。SDS-PAGE)用考马斯亮蓝G-250染色,而右面的凝胶(10o/。SDS-PAGE)用硝酸银染色。图13A和图13B显示重组酶EG65-b-16(命)和EG65-b-148(0)的最适pH(图13A)和最适温度(图13B)。图14A-14D显示EG65-a-137和EG65-c-147的最适pH和最适温度。其中,图14A和14C分别显示EG65-a-137的最适温度和最适pH,图14B和14D分别显示EG65-c-147的最适温度和最适pH。图15A和15B分别显示重组酶EG65-b-l6(命)和EG65-b-148(0)的温度稳定性。图16A和16B分别显示重组酶EG65-b-16(令)和EG65-b-148(0)的pH稳定性。图17A显示纯化的EG65的双向凝胶电泳。其中,横向显示IPG条带,pH3-10,L=24cm;纵向为12.5。/oSDS-PAGE,260X200Xlmm。图17B显示用MALDI-TOF多肽质量指纹图谱进行分析所得结果。图18A和18B分别显示EG65-bl、b2、b3的氨基酸序列比较,和EG65-cl、c2、c3、c4的氨基酸序列比较。图19显示纯化的EG65的双向凝胶电泳。其中,横向显示IPG条带,pH3-10,L=24cm;纵向为12.5。/。SDS-PAGE,260X200Xlmm。具体实施方式如本文所用,"分离的"是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。如本文所用,"分离的纤维素酶蛋白或多肽"是指纤维素酶基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化该纤维素酶。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的带。本发明的纤维素酶可以是重组的、天然的、合成的,优选是重组的。本发明的纤维素酶可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。本发明还包括该纤维素酶的片段、衍生物和类似物。如本文所用,术语"片段"、"衍生物"和"类似物"是指基本上保持本发明的天然纤维素酶相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。在本发明中,术语"福寿螺纤维素酶"指具有纤维素酶活性的SEQIDNO:2第l-713位氨基酸序列、SEQIDNO:4第1-723位氨基酸序列或SEQIDNO:6第l-722位氨基酸序列的多肽,以及具有SEQIDNO:8、9、10、11或12编码的氨基酸序列的多肽;该术语还包括SEQIDNO:2、4、6序列以及SEQIDNO:8、9、10、11或12编码的氨基酸序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为l-50个,较佳地l-30个,更佳地l-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括福寿螺纤维素酶的活性片段和活性衍生物。该多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧度条件下能与福寿螺纤维素酶DNA杂交的DNA所编码的蛋白。本发明还提供了其他多肽,如包含福寿螺纤维素酶或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括了福寿螺纤维素酶的可溶性片段。通常,该片段具有福寿螺纤维素酶序列的至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。发明还提供福寿螺纤维素酶或多肽的类似物。这些类似物与天然福寿螺纤维素酶的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如e、Y-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。在本发明中,"福寿螺纤维素酶的保守性变异多肽"指与SEQIDNO:2、4、6的氨基酸序列以及SEQIDNO:8、9、10、11或12编码的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个,最佳地至多3个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。表A最初的残基代表性的取代优选的取代Ala(A)Val;Leu;lieValArg(R)Lys;Gin;AsnLysAsn(N)Gin;His;Lys;ArgGinAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro;AlaAlaHis冊Asn;Gin;Lys;ArgArgHe(I)Leu;Val;Met;Ala;PheLeuLeu(L)lie;Val;Met;Ala;PhelieLys(K)Arg;Gin;AsnArgMet(M)Leu;Phe;lieLeuPhe(F)Leu;Val;lie;Ala;TyrLeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTip(W)Tyr;PheTyrTyr(Y)Tip;Phe;Thr;SerPheVal(V)lie;Leu;Met;Phe;AlaLeu本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQIDNO:l所示的编码区序列相同或者是简并的变异体。如本文所用,"简并的变异体"在本发明中是指编码具有SEQIDNO:2、4、6或SEQIDNO:8-12所编码的氨基酸序列的蛋白质,但与SEQIDNO:l、3、5、8-12所示的编码区序列有差别的核酸序列。编码福寿螺纤维素酶成熟多肽的多核苷酸包括只编码成熟多肽的编码序列;成熟多肽的编码序列+各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)+非编码序列。术语"编码福寿螺纤维素酶的多核苷酸"可以是包括仅编码福寿螺纤维素酶的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,"严格条件"是指(l)在较低离子强度和较高温度下的杂交和洗脱,如0.2XSSC,0.1%SDS,60°C;或(2)杂交时加有变性剂,如50。/o(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42X:等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽具有纤维素酶活性。本发明还涉及与上述的序列杂交的核酸片段。如本文所用,"核酸片段"的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码福寿螺纤维素酶的多聚核苷酸。本发明的福寿螺纤维素酶核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用按常规方法所制备的福寿螺cDNA库作为模板,扩增而得有关序列。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。目前,己经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或纤维素酶编码序列转化的宿主细胞,以及经重组技术产生本发明所述多肽的方法。通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的纤维素酶。一般来说有以下步骤(1).用本发明的编码纤维素酶的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养的宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。本发明中,纤维素酶多核苷酸序列可插入到重组表达载体中。术语"重组表达载体"指本领域熟知的细菌质粒、噬菌体、酵母质粒、或其他载体。在本发明中适用的载体包括但不限于在细菌中表达的基于T7的表达载体(Rosenberg,etal.Gene,1987,56:125)。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。本领域的技术人员熟知的方法能用于构建含纤维素酶编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,etal.MolecularCloning,aLaboratoryManual,coldSpringHarborLaboratory.NewYork,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有大肠杆菌的lac或trp启动子;人噬菌体Pl后幼子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、以及新霉素抗性,或用于大肠杆菌的四环素、卡那霉素或氨节青霉素抗性。包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞。较佳地是大肠杆菌。代表性例子有大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母等。用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。本发明的酶还包括固定在固相载体上的固定化酶。本领域熟知的各种固定化酶技术都可用于制备本发明的固定化的纤维素酶。此外,本发明提供了纤维素酶、其编码序列、载体或宿主细胞的用途,它们被用于生产简单糖,尤其是葡萄糖的工艺。所述的简单糖包括纤维二糖、简单戊糖、葡萄糖及其混合物。本发明的生产简单糖的工艺包括步骤(a)用本发明上述的纤维素酶或转化或转导的宿主细胞处理纤维素材料,从而产生简单糖;(b)分离出所述的简单糖。本发明酶可直接产生纤维二糖、简单戊糖等简单糖。优选的工艺还包括加入其他酶,例如P-葡萄糖苷酶(可将纤维二糖水解为葡萄糖),这样就可直接产生葡萄糖。一种代表性的工艺包括步骤(a)将用机械铰碎稻草与含0.1M氯化钠的0.05MpH5.2醋酸缓冲液按20-30。/。混合(按重量/体积)在45。C预热10-15分钟。(1>)然后加入0.05-0.2%纤维素酶和P-葡萄糖苷酶,缓慢搅动,在45'C水浴反应12-24小时,收集自然沉降的90%上清部分。蒸干得到葡萄糖粗品。(c)沉淀部分补加含0.1M氯化钠的0.05MpH5.2醋酸缓冲液至原体积,缓慢搅动在45r水浴反应24小时,收集自然沉降的90%上清部分。蒸干得到葡萄糖粗品。下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。实施例l:福寿螺EG65的分离纯化1.材料和试剂福寿螺广泛分布在中国福建、广东,广西,浙江,江苏等省。将从福建厦门购得的福寿螺作为实验材料。实验中,层析介质DEAE-SepharoseCL-6B,DEAE-SepharosefastflowDEAE-SephadexA-50,Phenyl-SepharoseCL-4B购自PharmaciaAB(Sweden)公司,Bio-gelP-100购自Bio-Rad(USA)公司。电泳试剂丙稀酰胺、甲叉双丙稀酰胺、十二烷基磺酸钠(SDS)购自PharmaciaAB(Sweden)公司,蛋白分子量标准购自上海西巴斯公司。测活试齐[JpNPC、Sigmacell101、木聚糖(xylanfrombirchwoodoroatspelt)、CMC-Na(中等粘度),淀粉(frompotato)购自Sigma公司;P-水杨素、AvicelpH101购自Fluka公司。糖蛋白荧光染料荧光酰肼(dansylglycylhydtazide,DNS-GLY-NHNH2)由上海生化细胞所刘望夷教授馈赠。其余试剂为国产试剂分析纯。2.分离纯化1)硫铵分级沉淀取18g福寿螺的胃,用剪刀将螺胃剪粹,在4。C用24ml(l:1.5,w/v)缓冲液A(10mMNa2HP04-NaH2P04pH6.8—lOOmMNaCl,ImMEDTA)抽提30分钟,抽提液12000rpm离心15分钟后上清加入(NH4)2S04至55。/。饱和度,4'C静置过夜。2)离子交换柱层析将静置过夜的上清离心,沉淀对缓冲液A(自配,10mMNa2HP04-NaH2P04pH6.8—100mMNaCl,lmMEDTA)进行透析,透析后的酶液离心,上清为用A预先平衡好的DEAE-SephadexA-50柱(2.6X16cm)的上样液,收集用A洗涤下来的有CMC-Na活性的组份。CMC-Na水解活力测定取适量的酶加入到50。C预热10min的200ull%(w/v)CMC-Na(lOOmMNaAC-HAC,pH5.2-100mMNaCl)中,混匀,50。C反应10分钟后,加入0,5mlDNS试剂终止反应,沸水浴5min显色,冷水浴冷却,再补入0.5ml二次蒸馏水,混匀后测定540nm处光吸收值(此测活方法被定义为标准方法)。水解CMC-Na的活力单位定义为在上述条件下,每分钟水解生成lymol葡萄糖还原当量所需要的酶量为一个单位(Unit)。3)凝胶过滤柱层析UltrafilterPM10超滤管(pall)浓縮后上Bio-gelP-100柱(2.7X92cm,预先用A平衡好),收集下来的具有CMC-Na活性的组份。4)疏水相互作用层析在收集得到的活性组份中加入(NH4)2SO4至0.5M,上疏水柱Phenyl-sepharoseCL-4B柱(1.0X6.0cm),经柱平衡缓冲液B(自配,lOmMNa2HP04-NaH2P04pH6.8~0.5M(NH4)2SO4,100mMNaCl,lmMEDTA)洗去未结合的蛋白质后,用0.5-0M(NH4)2SCX^B缓冲液梯度洗脱,收集活性具有CMC-Na活性的组份。5)离子交换柱层析用UltrafilterPM10超滤管更换缓冲液为C(自配,50mMTris-HClpH8.0),上柱DEAE-sepharosefastflow柱(l.OX6.0cm,预先用C平衡好),平衡洗脱除去未结合的蛋白质后,用含0-0.2MNaCl的溶液洗脱,收集纯酶,并用UltrafilterPM10超滤管浓縮以备下面实验用。3.结果通过硫铵分级沉淀、离子交换(2次)、凝胶过滤以及疏水相互作用等一系列的柱层析,从软体动物福寿螺的胃液中分离纯化到了纤维素酶的组份,该组份在SDS-PAGE上显示的分子量为65kDa(图l),命名为EG65。EG65对CMC-Na的相对活力为13.3IU/mg。下表显示了对福寿螺胃液进行分离纯化所得结果。纯化步骤总蛋白总活性相对活力纯化系数产率(mg)(u)(U/mg)傲(%)粗抽提物663.72414.43.641100硫铵分级分离410.51722.64.201.1571,3DEAES印hadexA-50100.4557.25.551.5223.1Bio-gelP-10014.980.115.381.483.32PhenylSepharoseCL-4B5.9851.248.572.352.12DEAESepharosefastflow1.013.3013.33.650.55实施例2:EG65的活性测定1.活性测定方法(1)糖蛋白鉴定选用荧光酰肼(DNS-Gly-NHNH2)特异标记糖蛋白上的糖链,根据W.Y.Liu,R.Q.Jiang在"Thefluorescentlabelingofglycoproteinsonsodiumdodecylsulfate-polyacrylamidegel"(Bioorg.Chem.22(1994)29-35)中公开的方法鉴定糖蛋白。(2)最适pH、最适温度以及pH稳定性和温度稳定性测定1)最适pH:取适量的EG65加入到的不同pH值的200pl、溶解在pH3.6-7.2100mMQH807(柠檬酸)/Na2HPCV2H20的浓度为l%(w/v)的CMC-Na中按标准方法测活。2)最适温度在25°C到70'C范围内按标准方法测活。3)pH稳定性将EG65酶于pH2.7-9.7的广泛pH缓冲液中50。C保温15min或者50。C保温不同时间后按标准方法测活。4)温度稳定性将EG65在pH4.6的广泛pH缓冲液中5(TC保温不同的时间按标准方法测活。(3)金属离子、阴离子以及螯合剂对酶活性的影响金属离子、阴离子以及螯合剂加入到酶溶液中,然后按标准方法测活。(4)结合实验取一定量的酶加入到1.0ml不溶性的微晶纤维素AvicelpH101(50mMNaAC-HAC,pH5.2)中,于4t:放置并不时摇动,上清中活性按标准方法测定。离心后的沉淀用NaAC-HAC溶液洗涤三次,每次lml,尽量将上清去干净,洗涤后的沉淀用1'SDS上样缓冲液重悬,沸水浴2-3min后,用15。/。的SDS-PAGE分析。2.结果(1)糖蛋白分析实验表明,EG65为糖蛋白。(2)pH和温度对酶活性的影响(2.l)最适pH和最适温度EG65水解CMC-Na的最适温度和最适pH分别为50-55'C,5.5-6.5。(2.2)pH稳定性实验表明,EG65在不同pH条件下15X:保温100h之后仍没有明显的活力下降(图2A),然而,5(TC保温15min之后,活力有很明显的变化处于pH4.6的酶活力达到最高;pH5.6时达到相对最高活力的93。/。;在pH4.6-5.6范围之外,酶水解CMC-Na的活力就明显下降,到pH2.7和pH7.5时,酶基本失活(图2B)。(2.3)EG65的温度稳定性测定是将pH4.6的酶溶液在50'C保温不同的时间后测残留的酶活,结果发现EG65具有很高的温度稳定性,5(TC保温3h,保留有>70%的活力(图3)。(2.4)不同结构的多糖,如CMC-Na、pNPC、桦树木聚糖(birchwoodxylan)、燕麦木聚糖(oatspeltxylan)、P-水杨素、Sigmacell101以及淀粉等分别作为EG65的底物来检测其底物特异性,结果发现EG65对CMC-Na有很特异的催化活性,对pNPC、P-水杨素和淀粉均无水解能力(见下表)。这些实验表<table>tableseeoriginaldocumentpage14</column></row><table>上标"a"表示分别使用桦树木聚糖和燕麦木聚糖。(2.5)将金属离子、阴离子以及螯合剂加入到酶溶液中使其终浓度为10mM,然后再在、2+标准条件下测其相对活力。从实验结果可以看出,Na+、Li+、NH4+、Mg'Br—、r、Ac-和CO,等离子的存在对酶活力的变化没有明显的影响,f、cr、so42CaNO2+:2+HSChS2032—、Mn2+、C6H50,和EDTA的存在可以提髙酶的活力。下表列出了实验结阴离子或螯合剂相对活力金属离子相对活力NaF102.1LiCl108.4NaCl101.9KC1119.2NaBr106.9NH4C195.6Nal101.5MgCl2103.4NaAC106.3CaCl289.8NaN03118.7NiCl2110.1NaHS03122.5MnCl2121.9Na2C03106.6NiS04114.8Na2S04119.0MgS04100.1Na2S203135.2EDTA124.4柠檬酸三钠114.8上表中,在标准条件下没有加入所述试剂所测得的相对活力为IOO。实施例3:EG65的基因及其相关基因的克隆和表达1.材料、试剂和方法(1)材料和试剂3-环己氨基-l-丙磺酸(CAPS)转膜缓冲液购自Amresco公司;V8蛋白水解酶购自Pierce公司;二硫苏糖醇(DTT)购自Sigma公司;PVDF膜购自Millipore公司;Trizo鹏自上海生工(力口拿大BioBasicInc.进口分装);反转录试剂购自Promega公司;福寿螺胃组织cDNA文库由本实验室构建;限制性内切酶、PCR所用的酶(TaqE、PyrobestE、La-TaqE等)以及载体pMD18-TVector购自Takara公司;胶回收试剂盒、丽春红购自上海华舜生物工程有限公司;质粒抽提试剂盒购自博大泰克;IPTG购自BBI公司;X-gal购自Takara公司;E.coli培养所用蛋白胨(Tryptone)、酵母抽提物(YeastExtract)购自Oxoid公司;甲醇酵母尸.培养所用蛋白胨(BactoTMP印tone)、酵母基本氮源(YeastNitrogenBaseW/Oaminoacid)购自B&D公司(原Difco公司产品);D-山梨醇、生物素、琼脂糖等都是国产分析纯;PCR仪为PTC-150Mini轮rTM;蛋白测序仪为491型蛋白测序仪;酵母电转化仪为Bio-Rad公司MicroPulser电转化仪。试剂配方包括YPD:1%酵母抽提物,2。/。蛋白胨(peptone),2%葡萄糖;灭菌。RBD平板:1M山梨醇,2%葡萄糖,1.34%YNB,0.005%氨基酸,4乂10-5%生物素,2%琼脂糖灭菌。BMGY(或BMMY):1%酵母抽提物,2°/。蛋白胨(peptone),lOOmM磷酸钾,pH6.0,1.34。/。YNB,4xl0-5。/。生物素,1%甘油或者0.5%甲醇;灭菌。需要注意的是2%葡萄糖,lOOmM磷酸钾,pH6.0要单独灭菌;1.34。/。YNB,0.005。/。氨基酸,4xl0-5。/。生物素过滤除菌;0.5°/。甲醇要在使用前加。其它试剂同实施例l。(2)方法(2.l)N-端及中间部分氨基酸序列测定EG65纯酶和用V8蛋白酶水解产生的14kD片段,分别经IO%SDS-PAGE电泳之后,通过半干法将蛋白条带转移到PVDF膜上,丽春红显色之后用自动测序仪通过Edman降解法进行N-端序列测定。(2.2)福寿螺胃组织总RNA分离及反转录取新鲜福寿螺胃组织100mg,用Trizol试剂按照GIBCOBRL的总RNA分离Protocol抽提胃组织的总RNA,利用oligodT-15作为引物反转录,得到福寿螺胃组织cDNA第一链,-20'C保存,作为PCR反应的模板。(2.3)福寿螺EG65基因(eg65-a、eg65-6、eg65-c)cDNA的克隆1)核心序列的确定根据EG65N-端氨基酸序列以及对糖苷水解酶第九家族的保守序列并对鲍鱼[K.Suzuki,T.Ojima,K.Nishita,PurificationandcDNAcloningofacellulasefromabalone//a"orisofccusZia""a!',Eur丄Biochem.270(2003)771-778]、鳌虫下葡聚糖内切酶的序列[K.A.Byrne,S.A.Lehnert,S.E.Johnson,S.S.Moore,IsolationofacDNAencodingaputativecellulaseintheredclawcrayfishCheraxquadricarinatus,Gene.239(1999)317—324]作比较选取一段保守序列(DAGDHVKFG),设计兼并引物F1(041016-F1),Rl(041105r),以cDNA为模板,94。C,5min;94。C,lmin;48。C,45s;72。C,lminl0s;35轮;72。C,10minPCR扩增,测序。2)3'-RACE,即尾部序列的确定a.根据糖苷水解酶第九家族的保守序列并对鲍鱼、鳌奸葡聚糖内切酶的序列作比较选取一段保守序列(HNEVACDYN),设计兼并引物F2(041105F4);另选取福寿螺胃组织cDNA文库载体上的一段序列,设计特异性引物入C(040428-2),以福寿螺胃组织cDNA文库为模板,94。C,5min;94°C,lmin;58°C,45s;72。C,lmin30s;30轮;72。C,10minPCR扩增,测序。b.根据核心序列,设计引物F3(041213-f4)和cDNA文库的特异性引物入C,以福寿螺胃组织cDNA文库为模板,94。C,4min;94。C,30s;52。C,30s;72°C,lminl0s,5轮;94。C,30s;57。C,30s;72°C,lminl0s,25轮;72。C,10minPCR扩增,测序。3)5'-RACE,即前半部分序列的确定根据核心序列,设计引物R2(041127-r),另选取福寿螺胃组织cDNA文库载体臂上的特异的一段序列,设计特异性引物入N,以福寿螺胃组织cDNA文库为模板,94°C,5min;94。C,lmin;62。C,45s;72。C,2minl0s,30轮;72。C,10minPCR扩增,测序。4)通拉,即全基因序列的确定a.根据前半部分序列以及尾部序列(a),分别设计引物F4(0412133041-f2),F5(0412133042-fl)以及R3(1822rl),以福寿螺胃组织cDNA文库为模板,94°C,5min;94。C,30s;60。C,30s;72°C,2min30s,30轮;72。C,10minPCR扩增,测序,得到两段DNA序列,分别为eg65-a和eg65-Z)的cDNA全长序列。b.根据前半部分序列以及由尾部序列(b)设计的引物设计的引物F6(0412133042-fi)以及R4(50113166),以福寿螺胃组织cDNA文库为模板,94°C,5min;94°C,30s;60°C,30s;72°C,2min30s,30轮;72°C,10minPCR扩增,测序,得到eg(55-c的cDNA全长。上述PCR扩增得到的片段经胶回收试剂盒纯化之后与pMD18-T载体16"C连接4h,然后转化大肠杆菌DH12S。挑克隆,菌体PCR以及酶切鉴定之后,测序。经测序验证序列正确的含质粒的甘油菌于-7(TC待用。所使用到的引物序列如下引物寡核苷酸序列"*"表示包括丰余部分(R^AG;Y=CT;N=ATCG),1=次黄嘌呤(2.4)eg65-a,eg65-6以及eg65-c在甲醇酵母(尸Zc/n'fl;^ton力中的表达1)表达质粒的构建以上述含eg65-a、eg(15-6、eg65-ccDNA全长的质粒为模板,分别以Fex(-16a)即Fex(-160923),Rex;Fex(-137a)即Fex(-1370923),Rex;Fex(-16b),Rex;Fex(-148b),Rex;Fex(-16c)即Fex(-16F2A),Rex1即Rex(-1470121F2B)和Fex(-147c)即Fex(-1470121F2A),Rex1为引物,扩增eg65-a,eg65-b,eg65-c的开放阅读框。所得产物通过EcoRI和NotI酶切位点接入P.;^to/^表达载体pPIC9K(图4),转化£.DH12S感受态细胞,构建表达质粒。挑选阳性克隆,测定插入片段DNA序列,筛选包含正确序列的克隆。2)尸./^to/^表达质粒的转化表达质粒线性化用质粒抽提试剂盒抽提相当于3-4个小抽量的/3/7^to/^表达质粒,限制性内切酶SacI酶切线性化后,无水乙醇沉淀,70%乙醇洗涤两次,晾干后以10"1TE溶解,以备转化。甲醇酵母GS115感受态的制备将GS115菌株接种于2mlYPD培养基,3(TC培养1220小时,以1:100比例接种于100mlYPD培养基中,3(TC培养至OD600=1.31.5。4。C,1500g离心10min,沉淀用预冷的无菌水悬浮洗涤2次,4'C,1500g离心10min,再用预冷的1MD-山梨醇悬浮洗涤沉淀2次,4°C,1500g离心10min后,所得GS115重悬于0.3ml预冷的lMD-山梨醇中,冰上放置待用。电转每管取GS115感受态80n1,分别加入5-20yg线性化的DNA(于5-10ulTE中),小心混匀,加入电转化杯(电极间距0.2cm),冰浴5分钟后,使用MicroPulserTM电转化仪(Bio-Rad)转化。电极化后的细胞加200lU冰冷的lMD-山梨醇,混匀后铺于RDB平板,3(TC倒置培养35天。3)eg(55-a、eg65-6以及eg65-c在尸.pa^o/is中的表达挑取单克隆于2mlYPD培养基中,30'C过夜培养,一部分保存甘油菌,一部分以l:500比例接种于25mlBMGY培养基中,30。C培养至OD60(N2-6。1500g离心10min,收集下来的菌体重悬于100mlBMMY培养基中,30'C诱导表达4天,每天补加甲醇至终浓度0.5%。然后4。C,15000g离心15分钟,收集培养基上清待分离纯化用。17GTICCIGAYGGIAAYGGNTTYCC(SEQIDNO:13)CACAACGAGGTRGCCTGCGACTACAA(SEQIDNO:14)GCGCTCGGGCAAACTTCCGGCCAACAA(SEQIDNO:15)ATGTTCTCGCTAGTCTTGTGGGCGGGGC(SEQIDNO:16)ATGTTCTCGCTGGTCCTGTGGGCGGTGC(SEQIDNO:17)ATGTTCTCGTTAGTCGTGTGGGCGGCGC(SEQIDNO:18)CTCGGGAAGCGCGCCATTGTGTT(SEQIDNO:19)CYRAAYTTNACRTGRTCNCCNGCRTC(SEQIDNO:20)TTGACCACCCAGCCCATGACGGT(SEQIDNO:21)GCTCAAGGGGCTGCCCCATGGTA(SEQIDNO:22)CATTCAGAATGACTGCAAACTATGTAGC(SEQIDNO:23)ATACGACTCACTATAGGGCGAATTGGCC(SEQIDNO:24)FFFFFFXRRRR<table>tableseeoriginaldocumentpage18</column></row><table>(2.5)重组蛋白EG65-a,EG65-b以及EG65-c的纯化(M柱纯化)离心后的培养基上清,用1MTris调pH至7.5-8.0后,上Ni柱,先用20mMTris-HCl,0.5MNaCl,pH7.5的结合缓冲液洗脱,然后再20mMTris-HCl,0.5MNaCl,20mM咪唑,pH7.5的洗涤缓冲液洗脱,最后用含20mMTris-HCl,0.5MNaCl,200mM咪唑,pH7.5的洗脱缓冲液洗脱。洗脱下来的组份实施例l的"CMC-Na水解活力测定"方法,50°C,2h测活并且经SDS-PAGE分析之后,收集对应于SDS-PAGE上显示均一的活性组份,对50mMNaAC-HAC,pH5.2缓冲液透析之后,用UltrafilterPM10超滤管浓縮以备下面性质分析用。(2.6)性质分析1)最适温度、最适pH最适pH:在pH2.5-7.5,100mMC6H807(柠檬酸)/Na2HPCV2H20的l。/。CMC-Na中进行;最适温度在20'C到70'C范围内测定;方法与实施例l的"CMC-Na水解活力测定"相同,只是酶反应的时间长短不同。2)底物特异性不同的底物CMC-Na(l。/。,中等粘度)、0.9mg/mlpNPC、Sigmacell101(1%)、AvicelpH101(l%)、桦树木聚糖(1%)、燕麦木聚糖(1%)、淀粉(0.5%)、卩-水杨素(0.5%)分别按照实施例l所述方法测活,不同的是酶反应的时间。3)温度以及pH对酶稳定性的影响温度稳定性酶在50。C保温不同的时间或者在不同温度保温lh后,50°C,30min按标准方法测活。pH稳定性酶于不同pH值的广泛pH缓冲液中5(TC保温15min或者3(TC保温20h之后,50°C,30min按标准方法测活。(2.7)福寿螺卵巢组织基因组DNA抽提取新鲜福寿螺卵巢组织lOOmg,用Trizol试剂按照GIBCOBRL的总DNA分离Protocol抽提得到卵巢组织的总DNA。(2.8)福寿螺eg(55-fl、eg65-6以及eg(55-c的基因组片段扩增选取引物F5和R2,以福寿螺卵巢基因组DNA为模板,选用La-Taq扩增系统,94°C,5min;94°C,lmin;55°C,45s;72°C,7min,30轮;72°C,lOmin,PCR扩增得到的片段胶回收后与pMD18-T载体16'C连接4h,然后转化大肠杆菌DH12S。挑克隆,菌体PCR以及酶切鉴定之后,测序。2.结果(1)EG65N-端及其中间部分氨基酸序列测定EG65经Edman降解法测定得到N-末端序歹U为VSVPDGNGFPATTRVAN。用V8蛋白水解酶对EG65进行酶解,选取酶解产生的14kD肽段测其N-末端序列,结果显示的顺序为AQRSGALPAN。这段序列与来自鲍鱼(BAC67186,//a//o&cfocw)164173区域的序列具有90。/。的同源性(见K.Suzuki等,同上);与鼻白蚁(BAA33708,iV麵,"eA"画滅画go冊h)的3342区域(G.Tokuda,N.Lo,H.Watanabe,M.Slaytor,T.Matsumoto,H.Noda,Metazoancellulasegenesfromtermites:intron/exonstructuresandsitesofexpression,BiochimBiophysActa.1447(1999)146—159)以及鳌虫下(AAD38027,C/ierax《Mac/n'can'"WM"的5362区域(K.A.Byrne等,同上)分别具有80%和70%的同源性,并且对比的这三个葡聚糖内切酶均属于糖苷水解酶第九家族。(2)福寿螺eg65-a、eg65-6以及eg65-ccDNA的克隆1)核心序列的克隆根据N-端氨基酸序列VPDGNGFP以及对第九家族保守序列,尤其是对鲍鱼,鳌虾葡聚糖内切酶等序列分析得到的序列DAGDHVKFG,分别设计兼并引物F1和R1,PCR扩增,经测序得到一段552bp的序列(图5),即核心序列,其中包括EG65经V8蛋白水解酶水解产生的14kD肽段的N-末端序列。2)5'-RACE和3'-RACE在PCR扩增核心序列的同时,根据第九家族保守序列,尤其是对鲍鱼,鳌虾葡聚糖内切酶的序列分析得到的另一段保守序列HNEVACDYN,设计引物F2与根据cDNA文库载体序列设计的引物入C进行PCR扩增,测序后得到一段尾部序列(a);然后如图6所示,设计特异性的引物R2,F3,分别与根据cDNA文库载体序列设计的引物入N和入C进行PCR扩增,经测序分别得到3段(记为al,bl,cl)不同的且具有较高同源性的前半部分序列和l段尾部序列(b)。3)全长cDNA的克隆根据5'-RACE得到的3段前半部分序列分别设计引物F4,F5和F6;另外根据3'-RACE得到的2段序列设计引物R3和R4。F4与R3,F5与R3,F6与R4分别进行PCR扩增,得到的PCR片段测序后,分别得至U3个不同的基因"^eg65-a、eg65-6和eg65-c(SEQIDNO:1、3和5)。(3)EG65-a、EG65-b和EG65-c的蛋白序列分析l)序列相似性分析eg65-a、eg65-6和eg65-c的开放阅读框分别编码713、723和722个氨基酸,利用ClustalW序列分析软件(http:〃www.ebi.ac.uk/elustalw/)对这三个序列进行分析,结果显示它们相互之间的同源性分别达到89%,88%和87%(见下表和图7)。<table>tableseeoriginaldocumentpage20</column></row><table>将得到的EG65-a、EG65-b和EG65-c用保守结构域搜索软件(ConservedDomainSearch,http:〃www.ncbi.nlm.nih.gov/BLAST/)分析,发现它们均与糖苷水解酶第9家族催化结构域有相当高的序列相似性,因此归属于糖苷水解酶第9家族(GHF9)。将EG65-a的氨基酸序列与糖苷水解酶第10家族的其它成员比较发现,来自福寿螺的葡聚糖内切酶与另一种软体动物鲍鱼的同源性可以达到49c/。(见K.Suzuki等,同上),与两种不同来源的白蚁(NakashimaK,WatanabeH,SaitohH,TokudaG,AzumaJI.Dualcellulose-digestingsystemofthewood-feedingtermite,CoptotermesformosanusShiraki.InsectBiochemMolBiol.2002M;32(7):777-84;LiL,FrohlichJ,PfeifferP,KonigH.Termitegutsymbioticarchaezoaarebecominglivingmetabolicfossils.EukaryotCell.2003Oct;2(5):1091-8)以及鳌虫下(K.A.Byrne等,同上)的同源性分别达52%,51%以及46%(见下表和图8)。<table>tableseeoriginaldocumentpage20</column></row><table>另外,EG65-c除含有一个明显第9家族催化结构域外,还含有一个属纤维素酶第n家族的纤维素结合结构域(CBD);而EG65-a,EG65-b则不含明显的纤维素结合结构域(图9)。2)糖基化分析分别用0-糖基化预测软件NetOGlyc3.1Server(http:〃www.cbs.dtu.dk/services/NetOGlyc/)以及N-糖基化预测软件NetNGlyc1.0Server对EG65-a、EG65-b和EG65-c的糖基化情况作了分析图10A-10F),结果表明EG65-a125位的Thr;EG65-b125,130,131,139,140,146,150位的Thr以及EG65-c130,139,145位的Thr均为可能的0-糖基化位点。另夕卜,EG65-a序列中N-糖基化的可能性:183,232位Asn大于97,154,188,190,211,246,251,266,305,373,469,472,667位Asn,其中251和472位Asn位于Asn-XAA-Ser/Thr序列中。同样,EG65-b:37,194,243,277位Asn〉79,83,165,199,211,222,257,262,479,482,677位Asn,其中262和482位于Asn-XAA-Ser/Thr序列中。EG65-c:200,210位Asn>82,164,198,220,276,382,478,481,676位Asn;其中481位于Asn-XAA-Ser/Thr序列中。3)信号肽分析从全长cDNA对应的蛋白序列和分泌到福寿螺胃液中的蛋白,即成熟蛋白N-末端测序得到的结果分析发现,EG65-a较其相应的成熟蛋白EG65多了137个氨基酸残基。而EG65-b和EG65-c蛋白相对应的成熟蛋白N-末端序列可能分别为LTVPDGNGFPAT和LSVPDGNGFPAT(分别与蛋白测序得到的N-末端序列VSVPDGNGFPAT相比较之后推测),这样,EG65-b和EG65-c分别较成熟蛋白多了148和147个氨基酸残基。但蛋白质信号肽的长度一般为20-30aa,为了确定这3个蛋白的信号肽,用SignalP3.0Server信号肽序列预测软件对EG65-a,EG65-b和EG65-c可能的信号肽剪切位点作了预测(图llA-llC),结果发现,它们最可能的剪切位点均在第16和17位氨基酸残基之间。这也说明了这3蛋白很有可能在分泌到胞外之后又进一步被剪切掉了100多个氨基酸残基。(4)EG65-a、EG65-b和EG65-c在甲醇酵母中的表达及纯化由上面的信号肽预测软件分析我们可以知道,这3个蛋白N-端都含有16个氨基酸的信号肽,因此我们对每个蛋白质设计两条正向引物,一条反向引物,一对引物PCR得到的是去掉N-端16个信号肽序列的开放阅读框,另一对PCR得到的是成熟蛋白对应的序列;另外,为了纯化重组蛋白的方便,我们在设计正向引物的同时,引入了6个His的密码子。分别构建表达质粒,经测序正确之后,电转到甲醇酵母GS115中,然后甲醇诱导表达。将诱导表达所得到的蛋白分别对应的命名为EG65-a-16,EG65-a-137;EG65-b-16,EG65-b-148;EG65-c-16,EG65-c-147。用不含插入基因的质粒pPIC9K为对照组,发现甲醇诱导4天时,上清中葡聚糖内切酶的活力达到最高,因此取诱导4天的培养基4。C,15000g,15min离心后的上清用lMTris调pH后过Ni柱来纯化蛋白,纯化结果见图12。其中EG65-b-16和EG65-b-148重组蛋白的活力相对最高且水解底物CMC-Na的相对活力相当,分别为6.67IU/mg和6.45IU/mg。对于EG65-a-16,EG65-a-137和EG65-c-16,EG65-c-147这两组重组蛋白,分别是EG65-a-137和EG65-C-147的活力要高于EG65-a.16和EG65-C-16。而EG65-a-16和EG65-C-16只表现出极其微弱的水解CMC-Na的活力。另夕卜,虽然是在甲醇酵母中诱导表达的,但是从SDS-PAGE电泳图上我们可以看出,重组蛋白并没有发生很严重的糖基化现象。(5)性质分析l)最适温度和最适pHa.EG65-b-16和EG65-b-148以CMC-Na为底物,从图13A和13B可以看出,EG65-b-16和EG65-b-148的最适反应温度和最适pH曲线走势相似。其最适温度均为50'C,与从福寿螺胃液中得到的组织酶EG65的最适温度相似。当温度高于50'C或者低于5(TC时,酶的活力很快下降(图13A)。其最适pH均在pH5.5-6.5之间,在此范围之外,酶的活力明显下降,并且在pH2.5-4.5之间,酶的活力很弱,其相对活力均〈20。/。(图13B)。b.EG65-a-137和EG65-c-147EG65-a-137的最适温度为50。C,当温度升高5。C到55"时,EG65-a-137的活力迅速下降至<20%。而EG65-e-147的最适温度则为40'C,当温度升高时,酶的活力迅速下降,到5(TC时,酶的活力下降至18%左右,当温度升高至7(TC,EG65-c-147几乎完全丧失活力(图14A,B)。EG65-a-137和EG65-c-147的最适pH见图14C、D,它们的最适pH分别为5.5-6.5和5.5。在此范围之外,活力很快下降。2)底物特异性不同结构的多糖,如CMC-Na、pNPC、桦树木聚糖、燕麦木聚糖、e-水杨素、Sigmacell101、AvicelpH101以及淀粉等作为底物来检测6种不同的重组酶的底物特异性,结果发现它们与从福寿螺胃液中得到的组织酶EG65相似,除CMC-Na之外,对其它底物均无水解活性。而对葡聚糖内切酶的底物CMC-Na而言,EG65-b-16和EG65-b-148的水解活力最高且相对活力相当,EG65-a-137和EG65-c-147的水解活力次之,而EG65-a-137和EG65-c-147对应的只去掉16个氨基酸残基,即信号肽的重组蛋白EG65-a-16和EG65-c-16,仅仅能检测到极其微弱的水解CMC-Na的能力。因此它们属于典型的葡聚糖内切酶。3)温度和pH对EG65-b-16和EG65-b-148稳定性的影响将酶溶液在5(TC保温不同的时间后测残留的酶活,结果发现两种酶随保温时间的变化,相对酶活力的变化趋势相同。但相对而言,EG65-b-16较EG65-b-148稍稍稳定一些。5(TC保温180min之后,EG65-b-16还残留约60%的活性,而EG65-b-148则只剩余约35%的活性(图15A)。但是,将酶在不同温度保温lh之后,发现这两种均在20-40。C的范围内比较稳定,当温度高于4(TC时,酶的活力迅速下降,当温度升到6(TC时,酶的活力基本为0;同样,我们从图15B中可以看出,EG65-b-16较EG65-b-148的热稳定性要稍稍好一些。pH稳定性实验表明,5(TC保温15min之后,活力有很明显的变化在pH5.5-6.5范围之间,EG65-b-16和EG65-b-148的酶活力达到最高;在此范围之外,酶水解CMC-Na的活力就明显下降,至lJpH3.5禾卩pH7.5时,这两个酶基本失活(图16A)。但EG65-b-16和EG65-b-148在不同pH条件下30'C保温20h之后,从图16B可以看出,两者的稳定pH范围均很广,最稳定pH均为pH9.5,但是EG65-b-148在此条件下的pH稳定性较EG65-b-16好。EG65-b-148在pH4.5-10.5仍保留有>70%的活力,而EG65-b-16达到〉70。/。相对活力的pH范围为pH7.5-10.5。(6)eg65-c对应的福寿螺基因组片段的扩增为了进一步验证从福寿螺胃组织cDNA文库中得到的eg(55-a、eg65-6和eg(55-c三个基因来源于福寿螺自身,我们以F5和R2为引物,用福寿螺卵巢抽提出的基因组DNA为模板,PCR扩增,测序,得到一段长约1.6kb的片段(SEQIDNO:7),Blast之后发现,这段序列是包含4个内含子的eg65-c的部分基因组序列,内含子的剪切位置分别在176bp,296bp,370bp和442bp之后。上述实验进一步验证了这三个基因是来源于福寿螺本身,而非其体内的肠道微生物所产生。实施例4:EG65蛋白的多态性分析本实施例讨论福寿螺纤维素酶的多态性,分析引起其多态性的可能的原因。1.材料、试剂和方法(1)材料试剂双向凝胶电泳系统购自AmershamBiosciences;凝胶扫描成像系统(D2000Uniscansc咖er)购自TsinghuaUniscan;脱色摇床(TY-20型)购自西巴斯;Voyager-DESTRMALDI-TOF质谱仪购自PerSeptiveBiosystems,Framinham,MA;胰蛋白酶(sequencing-grademodifiedtrypsin)购自Promega;葡聚糖内切酶为实施例l所得;EG65-b-148为实施例3所得;其它试剂和材料见实施例1和3。(2)方法(2.l)双向凝胶电泳双向电泳的方法主要根据AmershamBiosciences的仪器使用手册(T.Berkelman,T.Stenstedt,2-Delectrophoresis:usingimmobilizedpHgradients;principlesandmethods,Uppsala,Sweden:AmershamBiosciences.(1998))和G6rg等改进的方法(A.G6rg,C.Obermaier,G.Boguth,A.Harder,B.Scheibe,R.Wildgruber,W.Weiss,Thecurrentstateoftwo-dimensionalelectrophoresiswithimmobilizedpHgradients,Electro-phoresis.21(2000)1037-1053)。IPG-IEF在IPGphor等电聚焦系统上进行。等电聚焦后,IPG胶条在15ml的平衡液中平衡两次,每次15min(G6rg等,同上)。SDS-PAGE在EttanDALTtwelve系统上进行。双向电泳后,分析型的电泳凝胶利用Yan等改进的硝酸银染色方法进行染色(J.X.Yan,R.Wait,T.Berkelman,R.A.Harry,J.A.Westbrook,C.H.Wheeler,M.J.Dunn,Amodifiedsilverstainingprotocolforvisualizationofproteinscompatiblewithmatrix-assistedlaserdesorption/ionizationandelectrosprayionizationmassspectrometry,Electophoresis.21(2000)3666~3672),制备型的电泳凝胶利用Neuhoff等的考马斯亮蓝染色方法进行染色(V.Neuhoff,N.Arold,D.Taube,W.Ehrhardt,ImprovedstainingofproteinsinpolyacrylamidegelsincludingisoelectricfocusinggelswithclearbackgroundatnanogramsensitivityusingCoomassieBrilliantBlueG-250andR-250,Electrophoresis.9(1988)255—262)。(2.2)MALDI-TOF多肽质量指纹图谱分析用来进行MALDI多肽质量指纹图谱分析的蛋白质取自考马斯亮蓝G250染色24小时的制备型凝胶。用切点仪(TheGelCompany,USA)切取目标蛋白质点,每个胶片被切成lmm3得胶块然后放到0.65ml硅烷化的EP管中,胶内酶解的方法是根据Shevchenko等(A.Shevchenko,M.Wilm,O.Vorm,M.Mann,Massspectrometricsequencingofproteinssilver-stainedpolyacrylamidegels,AnalChem.68(1996)850~858)的方法进行。胰蛋白酶酶解的样品用Voyager-DESTRMALDI-TOF质谱仪在延滞抽提线性正向模式下进行分析。(2.3)eg<55-W、62、W以及eg(55-c/、c入c3、"基因的克隆(eg65-W即eg65-6,eg<55-c/即eg65-c)方法与实施例3所述的方法相同。通拉时F4、F5、F6分别与R3和R4组成引物对,以福寿螺胃组织cDNA文库为模板,94°C,5min;94°C,30s;60°C,30s;72°C,2min30s,30轮;72°C,lOminPCR扩增,测序,得到eg65-W、W、W以及eg65-c/、c2、d、"基因。2.结果(1)EG65蛋白的多态性为了证明福寿螺胃液中的葡聚糖内切酶是否也具有蛋白多态性,取SDS-PAGE上显示一条带的EG65进行双向凝胶电泳,结果呈现的是分子量相似而等电点不同的一串点(图17A),这表明EG65至少在等电点不同方面具有蛋白多态性。为了进一步验证这些点是否属于不同翻译后修饰的同一个核心蛋白,随机取双向电泳凝胶上的6个点用MALDI-TOF多肽质量指纹图谱进行分析,结果发现这六个点的多肽质量指纹图谱很相似,这暗示了这些点很可能是属于同一个核心蛋白或者是同源性很高,即氨基酸序列几乎相同的多个蛋白(图17B),如整联蛋白e-3(Integrinbeta3)的多态性只表现在第33位氨基酸是Leu还是Pro(VijayanKV,LiuY,SunW,ItoM,BrayPF.ThePro33isoformofintegrinbeta3enhancesoutside-insignalinginhumanplateletsbyregulatingtheactivationofserine/threoninephosphatases.JBiolChem.2005Apr11),因此不会对这两种异构体的多肽质量指纹图谱造成太大的差别一样。(2)eg65-W、W、W以及eg65-c/、c2、c3、"基因序列以及蛋白序列分析以F4,F5,F6与R3或R4为引物,分别从福寿螺胃组织cDNA文库中得到了同源性很高的eg(55-a(SEQIDNO:1)、eg65-W(SEQIDNO:3)、62(SEQIDNO:8)、W(SEQIDNO:9)以及eg65-c/(SEQIDNO:5)、c2(SEQIDNO:10)、c3(SEQIDNO:11)、"(SEQIDNO:12)三组基因。蛋白序列分析发现,除这三组蛋白之间具有很高的同源性之外,eg65-b和eg65-c这两组蛋白编码的氨基酸序列相互之间的同源性可高达98y。以上(图18A、B)。与EG65葡聚糖内切酶的N-末端序列相比较发现,这三组蛋白可能具有相同或极其相似的成熟蛋白N-末端。另外,用蛋白质初级结构分析软件ProtPar咖(http:〃www.expasy.ch/tools/protparam.html)予页观!J了eg65-a,eg65-W、62、63以及eg65-"、c2、d、c4l码的成熟蛋白的分子量以及对应的理论等电点的大小(见下表),结果发现这些成熟蛋白的分子量极其相似,而等电点却不同,这与组织酶EG65进行双向凝胶电泳得到的结果很相似,另外,这也与能够与组织酶EG65的多肽质量指纹图谱相对应。从而进一步证明了这种蛋白多态性的原因可能是由于蛋白序列的微观不同造成的。采用ProtParam获得的分子量和理论pI预测结果<table>tableseeoriginaldocumentpage24</column></row><table>为了证明真核生物中翻译后修饰很容易引起蛋白的多态性,将含有eg(15-6-WS基因的质粒转化到甲醇酵母尸.戸加r/s之后表达出的重组蛋白EG65-b-148经Ni柱纯化,SDS-PAGE上显示的是像"双眼皮"样的挨得很近的两条带(见实施例3),双向凝胶电泳图上呈现的是分子量很相近的而等电点不同的一串点(图19),这充分证明了EG65-b-148存在蛋白多态性,并且造成这种多态性的原因是翻译后修饰的不同。软体动物福寿螺体内含有大量的翻译后修饰系统,并且组织酶EG65经荧光酰肼染色之后发现是一个糖蛋白(见实施例2),并且双向电泳图谱上呈现的也是一串点(图17A),因此造成福寿螺纤维素酶多态性的另一个原因可能是翻译后修饰。在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。序列表aio>中国科学院上海生命科学研究院浙江理工大学〈120〉新的纤维素酶及其应用<130〉065777<腸32<170〉Patentlnversion3.3<210〉1<211>2142<212>DNA<213〉福寿螺(AmpuUariacrossean)<400>1atgttctcgctagtcttgtgggcggggctcccgctcctggtcttgagcagcgtcactgta60cccgtcaccasccattggccgggtggattccaggcaaaagtctgtttcactatcgacaaa120gagatgacttcUgggtcgtcgatcttgtcttcgatcaccctgtggacacactgagcctg180tggacggccgatgcgaagagcaccagcgcagacaagacgaaatggacgctgaccagcaag240acgtgg肪ctcccaggagcatgtgggagatgagctgtgcatcgatatcaatggccaaggt300agcggtgatgactggcgtgttgtaaaagccaccctggaaggagcagc卿tggcgggtca360taccaagtcgttax:aagcgcccctctcccaccaggtgtctctgcagctccagtgtctgtc420cccgacggaaacggtttccccgcc3ccaccagagtcgccaacgtcagggacgggctgtcg480gagcagtggctgaccttcaccatcaccggccccaccgtcatgggctgggtggtcaagttc540cgctgcaacaagccagtcacc犯cctc幼cgtggcagatgccgacgccctC3gCC3C犯C600gccgacatgacggagtggctgctggtgaacaacgacaacaagatcgccctcaaggcggga660accttggagatgaagattgaagtcaagctggtgaatgtccacgactcagcccctcagtgc720tcggcgatcctcatcaacatgggggtagataactacacctgcggcgagct780gccaactccagigtacaactacgacgaccttctgtacaaatccatcttgttctscgaggcg840cagcgctcgggcaaacttccggcc肌caaccgcatcccctggcgaggcgactccgccctc900aacgaccacggcaatgccggcgaggacttgactggcggctggtacgacgcgggagacttc960gtcaagttcaacttccccatggcctggtcaacggccgtcttgacctggggCttgCtgC3g1020ttcaaggacgcctaccaggccgcaggtcagctggagtggatgtacgagagcatcaagtgg誦ccgctggactacctgctcaagtgtcacgtgtctgacaacgtgctgtacgtgcaggtgggt1140g3tgg3ggtgtggaccacggatcatgggggagacccgaggacatgaagatggccagaccc1200gccttcaagatcgacgccagcaaacccggatctgaagttgccatggaaacagcagctgcc1260ttcgcggctggacatttggcttttaaagaaaaagatccgtcatactcagccaaactgctg1320caacatgccaagtcgctgtggcagttcgctgtcacacacaagggcaagtacagtgacagt腦gtgtcagctgctgccggctactacaattccgccaacgtcacggacgagttgtgctggggg1440tcgctgtggttgtacaaggccaccaaggaacccaagtacctggaggaggccctcaagcac1500tatgatgcttctcccgactggggcatgtcctgggacgatgtcttcatcggcaatcaggtg1560tcgctgtacgggaggccaagtacaaagcagctgtagagggcaccttcaag1620gagtggttccCtggtggg3Ctgtcccctacacccctaagggtctggcgt3cagactgcag1680tggggcgccctacggtacgcatccaacatggctatggccgcgctgatggctgc柳agcgmoggtatccacccggacgagt3tcgccactgggccatgtgtcagatccactacgccctgggg1800gacactggccgcagctttgtcgtgggttttggcaaaaatccacccgtcagtcctcaccac1860cgctctagctcctgccccaacctacctgtgcggtgtaacatgaactacctccacctggac1920accccc犯cactcacatgctgtgcggggcgctggtgggtggccccgat.agctcggatggt1980tacaagg3cagccgcgagaactacgtcaacaacgaggtggcctgcgactacaacgccggc2040ttccagacagccgtggccggtcttcgctcgctgctgatcagacacctgcatcccgagcag2100犯gggcggcgccacgtgtccctaccatggggcagcccctt2142<210〉2<211〉713<212〉〈213〉福寿螺(Ampullariacrossean)<400〉2MetPheSerLeuLeuTrpAlaGlyLeuProLeuLeuValLeuSer151015SerValThrValProValThrAsnHisTrpProGlyGlyPheGinAla202530LysVaiCysPheThrlieAspLysGluMetThrSerTrpValValAsp354045LeuValPheAspHisProVaiAspThrLeuSerLeuTrpThrAlaAsp505560AlaLysSerThrSerAlaAspLysThrLysTrpThrLeuThrSerlys65707580ThrTrpAsnSerGinGiuHisValGlyAspGluLeuCyslieAsplie859095AsnGlyGinGlySerGlyAspAspTrpArgValValLysAlaThrLeu100105110GluGlyAlaAlaAspGlyGlySerTyrGinValValThrSerAlaPro115120125LeuProProGlyValSerAlaAlaProValSerValProAspGlyAsn<formula>formulaseeoriginaldocumentpage27</formula>atgttctcgccccgtcaacagacat.gagt.ttggacggccagagtggaacggacggagatacaccaagttagctgaacctcaccagagtcgggccccaccgcacgtggcagctggtgaatggataactacagtcctgtacaaaccgcatccacaggcgggtacggccatctctgg叫tggatctgatgacgagacccgaggtccgaagUgaaagatccgcgtcacacacagtcaacgtcacccaagtacctgggacgatgtacaaagcagacccctaagggctatggccggccatgtgtcggc^a貼tccggtgt.aacactggtgggtg犯cgaggtggctgttgctasgcagcccctttggtcctgtg3CC3CtgggCcctgggtcatcagtggagcatcgcgcctgtttacaagtgcagcctacagcccaacgtcagtcatgggctgatgccgacgcacaagatcgctccaagactccctgcggcgaggtatgacgctgaactggggtgtacgagagtgctgtacgtccatggaaaccatactcagcagggcaagtacagacgagtttggaggaggctcttcatcggctgtggaggggtctggcgtacgctgatggcagatccactacacccgtcagtgaactacctgccccgatagcctgcgactaggaacctgcaggcggtgctaccgctcttgggctttggcaggggtggattccaggctagagtctgctttaaccatctggctUcgatcaacctgtacagaccaccagcgcggacaagaaggaatggtcgcttgtcggggacgagctgtgcaUgacctcatgatcacagccaccctggagggagcggaaggaccccgcaccacagtcaacctccctccaggcccattgactgtccccgacggaaacggtttggctgaccttacaagccagttgacggagtgcatcactgtacatcgacaagccttgatgtggactaacaaggggtcacggcggtggtcaagcctcagccaccctcaaggcgagcccctcaggctacccaacgttctacgagggactccgccgggagacttccttgctgcagtgtcaagtggggccagacccagctgttgcccaaactgctgcagtg犯agtgtgctgggggcctcaagcaccaatcaggtgcaccttc&agcagactgcagtcctcaccacccacctggacctcggatggtcaacgccggctcccgagcagttccgctgca肌cgaggacaggaaccttggtgctcggcgaaaggccaactgcgcagcgctctcaatgatggtcaagttcattcaaggacgccgctggacttcctc3tcaaccaagtacaacgggcaaactgccttcaaggtttgtgactgc幼catgcc3gtctccgccgtatgatgcttttgctgtacggagt.ggttcctggggcgcccggtatccaccgacactggcccgctctagcttacaaggac3ttCC3g3C&gaagggcagcgacttccccatcctacgaggcacctgctcaacggaccacggttgacgccaggccacttggcagtccctgtgccgcaagttatgtac肌ggcctcccgactgaactcacgaactggcgggactacggtactccggacgagtagcagctttgtcctgccccaactcacatgctgccgcgagaaccgtggccggccacgtgtcctgtcaccaccccccgccaccC3CC3tC3CCcacc站cctcgctgctggtgtgaagtc幼gcatgggcgtactatgacgattccggccaacggtggacctgggcctggtcccgcaggtcaggtgtcactcgatcatgggggcagacctggctttcaaagaaggagttcgctctacaattccC3CC犯gg犯gggcstgtcctgtcccctacgtccaacatgtcgccactggcgtgggttttcctccctgtggtgcggggcgctacgtcaactcttcgctcgctaccatggg601201802403003604204805406006607207808409009601020腦mo120012601320腦1440150015601620168017401800i860192019802040210021602172<210>4<211〉723<212〉PRT<213〉福寿嫘(AmpiUlariacrossean)〈400>4MetPheSerLeuValLeuTrpAlaValUuProUuLeuGlyPheGly151015SerlieThrValProVaiAsnAsnHisTrpAlaGlyGlyPheGinAia202530ArgValCysPheAsnlieAspLysAspMetSerSerTrpVallieHis354045LeuAlaPheAspGinProValGinThrLeuAspValTrpThrAlaAsn505560AlaGinSerThrSerAlaAspLysLysGluTrpSerLeuThrAsnLvs65707580GluTrpAsnAlaVaiGluHisValGlyAspGluLeuCyslieAspLeu859095MetGlyHisGlyAspGlyAsplieAlaProVallieThrAla丁hrLeu100105110GluGlyAlaGluGlyGlyGlySerHisGinVallieThrSerAiaPro115120125ArgThrThrValAsnLeuProProGlyValThrThrAlaGluProGin130135140ProThrAlaProl.euThrValProAspGlyAsnGlyPheProAlaThr145150155160ThrArgValAlaAsnValArgAspGlyLeuSerGluGinTrpLeuThr165170175PheThrlieThrGlyProThrValMetGlyTrpValValLysPheArg180185190CysAsnLysProValThrAsnLeuHisValAlaAspAlaAspAlaLeu195200205SerHisAsnGluAspMet丁hrGluTrpLeuLeuValAsnAsnAspAsn210215220LyslieAlaLeuLysAlaGlyThrLeuGluMetLyslieGluValLys225230235240LeuValAsnValGinAspSerAlaProGinCysSerAlalieLeulie245250255AsnMetGlyValAspAsnTyrThrCysGlyGluLeuProAsnLysAla260265270AsnSerLysTyrAsnTyrAspAspValLeuTyrLysSerlieLeuPhe275280285<formula>formulaseeoriginaldocumentpage29</formula>gccgtcttgacctggggcttgctgcagttcaaggacgcctaccaggccgcaggtcagctg1080gagtggatgtacgagagtgtcaagtggccgctggactacctgctcaagtgtcacgtgtct1140gacaacgtgctgt3CgtgC3ggtgggtgatggaggtgtggaccacggatcatggggg柳1200cccgaggacatga卿tggccagacccgcaUcaagatcgacgccaccaagccaggatct函gsagttgccatggaaacagcggctgcctttgcggctggacatttggcatt1320gatccgtcatactCEigccaaactgctgcaacatgccaagtcgctgtggcagttcgctgtc1380acacacaagggcaagtacagtgacagtgtgtcagctgctgccggctactacaattccgcc1440aacgtcacgg3Cgagttgtgctgggggtcgctgtggttgtacgaggccaccaaggaeiccc1500aagtacctgg3gg3ggCCCtcaagcactatgatgcttctcccgactggggcatgtcctgg1560gacgatgtcttc3tcggcaatcaggtgUgctgtacgaactcacgaaggaggccaagtac1620tgg犯ggcaccttcagggagtggttccctggcgggacggtCCCCt3C3CC鹏cctaagggtctggcgtacagactgcagtgggggtccctgcggtacgcatccaacatggct1740atggccgcgctgatggctgcagaagcgggtatccacccggacgagtatcgccactgggcc1800atgtgtcagatccactacgccctgggggacactggccgcsgctttgtcgtgggUttggc1860aaa肌tccacccgtcagtcctcaccaccgctctagctcctgccccaacctacctgtgcgg1920tgtaacatgaactacctcc3cctggacaccccc朋cactcacatgctgtgcggggcgctgl卿gtgggtggccccgatagctcggatggttacaaggacagccgcgagaactacgtc幼caac2040gaggtggcctgcgactacaacgccggcttccagacagccgtggccggccttcgctccttg2100ctggtccgacacttgcatcccgagcagaaaggcggcgccacgtgtccctaccacgggaga2160gcaccgtga2169<210>6<211>722〈212〉<213〉福寿螺(Ampullariacrossean)<400〉6MetPheSerLeuValLeuTrpAlaGlyLeuProLeuLeuSerPheAla151015lieThrValProValThrAsnHisTrpAlaGlyGlyPheGinAlaArg202530ValCysPheLyslieAspLysGluMetSerSerTrpVallieHisLeu354045ThrPheAspHisProValGluThrlieAspVeilTrpThrAlaAspAla505560GinSerThrSerAlaAspLysLysGinTrpThrLeuThrSerLysAsn65707580Trp八snAlaValGluHisValGlyAspGluLeuCyslieAspLeuMet859095GlyHisGlyThrGlvAspPheAlaProVallieThrAlaThr匕euGlu100105110GlyAlaSerGlyGlyGlvSerHisGinValAlaThrSerAlaProAla115120125ThrThrGinAlaHisHisGinGlyValAlaThrAlaAlaProValHis130135140ThrThrProLeuSerValProAspGlyAsnGlyPheProAlaThrThr145150155160ArgValSerAsnValArgAspGlyArgSerAspHisTyrLeu丁hrPhe165no175ThrlieSerGlyProThrValMetGiyTrpVedValLysPheArgCys180185190SerLysProValHisAsnLeuAsnValArgGluAlaAspProLeuSer195200205HisAsnAlaAspGinThrGluTrpLeuLeuValAsnAsnAspAsnGin210215220lieThrlieLysProGlyThrPheGluLeuLyslieGluLeuGluLeu225230235240ValThrGlyArgAspSerAlaProGinCysSerAlaThrLeuThrAsn245250255MetGlyValAspLysHisThrCysGlyGinLeuProAsnLysAlaAsn260265270SerLysTyrAsnTyrAspAspValLeuTyrLysSerlieLeuPheTyr275280285GluAlaGinArgSerGlvLysLeuProAiaAsnAsnArglieProTrp290295300ArgGlyAspSerAlaLeuAsnAspGlyAspGlyGlyValAspLeuThr305310315320GlyGlyTrpTyrAspAlaGlyAspPheValLysPheAsnPheProMet325330335AiaTrpSerThrAlaValLeuThrTrpGlyLeuLeuGinPheLysAsp340345350AlaTyrGinAlaAlaGlyGinLeuGluTrpMetTyrGluSerValLys355360365TrpProLeuAspTyrLeuLeuLysCysHisValSerAspAsnValLeu370375380TyrValGinValGlyAspGlyGlyValAspHisGlySerTrpGlyArg385390395400ProGluAspMetLysMetAlaArgProAlaPheLyslieAspAlaThr405410415LysProGlySerGluValAlaMetGluThrAlaAlaAlaPheAlaAla<formula>formulaseeoriginaldocumentpage31</formula>atgttctcgctagtcttgtgggcggggctaccgctcttgggctttggcagcatcactgta60cccgtcaacaacc3ctgggcgggtggattccaggctagagtctgctttaacatcgacaag120gacatgagttcctgggtcatccatctggctttcgatcaacctgtacagacccttgatgtg180tggacggccaatgcgcagagcaccagcgcggacaagaaggaatggtcgctgactaacaag240gagtgg肌cgcagtggagcatgtcggggacgagctgtgcattgacctcatgggtcacggc300gacggagatatcgcgcctgtgatcacagccaccctggagggagcggaaggtggcgggtcg360caccaagttattacaagtgcgiccccgcaccacagtcaacctccctccaggtgtcaccacc420gctgaacctcagcctacagccccattgactgtccccgacggaaacggtuccccgccacc4803CC3g3gtCgccaacgtcagggacgggctgtcggagcagtggctgaccttCElCC3"tCBCC540ggccccaccgtcatgggctgggtggtcaagttccgctgcaacaagccagtcgiccaacctc600cacgtggcagatgccgacgccctcagccacaacgaggacatgacggagtggctgctggtg660acaagatcgccctcaaggcgggaaccttggagatgaagattg幼gtcaag720ctggtgaatgtccaagactcagcccctcagtgctcggcgatcctcatcaacatgggcgta780cctgcggcgagctacccaacaaggccaactccaagtacaactatgacgat840gtcctgtacaagtccatcttgttctacgaggcgcagcgctcgggc肌acttccggccaac900aaccgcatcccctggcggggggactccgccctcaatgatggagatggcggggtggacctg9603C柳Cgggtggtstgacgcgggagacttcgtcaagttcaacttccccatggcctggtcc1020acggccatcttg肌ctggggcUgctgcagttcaaggacgCCt3Cg3ggCtgcaggtcag1080ctggagtggatgtacgagagtgtcaagtggccgctggactacctgctcaagtgtcactcg1140tctgatgacgtgctgtacgtgcaggtgggtgtitggaggtgcggaccacggstcatggggg1200agacccgaggacatgaagatggccagacccgccttcaaggttgacgccagcagacctggc固tccgaagttgccatggaaacagctgttgcctttgtgactggccacttggctttcaaagaa1320aaagatccgccatactcagccaaactgctgcaacatgccaagtccctgtgggagttcgct1380gtcacacacaagggcaagtacagtga肌gtgtctccgccgccgcaagttactacaattcc1440gtcaacgtcaC3g8Cg3gttgtgctgggggtcgctgtggttgt3C犯ggCcaccaaggaa1500cccaagtacctggaggsggccctcaagcactatgatgcttctcccgactggggcatgtcc1560tgggacgatgtcttcatcggc犯tcaggtgttgctgtacgaactcacgaaggaggagaag1620tacaaagcagctgtggagggcaccttcaaggagtggttccctggcgggactgtcccctac1680acccctaagggtctggcgtacagactgcagtggggcgccctacggtactcgtccaacatg1740gctatggccgcgctgatggctgcagaagcgggtatccacccggacgagtatcgccactgg1800gccatgtgtcagatccactacgccctgggggacactggccgcagctttgtcgtgggtttt1860ggcaaaaatccacccgtcagtcctcaccaccgctctagctcctgccccaacctccctgtg1920cggtgtaacatgaactacctccacctggacacccccaacactcacatgctgtgcggggcg1980ctggtgggtggccccgaitagctcggatggttacaaggacagccgcgagaactacgtcaac2040aacgaggtggcctgcgactacaacgccggcttccagacagccgtggccggtcttcgctcg2100ctgttgctaaggaacctgcatcccgagcagaagggcagcgccacgtgtccctaccatggg2160gcagcccctt2172<210〉9<211〉2172<2i2>腿<213〉福寿螺(Ampullariacrossean)<400〉9atgttctcgctagtcttgtgcccgtcaacaaccactgggcgacatgagttcctgggtcattggacggccaatgcgcagaggagtggaacgcagtggagcagacggagatatcgcgcctgtcaccaagttaUacaagtgcgctgaacctcagcctacagcaccagagtcgccaacgtcagggccccaccgtcacgggctgcacgtggcagatgccgacgcaacaacgacaacaagatcgcctggtgaatgtccaagactcgataactacacgtgcggcgagtcctgtacaagtccatcttaaccgcatcccctggcgaggactggcgggtggtEitgacgcacggccatcttgaactggggctggagtggatgtacgagagtctgatgacgtgctgtacgtagacccgaggacatgaagattccgaagttgccatggaaacaaagatccgccatactcagcgtcacccacaagggcaagtagtcaacgtcacggacgagttcccaagtacctggaggaggctgggacgatgtcttcatcggtacaaagcagctgtgg3gggacccctaagggtctggcgtagctatggccgcgctgatggcgccatgtgtcagatccactaggcaaaaatccacccgtcagcggtgteiacatgaactacctctggtgggt.ggccccgatagaacgaggtggcctgcgactactgttgctaaggaacctgcaggcggggctgccgctcUgggctttggcagcatcactgta60gggtggattccaggctagagtctgttttaacatcgacaag120ccatctggctttcgatcaacctgtacagacccttgatgtg180caccagcgcggacaagaaggaatggtcgctgaccaacaag240tgtcggggacgagctgtgcaUgacctcatgggtcacggc300gatcacagccaccctggagggagcggaaggtggcgggtcg360accccgcaccacagtcaacctccctccaggtgtcaccacc420cccattgtctgtccccgacggaaacggtttccccgccacc480ggacgggctgtcggagcagt.ggctgaccttcaccatcacc540ggtggtcaagttccgctgcaacaagccagtcaccaacctc600cctcagccacaacgaggacatgacagagtggctgctggtg660cctcaaggcgggaacattggagatgaagattgaagtcaag720agcccctcagtgctcggcgatcctcatcaacatgggcgta780gctacccaacaaggccaactccaagtacaactatgacgat840gt:tctacgaggcgcagcgctcgggcaaacttccggccaac■cgactccgccctcaatgatggagatggcggggtggacctg960gggagacttcgtcaagttcaacttccccatggcctggtcc1020cttgctgcagttcaaggacgcgtacgaggccgcaggtcag1080tgtcaagtggccgctggactacctgctcaagtgtcacgcg1140gcaggtgggtgatggaggtgcggaccacggatcatggggg1200ggccagacccgccttcaagatcgacgccagcaaacctggc1260agctgttgcctttgtgactggccacttggctttcaaagaa1320caaactgctgcagcatgccaagtccctgtgggagttcgct1380cagtgaaagtgtctccgctgccgcaagttactacaattcc1440gtgctgggggtcgctgtggttgtacaaggccaccaaggaa1500cctcaagcactatgatgcttctcccgactggggcatgtcc1560caatcaggtgttgctgtacgaactcacgaaggaggagaag1620caccttcaaggagtggttccctggcgggactgtcccctac1680cagactgcagtggggcgccctacggtactcgtccaacatg1740tgcagaagcgggtatccacccggacgagtatcgccactgg1800cgccctgggggacactggccgcagctttgtcgtgggtttti860tcctcaccaccgctctagctcccgccccaacctacctgtg1920ccacctggacacccccaacactcacatgctgtgcggggcg1980ctcggatggttacaaggacagccgcgagaactacgtcaac2040caacgccggcttccagacagccgtggccggtcttcgctcg2100tcccgagcagaagggcagcgccacgtgtccctaccatggg2160gcagccccttga2172<210>10<211>2169<212>隱<213〉福寿螺(Ampullariacrosse肌)<400>10atgttctcgcgtcaccaaccatgagttccttggaacgcagggtgatttcgcaagttgctagctcctgtgccgagtctccEicc犯ccgtcagttcgcg3ggagic^c肌ccgtgaccggca犯acacacctctgtacaagtcgcatcccctgccgtcttgagagtggatgtgacaacgtgccccg3ggacagaagttgccagatccgtcatacacacaaggaacgtcacggaagtacctgggacgatgtctcctaagggtcatggccgcgcatgtgtcagatgt3aC8tg3gtgggcggccgaggtggcctctggtccgacgcaccgtgatggtcctgtgactgggcggggggtcatccacgcagagcactggagcatgtctcctgtcatcaagtgcccc3t3C33CCCCacgtgagagatgggctgggtccgatccactagatcaccatgagactcggcgcgg織gctccatcttgttatgacgcgggcctggggctttgtacgtgcatgaagatggcactcagccaaacgagttgtgaggaggcccttcatcggcaatggaaggcactggcgtacagtgatggctgctccactacgcccgtcagtccactacctccaccgatagctcgcgactacaaacttgcatccggcggtgctatggattccagtctgacctttcagcgcggacccgctgctgagctagagtctgaccaccctgcacagc幼ccagctaccacaattgtctgtccggacgctcgggtcaagttcC3gccac肌ccaagccaggaccctcagt.gcgccc肌caa3ctgtgcatcgctgg胆ggagcaagctcacccccgacggaagaccattaccgctttgccatgcttcaaaattagElg3C幼tggacgctgacacctcatgggcactgtacccgccgatcagaacattcgagttccgccacacgccaactccacagcgctcggatcaaggtgtBtggattccctgaccttcac3gCCElgtgC3cggagtggcttgaaaattgatcaccaacatagtacaactagcaaacttccctccgccctc3g3CttCgtCgctgcagttccaagtggccgggtgggtgatcagacccgcaggctgcctttactgctgcaatgacagtgtgctgggggtcgcaagcactattcaggtgttgaagttcaactaaggacgcctctggsctacctccccatggctg3tgtgtggcagcaagaactcacggaactcggttcacatcgccactgctcgccactaccC3tCBgCggCc犯cctc肌cgctggtg肪cactggagctggggcgtcgactgacgatgtcggccaacaacggacctgactctggtccacgaggtcagctgttc肌gatcgactgcagtggcctgggggactcaccaccgccctggacaccggatggttaccgccggcttccgagcagaaacatgccaagttcagctgctgctgtggttgtgatgcttctcctgtacgaactggttccctggggtccctgcatccacccggactggccgcatctagctcctcccaacactcaaggacagcccagacagccgggCggCgCCEltgctcaagtgaccacggatcacgccacc犯atttggcattcgctgtggcaccggctactaacaaggccacccgactggggtcacg犯ggagcgggacggtggtacgcatcacgagtatcggcUtgtcgtgccccaacctacatgctgtggcgagaactatggccggcctcgtgtccctaatgggggagagccaggatctgttcgctgtccaattccgcccaaggaaccccatgtcctggggccaagtaccccctacacccaacatggctccactgggccgggttttggcacctgtgcggcggggcgctgcgtcaacaactcgctccttgccacgggaga60120180240300360420■5406006607207808409009601020108011401200126013201380144015001560162016801740l咖1860192019802040210021602169〈210〉11<211〉2169<212〉,<213〉福寿螺(A迈pullariacrossean)〈400〉11atgttctcgcgtcaccaaccatgagttcctacggcggatgcgcagagcactagtcttgtgactgggcgggggtgatttcgcaagttgctagctcctgtgccgagtctccaccaaccgtcagttcgcg柳aacgacaaccgtgaccggcaEi肌cacacctctgtacaagtcgcatcccctctcctgtcatcaagtgccccBtac肌cccctgggctgggcccgatccactagatcaccatgagactcggcgcggacagccccatcttgttggcgaggcgagccgtcttgagagtggatgtgacaacgtgccccgaggacagaagttgccagatccgtcatacccacaaggaacgtcacggaagtacctgggacgatgtctacgagagtgttgtacgtgcatgaagatggcactcagccaatggat.t.ccagtctgaccttt.cagcgcggaccggggacgagcacagcaaccagctaccacaattgtctgtccggacgctcgggtcaagttccagccacaaccaagccaggaccctcagtgcgcccaacaagctacgaggcgctccgccctcagacttcgtcgctgcagttccaagtggccgggtgggtgaccagacccgccagctgcctttactgctgcaatgacagtgtgctgctgctgagctagagtctgaccaccctgaagaagcaatctgtgcatcgctggaaggagcaagctcacccccgscgg肌gaccattacccggtgcagcagccgatcagaacattcgagttccgccacacgccaactccacagcgctcggaatgatggagaagttcaactaaggacgcctctggactaccgggggtgcagttcaagatcggctttgccat.gcttcaaaattagagacaatggacgctgacacctcatgggaccaaggtgtatggattccctgaccttcacagccagtgcacggagtggcttaaaaattgatcaccaacatagtac肌ctagcaaacttcccgctgtaccccgac犯agagtgatgtgtggcagcaag幼ctcacggaactcggtt.cacatCgCCElCtgCtcgccactacccatcagcggcC肌CCtCgl3Cgctggtgaacaggaggcccttcatcggcaatggagggcaccaagcactattcaggtgttgcttcaggg財catgccaagttcagctgctgctgtggttgtgatgcttctcctgtacgaactggttccctgtccccatggcaccaggccgctgctcaagtgaccacggatc6icgccacc33atttggcattccctgtggcaccggctactaacaaggccacgggggtcgactgacgatgtcggccaacaacggacctgactctggtccacgaggtcagctgtcacgcgtccatgggggagagccagga/tcttcacgaaggagcgggactgtgttcgctgtccaattccgcccaaggaaccccatgtcctggggccaagtaccccctacacc60120180240300360420480540600660720780840900960102010801140體12601320138014401500156016201680cctaagggtcatggccgcgcatgtgtcagaa幼aatccactgtaacatgactggtccgacgcaccgtgatggcgtac3gtgatggctgctccactacgcccgtcagtccactacctccaccgatagctcgcgactacaaacttgcatccactgcagtggcctgggcgactcaccaccgccctggacaccggatggttaccgccggcttccgagcagaaagggtccctgcatccacccggactggccgcatctagctcctCCC站C3CtCaaggacagcccagacagccgggcggcgccaggtacgcatcacgagtaccggctttgtcgtgtcccaacctacatgctgtggcgagaactatggccggcctcaacatggctccactgggccacctgtgcggcggggcgctgcgtcaacaactcgctccttgccacgggaga174018001860192019802040210021602169〈210〉12<211〉2169<212>,<213〉福寿螺(Ampullariacrossean)〈400〉12atgttctcgttagtcgtgtgggcggcgctaccgctgctgagcUtgccatcactgtaccc60gtcaccaaccactgggcgggtggattccaggctagagtctgcttcaaaatcgacaaagag120atgagttcctgggtcatccatctgacctttgaccaccctgtagagacaattgatgtgtgg180acggcggatgcgcagagcaccagcgcggacaag肪gcaatggacgctgaccagcaagaac240tggaacgcagtggagcatgtcggggacgagctgtgcatcgacctcatgggtcacggaact300ggtgatttcgctcctgtcatcacagcaaccctggaaggagcaagtggcggcggttcacat360caagttgctacaagtgccccggctaccacacaagctcaccatcaaggtgtcgccactgct420gctcctgtgcatacaaccccattgtctgtccccgacggaaatggattccccgccactacc480cgagtctccaacgtgagagacggacgctcggaccattacctgaccttcaccatcagcggc540ccaaccgtcatgggctgggtggtcaagttccggtgcagcaagccagtgcacaacctcaac600gttcgcgaggccgatccactcagccacaacgccgatcagacggagtggctactggtgaac660aacgacaaccagatcaccatcaagccaggaacattcgagt.tgaaaattgaactggagctg720gtgaccggcagagactcggcccctcagtgct.ccgccacactcaccaacatgggcgtcgac780aaacacacctgcggacagctgcccaacaaagccaactccaagtacaactatgacgatgtc840ctgtacaagtccatcttgttctacgaggcgcagcgctcgggcaaacttccggccaacaac900cgcatcccctggcgaggggactccgccctcaatgatggagatggcggggtggacctgact,960ggcgggtggtatgacgcgggagacttcgtcaagttcaacttccccatggcctggtccacg魔Ogccgtcttgacctggggcttgctgcagttcaaggacgcctaccaggccgcaggtcagctg1080gagtggatgtacgagagtgtcaagtggccgctggactacctgctcaagtgtcacgtgtct1140gacaacgtgctgtacgtgcaggtgggtgatggaggtgtggaccacggatcatgggggaga1200cccgaggacatggagat.ggccagacccgcattcaagatcgacgccaccaagccaggatct1260gaagttgccatggaaacagcggctgcctttgcggctggacatttggcattcaaagaaaaa1320gatccgtcatactcagccaaactgctgcaacatgccaagtcgctgtggcagttcgctgtc1380acacacaagggcaagtacagt,gacagtgtgtcagctgctgccggctactacaattccgcc1440aacgtcacggacgagttgtgctgggggtcgctgtggttgtacaaggccaccaaggaaccc1500aagtacctggaggaggccctcaagcactatgatgcttctcccgactggggcatgtcctgg1560gacgatgtcttcatcggcaatcaggtgttgctgtacgaactcacgaaggaggccaagtac1620aaaacagctgtggaaggcaccttcagggagtggttccctggcgggacggtcccctacacc1680cctaagggtctggcgtacagactgcagtgggggtccctgcggtacgcatccaacatggct1740atggccgcgctgatggctgcagaagcgggtatccacccggacgagtatcgccactgggcc1800atgtgtcagatccactacgccctgggggacactggccgcagctttgtcgtgggttttggc1860aaaaatccacccgtcagtcctcaccaccgctctagctcctgccccaacctacctgtgcgg1920tgtaacatgaactacctccacctggacacccccaacactcacatgctgtgcggggcgctg1980gtgggtggccccgatagctcggatggttacaaggacagccgcgagaactacgtcaacaac2040gaggtggcctgcgactacaacgccggcttccagacagccgtggccggccttcgctccttg2100ctggtccgacacttgcatcccgagcagaaaggcggcgccacgtgtccctaccacgggaga2160gcaccgtga2169(2i0>13〈211〉23<212>DNA<213〉人-l:序列<220〉<221〉miscfeature<223>引物<220><22i〉misc—feature<222>(3):(3)<223〉『次黄嘌呤<220><221〉misc—feature<222〉(6):(6)〈223〉11=次黄噪呤<220〉<22I>misc_feature<222〉(12)..(12)<223>『次黄嘌呤〈220〉<221〉misc—feature<222>(18)..(18)<223>n:a,t,c或g〈400>13gtnccngayggnaayggnttycc23〈210〉<211><212〉<213>1426隨人工序列<220〉〈221〉迈isc—feature<223〉引物<400〉14cacaacgaggtrgcctgcgactacaa26<210>15〈21D27〈212〉隱<213>人工序列<220>〈221〉miscfeature〈223〉引物〈400〉15gcgctcgggcaaacttccggccaacaa27<210〉16<211〉28〈212〉腿<213>人工序列〈220〉<221〉miscfeature<223>引物<400〉16atgttctcgctagtcngtg<210>17<211>28<212〉眺〈213>人工序列〈220〉<221〉miscfeature〈223>引物<400〉natgttctcgctggtcctgtg<210>18<211〉28<212〉DNA<213〉人i:序列<220><221〉miscfeature<223〉引物<備〉18atgttctcgttagtcgtgtg<210>19〈2n〉23〈212〉隱<213〉人工序列<220〉<221>miscfeature<223>引物<400〉19ctcgggaagcgcgccattgt<210〉20<211>2628282823<212〉DNA〈213〉人工序列<220><221>niisc—feature<223>引物—〈220><221〉miscfeature<222〉(26)<223〉n-a,1:,c或g〈400>20cyraayttnacrtgrtcnccngcrtc26<210〉21〈211〉23〈212〉腿<2i3>人工序列<220><221>miscfeature〈223〉引物<ttgaccacccagcccatgac<210〉22<2il〉23〈212〉腿<213〉人工序列<220><221>miscfeature<223>引物<400〉22gctcaaLggggctgccccatg<210〉23〈211〉28<212〉隱2323〈213〉人工序列<220><221〉〈223>misc—feature引物<400〉23cattcagaatgactgcaaactatgtagc28<210〉24<2U>28<212〉DNA<213〉人工序列〈220〉〈221>miscfeature〈223〉引物<400>24atacgactcactatagggcgaattggcc28<210〉25<211〉49<212〉隱<213〉人r.序列<220>〈221〉miscfeature<223>引物<400〉25tttgaattccaccaccacca〈210〉26<211〉48<212〉醒<213〉人工序列49<220〉<221〉misc—feature<223>引物<400〉26tttgaattccaccaccaccaccaccacgtgtctgtccccgacggaaac48<210〉27<211〉48<212〉DNA<213>人工序列<220><221>misc—feature<223>引物<400〉27tttgaattccaccaccaccaccaccacagcatcactgtacccgtcaac48<210〉28〈211〉48<212>醒〈213〉人l:序列〈220〉<221〉misc—feature〈223>引物〈400>28tttgaattccaccaccaccaccaccacttgactgtccccgacggaaac48<210〉29<211〉49<212〉DNA<213>人工序列〈220〉<221〉misc—feature〈223〉引物<40(P29tttgaattccaccaccaccaccaccacatcactgtacccgtcaccaacc49<210>30<211>49<212〉DNA<213〉人工序列<220〉<221>misc—feature<223>引物<400>30tttgaattccaccaccaccaccaccacttgtctgtccccgacggaaatg49<210〉31〈211〉31<212〉隱<213>人工序列〈220〉〈221>misc—feature〈223〉引物<400>31aaagcggccgctcaaggggctgccccatggt.<210>32<21D32〈212〉DNA<213〉人工序列<220〉〈221〉miscfeature<223>引物〈400〉32aaagcggccgctcacggtgctctcccgtggta权利要求1.一种分离的纤维素酶,其特征在于,它选自(a)具有SEQIDNO2第1-713位氨基酸序列的多肽;(b)具有SEQIDNO4第1-723位氨基酸序列的多肽;(c)具有SEQIDNO6第1-722位氨基酸序列的多肽;(d)具有SEQIDNO8、9、10、11或12所述多核苷酸序列编码的氨基酸序列的多肽;(e)将SEQIDNO2、4、6的氨基酸序列或(d)的氨基酸序列经过1-10个氨基酸残基的取代、缺失或添加而形成的,且具有纤维素酶功能的由(a)、(b)、(c)或(d)衍生的多肽。2.如权利要求l所述的纤维素酶,其特征在于,该酶具有SEQIDNO:2、4或6的氨基酸序列。3.—种分离的多核苷酸,其特征在于,它选自(a)编码如权利要求l所述酶的多核苷酸;(b)在严格条件下与(a)所述多核苷酸序列杂交且编码具有纤维素酶活性的蛋白质的多核苷酸。4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸是编码具有SEQIDNO:2、4或6所示氨基酸序列的多核苷酸。5.如权利要求4所述的多核苷酸,其特征在于,所述的多核苷酸选自下组(i)具有SEQIDNO:1中l-2142位的核苷酸序列(ii)具有SEQIDNO:3中l-2172位的核苷酸序列;(iii)具有SEQIDNO:5中l-2169位的核苷酸序列;(iv)具有SEQIDNO:8中l-2172位的核苷酸序列;(v)具有SEQIDNO:9中l-2172位的核苷酸序列;(vi)具有SEQIDNO:10中l-2169位的核苷酸序列;(vii)具有SEQIDNO:11中l-2169位的核苷酸序列;(viii)具有SEQIDNO:12中l-2169位的核苷酸序列。6.—种重组的表达载体,其特征在于,它含有权利要求3所述的多核苷酸。7.—种转化的宿主细胞,其特征在于,它含有权利要求6所述的重组的表达载体。8.—种权利要求l所述的纤维素酶的制备方法,其特征在于,该方法包含(a)在适合表达权利要求l所述的酶的条件下,培养权利要求7所述的宿主细胞;(b)从培养物中分离出权利要求l所述的纤维素酶。9.权利要求l所述的纤维素酶的用途,其特征在于,用于生产简单糖的工艺,所述的简单糖是纤维二糖、葡萄糖及其混合物。10.—种生产简单糖的方法,其特征在于,包括步骤(a)用权利要求l所述的纤维素酶或权利要求7所述的宿主细胞处理纤维素,从而产生简单糖;(b)分离出所述的简单糖,所述的简单糖包括纤维二糖、葡萄糖及其混合物。全文摘要本发明涉及一种新的纤维素酶、编码该酶的多核苷酸和经DNA重组技术产生这种酶的方法。本发明还涉及含该纤维素酶的载体和宿主细胞及其在生产简单糖和葡萄糖方面的用途。文档编号C12P19/02GK101245343SQ200710037459公开日2008年8月20日申请日期2007年2月13日优先权日2007年2月13日发明者明丁,李燕红,泉袁,许根俊,赵辅昆申请人:中国科学院上海生命科学研究院;浙江理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1