阿拉伯糖呋喃糖苷酶的制作方法

文档序号:431996阅读:618来源:国知局
专利名称:阿拉伯糖呋喃糖苷酶的制作方法
专利说明阿拉伯糖呋喃糖苷酶 发明领域 本发明涉及具有α-L-阿拉伯糖呋喃糖苷酶活性的分离多肽和编码该多肽的分离核酸序列。本发明也涉及含该核酸序列的核酸构建体、载体、宿主细胞,以及产生和使用该多肽的方法。

背景技术
阿拉伯糖呋喃糖苷酶能水解α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯糖呋喃糖苷残基,并分类为EC 3.2.1.55。已从多种生物体,包括丝状真菌中分离了阿拉伯糖呋喃糖苷酶。然而,已知几乎没有α-阿拉伯糖呋喃糖苷酶能从双取代木糖中释放阿拉伯糖。已经描述了一种来自青春双歧杆菌(Bifidobacterium adolescentis)的胞内酶能从双取代木糖的C3(也就是内部)释放阿拉伯糖(Van Laere,1997,Appl.Microbiol.Biotechnol,47,231-235和Vanden Broek,2005,Applied Microbiology and Biotechnology)。已从大麦分离了对单取代和末端双取代木糖有活性的酶,但其对内部双取代木糖几乎没有活性(Ferre,2000,Eur.J.Biochem.,267,6633-6641)。来自里氏木霉(Trichodermareesei)的酶可能对末端双取代残基有活性(观察到对3,5-二-O-α-L-阿拉伯糖呋喃糖基-α-L-阿拉伯糖呋喃糖苷(3,5-di-O-alpha-Larabinofuranosyl-alpha-L-arabinofuranoside)的活性),但其对具有内部C3取代阿拉伯糖的寡底物却没有活性(Nogawa,1999,Appl.Environ.Microbiol.,65,3964-3968)。
与全长现有技术序列比较显示,SEQ ID NO2所示成熟氨基酸序列与球毛壳菌(Chaetomium globosum)氨基酸序列有72%同源性,其相应SEQ IDNO1 DNA序列与相应球毛壳菌DNA序列有73%同源性。SEQ ID NO2所示序列与双歧杆菌属(Bifidobacterium sp.)的细菌GH43 α-L-阿拉伯糖呋喃糖苷酶之间的同源性是25%。SEQ ID NO4所示成熟氨基酸序列与黑曲霉(Aspergillus niger)阿拉伯糖呋喃糖苷酶有38%同源性。
发明概述 本发明的发明人分离了来自丝状真菌特异腐质霉(Humicola insolens)(SEQ ID NO2)和巨多孔菌(Meripilus giganteus)(SEQ ID NO4)菌株的α-L-阿拉伯糖呋喃糖苷酶。本发明的发明人也分离了编码新α-L-阿拉伯糖呋喃糖苷酶的基因。该酶是细胞外的。来自特异腐质霉的α-L-阿拉伯糖呋喃糖苷酶属于GH43家族,来自巨多孔菌的α-L-阿拉伯糖呋喃糖苷酶属于GH51家族。
来自特异腐质霉的α-L-阿拉伯糖呋喃糖苷酶能从双取代木糖释放阿拉伯糖,即该α-L-阿拉伯糖呋喃糖苷酶对具有连接至C2和C3的阿拉伯糖的小麦阿拉伯糖木聚糖(arabinoxylan)的木糖单元有活性。对双取代木糖的活性在将阿拉伯糖木聚糖完全水解为单糖时,例如从生物质(biomass)产生乙醇中是必要的。
因此,在第一方面,本发明提供了源自真菌的阿拉伯糖呋喃糖苷酶,优选腐质霉属(Humicola)内的菌种,所述阿拉伯糖呋喃糖苷酶能从双取代木糖释放阿拉伯糖。
因此,在第二方面,本发明提供了阿拉伯糖呋喃糖苷酶,其为a)具有SEQ ID NO2所示成熟肽氨基酸序列的多肽,或者可从其通过一个或多个氨基酸的取代、缺失和/或插入而获得的多肽;b)下述i)或ii)所定义的多肽的类似物,其i)与所述多肽有至少80%同源性,ii)为所述多肽的等位基因变体(allelic variant),c)由核酸序列编码的多肽,所述核酸序列在高严紧条件下与编码成熟多肽的SEQ ID NO2核酸序列互补链或其具有至少100个核苷酸的亚序列杂交。
因此,在第三方面,本发明提供了阿拉伯糖呋喃糖苷酶,其为a)具有SEQ ID NO4所示成熟肽氨基酸序列的多肽,或可从其通过一个或多个氨基酸的取代、缺失和/或插入而获得的多肽;b)下述i)或ii)所定义的多肽的类似物,其i)与所述多肽有至少60%同源性,ii)为所述多肽的等位基因变体,c)由核酸序列编码的多肽,所述核酸序列在高严紧条件下与编码成熟多肽的SEQ ID NO2核酸序列互补链或其具有至少100个核苷酸的亚序列杂交。
在第四方面,本发明提供了核酸序列,其包含编码第一或第二方面的阿拉伯糖呋喃糖苷酶的核酸序列。
在第五方面,本发明提供了核酸序列,其包括a)DNA序列,其编码SEQ ID NO2和SEQ ID NO4所示任一阿拉伯糖呋喃糖苷酶,b)DNA序列类似物,其i)与所述任一DNA序列有至少80%同源性,或ii)与所述任一DNA序列互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交,或iii)为其等位基因变体,或者c)a)或b)的互补链。
在第六方面,本发明提供了核酸序列,其与SEQ ID NO1和SEQ ID NO3所示任一DNA序列有至少80%同源性,或者a)与所述任一DNA序列互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交的核酸序列,b)为其等位基因变体的核酸序列,或c)a)或b)互补链。
在第七方面,本发明提供了核酸构建体,其包含与一个或多个调控序列可操作连接的第二、第三、第四方面的核酸序列,所述调控序列能指导阿拉伯糖呋喃糖苷酶在合适表达宿主中表达。
在第八方面,本发明提供了重组表达载体,其包含第六方面所述核酸构建体。
在第九方面,本发明提供了重组宿主细胞,其包含第六方面所述核酸构建体。
在第九方面,本发明提供了产生阿拉伯糖呋喃糖苷酶的方法,其包括在有利于产生阿拉伯糖呋喃糖苷酶的条件下培养第九方面的宿主细胞,和回收阿拉伯糖呋喃糖苷酶。
在第十方面,本发明提供了包含第一、第二方面的阿拉伯糖呋喃糖苷酶的组合物。
在其它方面,本发明提供了第一、第二方面的阿拉伯糖呋喃糖苷酶的用途。
附图简述

图1A-C显示了阿拉伯糖木聚糖聚合物。
图1A显示了完整的阿拉伯糖木聚糖。
图1B显示了双取代的阿拉伯糖木聚糖。
图1C显示了单取代的阿拉伯糖木聚糖。
图2A-C显示了阿拉伯糖木糖寡糖(arabinoxylo-oligosaccharides)。
图2A显示了连接于内部C-3上的阿拉伯糖基。
图2B显示了连接于末端C-3上的阿拉伯糖基。
图2C显示了连接于内部C-2上的阿拉伯糖基。
发明详述 在本发明第二方面的具体实施方式
中,分离多肽具有的氨基酸序列与SEQ ID NO2的氨基酸1-558所示氨基酸序列有至少80%同一性。在本发明感兴趣的具体实施方式
中,多肽与SEQ ID NO2的氨基酸1-558所示氨基酸序列有至少75%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性。
在本发明第三方面具体实施方式
中,分离多肽具有的氨基酸序列与SEQID NO4的氨基酸1-643所示氨基酸序列有至少50%同一性。在本发明感兴趣的具体实施方式
中,多肽与SEQ ID NO4的氨基酸1-643所示氨基酸序列有至少60%,至少70%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性。
在优选具体实施方式
中,分离多肽具有的氨基酸序列与SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示任一氨基酸序列,相差五个氨基酸,例如相差四个氨基酸,如相差三个氨基酸,相差两个氨基酸,或相差一个氨基酸。
在本发明第二方面具体实施方式
中,分离多肽是能从双取代的木糖释放阿拉伯糖的α-L-阿拉伯糖呋喃糖苷酶,例如,所述α-L-阿拉伯糖呋喃糖苷酶对具有连接于C2和C3的阿拉伯糖的小麦阿拉伯糖木聚糖的木糖单元有活性。
序列比对和同源性计算可通过本领域已知的计算机程序,例如GCG程序包中所提供的GAP来适当确定(Program Manual for the Wisconsin Package,Version 8,August 1994,Genetics Computer Group,575 Science Drive,Madison,Wisconsin,USA 53711)(Needleman,S.B.and Wunsch,C.D.,(1970),Journal ofMolecular Biology,48,443-453)。氨基酸序列比较采用下列设定GAP产生罚分(GAP creation penalty)3.0,GAP延伸罚分0.1。用于同源性测定的氨基酸序列相关部分为成熟多肽,即不含信号肽。
优选地,本发明多肽包含SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示的任一氨基酸序列,其等位基因变体,或其有阿拉伯糖呋喃糖苷酶活性的片段。很显然,本发明多肽也可以由SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示任一氨基酸序列组成。
等位基因变体意味着占据相同染色体基因座的基因的任意两种或多种可选形式。等位基因变体通过突变天然产生,并且可导致群体内的多态性。基因突变可以是沉默突变(编码多肽没有改变),也可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位变体所编码的多肽。
在本发明具体实施方式
中,分离多肽由下列核酸序列编码,所述核酸序列在低严紧条件下,优选在中严紧条件下,更优选在高严紧条件下与(i)SEQID NO1的核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示任一核酸序列的互补链,或(ii)至少100个核苷酸的(i)的亚序列杂交(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,New York)。
SEQ ID NO1的核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示任一核酸序列互补链的亚序列,可为至少100个核苷酸或优选至少200个核苷酸。此外,亚序列应该编码具有阿拉伯糖呋喃糖苷酶活性的多肽片段。多肽也可以是具有阿拉伯糖呋喃糖苷酶活性的多肽的等位基因变体或片段。
多肽变体具体包含一个或多个氨基酸的取代、缺失和/或插入。在特定具体实施方式
中,多肽是具体多肽的热稳定变体。
变体多肽的氨基酸序列可与SEQ ID NO2的氨基酸1-558或SEQ IDNO4的氨基酸1-643的具体氨基酸序列,因插入或缺失一个或多个氨基酸残基和/或用不同氨基酸残基取代一个或多个氨基酸残基而不同。优选地,氨基酸改变是次要特性的改变,即不显著影响蛋白折叠和/或活性的保守氨基酸取代;小的缺失,通常是1至约30个氨基酸;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至约20-25残基的小接头肽;或者通过改变净电荷或其它功能有利于纯化的小延伸,例如聚组氨酸簇(poly-histidine tract)、抗原表位或结合域。
保守取代的实例是下列组内的取代碱性氨基酸组(精氨酸,赖氨酸和组氨酸),酸性氨基酸组(谷氨酸和天冬氨酸),极性氨基酸组(谷氨酰氨和天冬酰氨),疏水性氨基酸组(亮氨酸,异亮氨酸和缬氨酸),芳香氨基酸组(苯丙氨酸,色氨酸和酪氨酸)以及小氨基酸组(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)。通常不改变特异活性(specific activity)的氨基酸取代是本领域已知的,并例如由H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,NewYork描述。最通常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly及它们反过来交换。
本文所指多肽可以包含指定的氨基酸序列,或者它们也可以是其等位基因变体;或其具有相关酶活性的片段。在一个具体实施方式
中,多肽包含指定的氨基酸序列或其等位基因变体;或其具有相关酶活性的片段。在另一具体实施方式
中,多肽由指定的氨基酸序列或其等位基因变体或其具有相关酶活性的片段所组成。
指定的氨基酸序列片段是从该氨基酸序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽。在一个具体实施方式
中,所述片段包含至少60个氨基酸残基,或至少68个,或至少70个,或至少75个,或至少100个,或至少150个,或至少160个,或至少170个,或至少180个,或至少190个,或至少200个,或至少210个,或至少220个,或至少240个,或至少260个,或至少280个,或至少300个,或至少310个,或至少320个,或至少330个,或至少334个,或至少350个,或至少375个,或至少400个,或至少425个,或至少430个氨基酸残基。
等位基因变体意味着占据相同染色体基因座的基因的任意两种或多种可选形式。等位基因变体通过突变自然产生,并且可导致群体内的多态性。基因突变可以是沉默突变(编码多肽没有改变),也可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位变体所编码的多肽。
成熟多肽或成熟氨基酸序列是指将潜在信号肽部分切去后剩下的那部分氨基酸序列。类似地,基因的成熟多肽编码部分是指相应于成熟多肽的那部分基因。
SEQ ID NO1和SEQ ID NO3任一的核酸序列或其亚序列,以及SEQ IDNO2和SEQ ID NO3任一的氨基酸序列或其片段,可用于按照本领域已知方法设计核酸探针,以从不同属或种的菌株鉴定和克隆DNA,所述DNA编码具有阿拉伯糖呋喃糖苷酶活性的多肽。特别地,这些探针能够用于根据标准Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中的相应基因。这些探针可比全长序列短许多,但其长度应当是至少15,优选至少25,更优选至少35个核苷酸。也可以使用较长探针。DNA和RNA探针均可使用。通常将探针标记以检测相应基因(例如32P,3H,35S,生物素,或抗生物素蛋白)。这些探针包括在本发明中。
因此,从其它类似生物体制备的基因组DNA或cDNA文库,可用于筛选与上述探针杂交并且编码具有阿拉伯糖呋喃糖苷酶活性的多肽的DNA。这些其它生物体的基因组或其它DNA,可以通过琼脂糖或聚丙烯酰氨凝胶电泳分离,或通过本领域技术人员已知的其它分离技术分离。可将来自文库的DNA或分离DNA转移到并固定至硝化纤维素或其它合适载体材料上。为了鉴定与SEQ ID NO1或SEQ ID NO3或其亚序列同源的克隆或DNA,将载体材料用于Southern印迹。就本发明而言,杂交显示核酸序列与SEQ ID NO1和SEQ ID NO3、其互补链或其亚序列任一所示核酸序列相应的标记核酸探针在低至高严紧条件下杂交。在这些条件下与核酸探针杂交的分子用X-射线片来检测。
在另一感兴趣具体实施方式
中,核酸探针是编码SEQ ID NO2和SEQ IDNO4任一的(成熟)多肽,或其亚序列的核酸序列。在第三感兴趣的具体实施方式
中,核酸探针是SEQ ID NO1和SEQ ID NO3中的任意一个。在第四感兴趣的具体实施方式
中,核酸探针是SEQ ID NO1和SEQ ID NO3成熟多肽编码区中的任意一个。
对于长度至少100个核苷酸的长探针,将低严紧性条件至高严紧性条件定义为,在42℃,在5×SSPE、0.3%SDS、200μg/ml已剪切和变性的鲑精DNA,对于低严紧性25%甲酰胺,对于中严紧性35%甲酰胺,或对于高严紧性50%甲酰胺中,根据标准的Southern印迹方法进行预杂交和杂交。
对于长度至少100个核苷酸的长探针,将载体材料最终用2×SSC,0.2%SDS,优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),甚至更优选至少在65℃(高严紧性)洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧性条件定义为在比用Bolton和McCarthy的计算法(1962,Proceedings of the NationalAcademy of Sciences USA 481390)计算得出的Tm低5℃至10℃,在0.9MNaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1×登哈特溶液(Denhardt′s solution),1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasic phosphate),0.1mM ATP和每ml 0.2mg的酵母RNA中,根据标准的Southern印迹方法进行预杂交、杂交和杂交后洗涤(washingpost-hybridization)。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将载体材料在6×SSC加0.1%SDS中洗涤一次15分钟,并用6×SSC在低于计算的Tm 5℃至10℃洗涤两次,每次15分钟。
如上所述,本发明多肽可以是具有SEQ ID NO2和SEQ ID NO4任一氨基酸序列的多肽,或其成熟多肽,其中一个或多个氨基酸被另一(其它)氨基酸所取代,其中一个或多个氨基酸缺失,和/或其中一个或多个氨基酸插入。
优选地,氨基酸改变是次要特性的改变,即不显著影响蛋白折叠和/或活性的保守氨基酸取代;小的缺失,通常为1至约30个氨基酸;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至约20-25残基的小接头肽;或者通过改变净电荷或其它功能而有利于纯化的小延伸,例如聚组氨酸簇、抗原表位或结合域。
保守取代的实例是下列组内的取代碱性氨基酸组(精氨酸,赖氨酸和组氨酸),酸性氨基酸组(谷氨酸和天冬氨酸),极性氨基酸组(谷氨酰氨和天冬酰氨),疏水性氨基酸组(亮氨酸,异亮氨酸和缬氨酸),芳香氨基酸组(苯丙氨酸,色氨酸和酪氨酸)以及小氨基酸组(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)。通常不改变特异活性的氨基酸取代是本领域已知的,并例如由H .Neurathand R.L.Hill,1979,In,The Proteins,Academic Press,New York描述。最通常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly及它们反过来交换。
通常而言,优选本发明多肽具有的阿拉伯糖呋喃糖苷酶活性是具有SEQID NO2的氨基酸1-558和SEQ ID NO·4的氨基酸1-643任一所示氨基酸序列的多肽的至少20%。特别优选的多肽具有的阿拉伯糖呋喃糖苷酶活性是具有SEQ ID NO2的氨基酸1-558和SEQ ID NO4的氨基酸1-643所示任一氨基酸序列的多肽的至少30%,例如至少40%,例如至少50%,优选至少60%,如至少70%,例如至少80%,更优选至少90%,或至少95%。
本发明多肽可从任何属的微生物得到。就本发明而言,本文所用术语“从...中得到”连同给出的来源,可指由核酸序列编码的多肽通过所述来源或通过细胞产生,其中所述细胞已经插入来自所述来源的核酸序列。在优选的实施方案中,多肽是分泌到细胞外的。
本发明多肽可为真菌多肽,更优选丝状真菌多肽,例如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、丝梗霉属(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂殖菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多肽。
在另一优选实施方案中,多肽是棘孢曲霉(Aspergillus aculeatus),泡盛曲霉(Aspergillus awamori),臭曲霉(Aspergillus foetidus),日本曲霉(Aspergillusjaponicus),构巢曲霉(Aspergillus nidulans),黑曲霉(Aspergillus niger),米曲霉(Aspergillus oryzae),杆孢状镰孢(Fusarium bactridioides),禾谷镰孢(Fusariumcerealis),库威镰孢(Fusarium crookwellense),大刀镰孢(Fusarium culmorum),禾本科镰孢(Fusarium graminearum),禾赤镰孢(Fusarium graminum),异孢镰孢(Fusarium heterosporum),合欢木镰孢(Fusarium negundi),尖孢镰孢(Fusarium oxysporum),多枝镰孢(Fusarium reticulatum),粉红镰孢(Fusariumroseum),接骨木镰孢(Fusarium sambucinum),肤色镰孢(Fusariumsarcochroum),拟分枝孢镰孢(Fusarium sporotrichioides),硫色镰孢(Fusariumsulphureum),圆镰孢(Fusarium torulosum),拟丝孢镰孢(Fusariumtrichothecioides),镶片镰孢(Fusarium venenatum),特异腐质霉(Humicolainsolens),疏棉状腐质霉(Humicola lanuginosa),巨多孔菌(Meripilus giganteus).米赫毛霉(Mucor miehei),嗜热毁丝霉(Myceliophthora thermophila),粗糙脉孢菌(Neurospora crassa),产紫青霉(Penicillium purpurogenum),哈茨木霉(Trichoderma harzianum),康宁木霉(Trichoderma koningii),长枝木霉(Trichoderma longibrachiatum),里氏木霉(Trichoderma reesei),或绿色木霉(Trichoderma viride)多肽。
在本发明优选的实施方案中,本发明多肽源自子囊菌门(Ascomycota)菌株,例如腐质霉属(Humicola),如疏棉状腐质霉、棕黑腐质霉(H.fuscoatra)、灰色腐质霉(H.grisea)、藤黄腐质霉(H.lutea)、黑腐质霉(H.nigrescens)、以及特别是特异腐质霉,或者是源自担子菌门(Basidiomycota)菌株,例如多孔菌属(Meripilus),如巨多孔菌。
可以理解,对于上述菌种,本发明包括其完全阶段和不完全阶段以及其他分类学上的等同物,例如无性型,而不管它们的已知种名。本领域的技术人员将容易地辨别适当等同物的同一性。
这些菌种的菌株容易地被公众在许多培养物保藏中心获得,诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH)(DSM)、荷兰微生物保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)和美国农业研究菌种保藏中心(Agricultural ResearchService Patent Culture Collection,Northern Regional Research Center)(NRRL)。
在本发明特别优选实施方式中,本发明多肽源自WO9117243中所记载的特异腐质霉菌株,其根据布达佩斯条约规定于1980年4月14日以DSM号1800保藏于德国微生物和细胞培养物保藏中心(DSM,Deutsche Sammlung vonMikroorganismen und Zellkulturen)

德国。
在本发明第二特别优选的实施方式中,本发明多肽源自巨多孔菌特定菌株,该菌株在荷兰微生物保藏中心(CBS),Uppsalalaan 8,3584 CT Utrecht,TheNetherlands(或者,P.O.Box 85167,3508 AD Utrecht,The Netherlands)具有登录号CBS 521.95。
此外,用上述探针可从其它资源,包括从自然界(例如土壤、堆肥、水等)分离的微生物来鉴定和获得这些多肽。从自然环境分离微生物的技术是本领域众所周知的。然后通过类似地筛选其它微生物基因组或cDNA文库来获得核酸序列。一旦用探针检测到编码多肽的核酸序列,该序列就可用本领域普通技术人员已知的技术分离或克隆(参见例如,Sambrook等,1989,见前文)。
由本发明核酸序列编码的多肽也包括另一多肽融合在该多肽或其片段N-末端或C-末端的融合多肽或可切割融合多肽。融合多肽可通过将编码另一多肽的核酸序列(或其部分)融合于本发明核酸序列(或其部分)来制备。制备融合多肽的技术是本领域已知的,包括将编码多肽的编码序列连接以使它们位于框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
核酸序列 本发明也涉及编码本发明多肽的分离核酸序列。
在一个感兴趣的实施方式中,核酸序列与SEQ ID NO1的核苷酸1-1677和SEQ ID NO2的核苷酸46-1974所示任一核酸序列有至少80%同一性。优选地,核酸序列与SEQ ID NO1的核苷酸1-1677和SEQ ID NO2的核苷酸46-1974所示任一核酸序列有至少至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性。在本发明另一感兴趣的实施方式中,核酸序列包含SEQ ID NO1的核苷酸1-1677所示氨基酸序列,其等位基因变体,或其能编码本发明多肽的片段中的任何一种。显然,核酸序列可由SEQ ID NO1的核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示的任一氨基酸序列所组成。
本发明也包括核酸序列,其编码具有SEQ ID NO2或SEQ ID NO4任一氨基酸序列的多肽或其成熟多肽,由于遗传密码简并性,所述核酸序列不同于SEQ ID NO1或SEQ ID NO3序列。本发明也涉及SEQ ID NO1或SEQ IDNO3的亚序列,所述亚序列编码SEQ ID NO2或SEQ ID NO4具有阿拉伯糖呋喃糖苷酶活性的片段。SEQ ID NO1或SEQ ID NO3的亚序列是SEQ IDNO1的核苷酸1-1677或SEQ ID NO3的核苷酸46-1974包含的核酸序列,只是从5′和/或3′端缺失一个或多个核苷酸。
本发明也涉及编码本发明多肽的分离核酸序列,所述核酸序列在低严紧条件下,优选在中严紧条件下,更优选在高严紧条件下,与(i)SEQ ID NO1核苷酸1-1677和SEQ ID NO3的核苷酸46-1974所示任一核酸序列的互补链,或(ii)(i)的至少100个核苷酸的亚序列杂交。本发明也涉及(i),(ii),和(iii)的互补链。
用于分离或克隆编码多肽的核酸序列的技术是本领域已知的,包括从基因组DNA分离、从cDNA制备或两者组合。将本发明核酸序列从这种基因组DNA克隆,可能通过例如使用熟知的聚合酶链式反应(PCR)或筛选表达文库的抗体以检测具有共有结构特征的克隆DNA片段的来实现。参见,例如,Innis et al.,1990,PCRA Guide to Methods and Application,Academic Press,New York。也可使用其它核酸扩增法,例如连接酶链式反应(ligase chainreaction,LCR),连接激活转录(ligated activated transcription,LAT)和基于核酸序列的扩增(nucleic acid sequence-based amplification,NASBA)。核酸序列可从特异腐质霉菌株或巨多孔菌菌株,或者其它或相关生物体克隆,例如,可以是该核酸序列多肽编码区的等位基因变体或种属变体(species variant)。
分离核酸序列,例如能够通过在遗传工程中使用的标准克隆方法获得,该方法将核酸序列从其天然位置重新定位至将其再生的不同位点。该克隆方法可涉及将包含编码多肽的核酸序列的期望核酸片段剪切和分离,将所述片段插入至载体分子,以及将重组载体整合至其中核酸序列的多拷贝或克隆将会复制的宿主细胞。核酸序列可以是基因组,cDNA,RNA,半合成,或合成来源的,或它们的任意组合。
就本发明而言,两核酸序列之间的同一性程度如上所述确定。
对于合成与所述多肽基本相似的多肽而言,修饰本发明多肽的编码核酸序列是必需的。术语与所述多肽“基本相似”是指多肽的非天然存在形式。这些多肽可与从天然来源分离的多肽在某些工程方式上不同,例如在比活、热稳定性、最适pH等方面不同的变体。变体序列可基于SEQ ID NO1多肽编码部分所示核酸序列,例如其亚序列来构建,和/或通过引入核苷酸取代来构建,所述核苷酸取代不产生由核酸序列编码多肽的其它氨基酸序列,但符合用于产生所述酶的宿主生物体的密码子选择,或通过引入可产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的概括描述,参见例如Ford et al.,1991,Protein Expression and Purification 295-107。
本领域技术人员显而易见,这些取代可在分子功能的关键区外进行而仍将产生活性多肽。对于由本发明的分离核酸序列编码的多肽活性必需的氨基酸残基(因此优选不对所述残基进行取代),可通过本领域已知方法来鉴定,例如定位诱变(site-directed mutagenesis)或丙氨酸分区诱变(alanine-scanningmutagenesis)(参见例如,Cunningham and Wells,1989,Science 2441081-1085)。在后一技术中,在分子中每个带正电荷的残基处引入突变,然后测试所得突变分子的阿拉伯糖呋喃糖苷酶活性以鉴定对于所述分子活性关键的氨基酸残基。底物-酶相互作用的位点也可通过三维结构分析来确定,例如通过诸如核磁共振分析、结晶学或光亲和标记技术来确定(参见例如,de Vos et al.,1992,Science 255306-312;Smith et al.,1992,Journal of Molecular Biology 224899-904;Wlodaver et al.,1992,FEBS Letters 30959-64)。
核酸构建体 本发明也涉及包含本发明核酸序列的核酸构建体,所述本发明核酸序列与一个或多个调控序列可操作连接,所述调控序列能指导所述多肽在合适宿主细胞中的表达。
可以各种方式操作编码本发明多肽的分离核酸序列以提供所述多肽的表达。核酸序列插入载体之前的操作可能是期望的或必需的,这取决于表达载体。用重组DNA方法修饰核酸序列的技术是本领域众所周知的。
调控序列包括对本发明多肽表达必需或有益的所有元件。每一调控序列对于编码多肽的核酸序列可以是天然或异源的。这样的调控序列包括,但不限于前导序列,聚腺苷酸化序列,前肽序列,启动子,信号肽序列,和转录终止子。最低限度,调控序列包括启动子,以及转录和翻译的终止信号。调控序列可与接头一起提供,以引入有利于调控序列与编码多肽的核酸序列编码区连接的特定限制位点。
调控序列可以是合适的启动子序列——被宿主细胞识别用于核酸序列表达的核酸序列。启动子序列包含介导多肽表达的转录调控序列。启动子可以是在所选择宿主细胞中显示转录活性的任何核酸序列,包括突变、截短和杂合启动子,并可获自与宿主细胞同源或异源的编码胞外或胞内多肽的基因。
指导本发明核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例,为获自大肠杆菌(E.coli)lac操纵子,天蓝色链霉菌(Streptomycescoelicolor)琼脂酶基因(dagA),枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB),地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶基因(amyM),解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ),地衣芽孢杆菌青霉素酶基因(penP),枯草芽孢杆菌xylA和xylB基因,和原核β-内酰胺酶基因的启动子(Villa-Kamaroff et al.,1978,Proceedings of the National Academy ofSciences USA 753727-3731),以及tac启动子(DeBoer et al.,1983,Proceedingsof the National Academy of Sciences USA 8021-25)。更多的启动子在″Usefulproteins from recombinant bacteria″in Scientific American,1980,24274-94;andin Sambrook et al.,1989,见前文,中有记载。
指导本发明核酸构建体在丝状真菌宿主细胞中转录的合适启动子实例,为获自下列酶的基因的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、和尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的杂合启动子);及其突变、截短和杂合的启动子。
在酵母宿主中,有用的启动子从下列酶的基因中得到酿酒酵母(Saccharomyces cerevisiae)烯醇酶(enolase)(ENO-1)、酿酒酵母半乳糖激酶(galactokinase)(GAL1)、酿酒酵母醇脱氢酶(alcohol dehydrogenase)/3-磷酸甘油醛脱氢酶(glyceraldehyde-3-phosphate dehydrogenase)(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶(3-phosphoglycerate kinase)。酵母宿主细胞的其他有用的启动子在Romanos et al.,1992,Yeast 8423-488中描述。
所述调控序列也可为合适的转录终止序列,即由宿主细胞识别以终止转录的序列。所述终止序列可操作地与编码多肽的核酸序列3’端连接。任何在所选宿主细胞中有功能的终止子都可用于本发明。
丝状真菌宿主细胞的优选终止子得自如下酶的基因米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶(anthranilate synthase)、黑曲霉α-葡萄糖苷酶(alpha-glucosidase)和尖孢镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子得自如下酶的基因酿酒酵母烯醇酶、酿酒酵母细胞色素C(cytochrome C)(CYC1)和酿酒酵母3-磷酸甘油醛脱氢酶。酵母宿主细胞的其他有用终止子在前述Romanos et al.,1992中描述。
所述调控序列也可为合适的前导序列,即对宿主细胞翻译重要的mRNA非翻译区。所述前导序列可操作地与编码多肽的核酸序列5’端连接。任何在所选宿主细胞中有功能的前导序列都可用于本发明。
对于丝状真菌宿主细胞优选的前导序列得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。
对于酵母宿主细胞合适的前导序列得自如下酶的基因酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/3-磷酸甘油醛脱氢酶(ADH2/GAP)。
所述调控序列也可为聚腺苷酸化序列,即可操作地与核酸序列3’端连接的序列,而且在转录时,其被宿主细胞识别为将聚腺苷残基添加于转录mRNA的信号。任何在所选宿主细胞中有功能的聚腺苷酸化序列都可用于本发明。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列得自如下酶的基因米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列在Guo and Sherman,1995,Molecular Cellular Biology 155983-5990中描述。
所述调控序列也可为信号肽编码区,所述信号肽编码区编码与多肽氨基末端连接的氨基酸序列,并且指导所编码的多肽进入细胞的分泌途径。所述核酸序列的编码序列5′端,可固有包含信号肽编码区,所述信号肽编码区与编码分泌多肽的编码区的区段以符合翻译可读框的方式天然连接。可替换地,编码序列5′端可包含编码序列外源的信号肽编码区。当编码序列天然不含信号肽编码区时,可能需要外源信号肽编码区。可替换地,外源信号肽编码区可简单替换天然信号肽编码区,以增强多肽的分泌。然而,任何指导表达多肽进入所选宿主细胞分泌途径的信号肽编码区都可用于本发明。
对于细菌宿主细胞有效的信号肽编码区是得自如下酶的基因的信号肽编码区芽孢杆菌属(Bacillus)NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢杆菌prsA。更多的信号肽由Simonen和Palva,1993,Microbiological Reviews 57109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码区是得自如下酶的基因的信号肽编码区米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶和疏棉状腐质霉脂肪酶。
对于酵母宿主细胞有用的信号肽得自酿酒酵母α-因子(alpha-factor)和酿酒酵母转化酶(invertase)的基因。其他有用的信号肽编码区由Romanos et al.,1992描述,见前文。
所述调控序列也可为前肽编码区,所述前肽编码区编码位于多肽氨基末端的氨基酸序列。所得多肽称为前酶(proenzyme)或前多肽(propolypeptide)(或有些情况下称为酶原(zymogen))。前多肽通常是无活性的,并可通过从前多肽催化或自催化切割前肽来转化为成熟活性多肽。前肽编码区可得自如下酶的基因枯草芽孢杆菌碱性蛋白酶(aprE),枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(laccase)(WO95/33836)。
当信号肽区和前肽区都存在于多肽氨基末端时,前肽区位于紧接着多肽的氨基末端,而信号肽区位于紧接着前肽区的氨基末端。
可能也期望添加允许调节与宿主细胞生长相关的多肽表达的调节序列。调节系统的实例是那些响应化学或物理刺激,包括在调节化合物存在的情况下,使所述基因表达开启或关闭的调节系统。在原核系统中,调节系统包括lac,tac,和trp操纵基因系统。在酵母中,可采用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可用作调节序列。调节序列的其他实例是那些允许基因扩增的调节序列。在真核系统中,这些包括在甲氨喋呤(methotrexate)存在下扩增的二氢叶酸还原酶(dihydrofolate reductase)基因,和在重金属存在下扩增的金属硫蛋白(metallothionein)基因。在这些情况下,编码多肽的核酸序列可操作地与调节序列连接。
表达载体 本发明也涉及包含本发明核酸序列、启动子以及转录和翻译终止信号的重组表达载体。可将上述多种核酸和调控序列连接在一起以产生重组表达载体,所述重组表达载体可包括一个或多个方便的限制酶切位点,以允许编码多肽的核酸序列在这些位点上的插入或取代。可替换地,本发明核酸序列可通过将所述核酸序列或含该序列的核酸构建体插入至合适的表达载体来进行表达。在构建所述表达载体的过程中,编码序列位于所述载体中以使编码序列与合适的表达调控序列可操作地连接。
重组表达载体可为能够方便地进行重组DNA方法并且能够使核酸序列表达的任何载体(例如,质粒或病毒)。载体的选择通常取决于载体与该载体将导入的宿主细胞之间的相容性。载体可为线性或闭合环状质粒。
载体可为自主复制载体,即作为染色体外实体存在、其复制不依赖于染色体复制的载体,例如质粒、染色体外元件(element)、微型染色体(minichromosome)或人工染色体。载体可包含确保自复制的任何元件。可替换地,载体是当其导入宿主细胞时,其整合入基因组并与所整合染色体一起复制的载体。此外,可采用单载体或质粒,或者两个或更多个载体或质粒,或者转座子(transposon),所述两个或更多个载体或质粒一起含有待导入宿主细胞基因组的总DNA。
本发明载体优选包含一个或多个允许容易选择转化细胞的可选择标记。可选择标记为基因,该基因的产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养等。细菌选择标记的实例为来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性,例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。对于酵母宿主细胞合适的标记为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的可选择标记,包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶(ornithinecarbamoyltransferase))、bar(膦丝菌素乙酰基转移酶(phosphinothricinacetyltransferase))、hygB(潮霉素磷酸转移酶(hygromycin phosphotransferase))、niaD(硝酸盐还原酶(nitrate reductase))、pyrG(乳清酸核苷-5’-磷酸脱羧酶(orotidine-5′-phosphate decarboxylase))、sC(硫酸腺苷酰基转移酶(sulfateadenyltransferase))、trpC(邻氨基苯甲酸合酶),以及其等同物。优选用于曲霉属细胞的标记是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明载体优选含有元件,所述元件允许载体稳定整合入宿主细胞基因组或允许所述载体在细胞中独立于基因组自主复制。
为了整合入宿主细胞基因组,载体可依赖于编码多肽的核酸序列或通过同源或非同源重组将载体稳定整合至基因组的任何其它载体元件。可替换地,所述载体可包含指导通过同源重组整合入宿主细胞基因组的额外核酸序列。所述额外核酸序列使载体能在染色体精确位置整合入宿主细胞基因组。为了提高精确位置整合可能性,整合元件应优选含有足够数量的核酸,如100-1,500个碱基对,优选400-1,500个碱基对,最优选800-1,500个碱基对,所述核酸与相应靶序列高度同源,以增加同源重组的可能性。整合元件可以为与宿主细胞基因组中靶序列同源的任何序列。
此外,整合元件可为非编码或编码核酸序列。另一方面,载体可通过非同源重组整合入宿主细胞的基因组。
为了自我复制,载体可进一步包含使载体能在所述宿主细胞中自主复制的复制起点。细菌复制起点的实例为允许在大肠杆菌中复制的质粒pBR322,pUC19,pACYC177,和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110,pE194,pTA1060,和pAMβ1的复制起点。酵母宿主细胞中使用的复制起点实例为2 micron复制起点、ARS1、ARS4、ARS1与CEN3的组合、以及ARS4与CEN6的组合。复制起点可为具有突变的复制起点,所述突变使其功能在宿主细胞中是温度敏感的(参见例如,Ehrlich,1978,Proceedings of the National Academy of Sciences USA 751433)。
可将多于一个拷贝的本发明核酸序列插入宿主细胞以增加基因产物的产生。核酸序列拷贝数的增加可通过将序列的至少一个额外拷贝整合入宿主细胞基因组而获得,或者通过将带有核酸序列的可扩增选择标记基因包括在其中而获得,其中含有选择标记基因的扩增拷贝的细胞(并因而核酸序列的额外拷贝),可在合适的选择剂存在下通过培养细胞来选择。
用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员所熟知的(参见例如,Sambrook et al.,1989,见前文)。
宿主细胞 本发明也涉及包含本发明核酸序列的重组宿主细胞,所述重组宿主细胞可有利地用于多肽的重组生产。
将包含本发明核酸序列的载体引入宿主细胞,以使所述载体作为染色体整合体保留,或作为自复制的染色体外载体保留,如前文所述。宿主细胞的选择在很大程度上取决于编码所述多肽的基因及其来源。
宿主细胞可为单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
有用的单细胞为细菌细胞,例如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞,例如嗜碱芽孢杆菌(Bacillus alkalophilus),解淀粉芽孢杆菌,短芽孢杆菌(Bacillus brevis),环状芽胞杆菌(Bacillus circulans),克劳氏芽孢杆菌(Bacillus clausii),凝结芽孢杆菌(Bacillus coagulans),灿烂芽孢杆菌(Bacilluslautus),迟缓芽孢杆菌(Bacillus lentus),地衣芽孢杆菌(Bacillus licheniformis),巨大芽孢杆菌(Bacillus megaterium),嗜热脂肪芽孢杆菌(Bacillusstearothermophilus),枯草芽孢杆菌(Bacillus subtilis),和苏云金芽孢杆菌(Bacillus thuringiensis);或者链霉菌属细胞,例如浅青紫链霉菌(Streptomyceslividans)或鼠灰链霉菌(Streptomyces murinus);或者革兰氏阴性细菌,例如大肠杆菌和假单胞菌属菌种(Pseudomonas sp.)。在优选的实施方式中,细菌宿主细胞为迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一优选实施方式中,芽孢杆菌属细胞是嗜碱的芽孢杆菌。
将载体导入细菌宿主细胞可通过,例如原生质体转化(参见例如,Changand Cohen,1979,Molecular General Genetics 168111-115)、使用感受态细胞(参见例如,Young and Spizizin,1961,Journal of Bacteriology 81823-829,或Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology 56209-221)、电穿孔(参见例如,Shigekawa and Dower,1988,Biotechniques 6742-751)、或接合(参见例如,Koehler and Thorne,1987,Journal of Bacteriology1695771-5278)来实现。
所述宿主细胞可为真核生物,例如哺乳动物、昆虫、植物或真菌细胞。在优选的实施方式中,宿主细胞为真菌细胞。本文所用“真菌”包括子囊菌门(Ascomycota),担子菌门(Basidiomycota),壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth et al.,In,Ainsworth and Bisby’s Dictionary ofThe Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK中所定义),以及卵菌门(Oomycota)(如在Hawksworth et al.,1995,见前文,171页所引用的)和所有有丝分裂孢子真菌(Hawksworth et al.,1995,见前文)。
在更优选的实施方案中,所述真菌宿主细胞是酵母细胞。本文所用“酵母”,包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在将来可能变化,所以就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所描述的。
在甚至更优选的实施方案中,所述的酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉(Yarrowia)细胞。
在最优选的实施方案中,所述酵母宿主细胞是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)细胞。在另一最优选实施方案中,所述酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一最优选实施方案中,所述酵母宿主细胞是Yarrowia lipolytica细胞。
在另一更优选的实施方案中,所述真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括所有丝状形式的真菌(Eumycota)和卵菌(Oomycota)亚门(如由Hawksworth et al.,1995,见前文所定义的)。所述丝状真菌的特征在于由壳多糖(chitin)、纤维素、葡聚糖(glucan)、脱乙酰壳多糖(chitosan)、甘露聚糖(mannan)和其它复杂多糖(complex polysaccharides)所组成的菌丝体壁(mycelial wall)。营养生长(vegetative growth)通过菌丝延长(hyphal elongation)来进行,并且碳分解代谢(carbon catabolism)是专性需氧的(obligately aerobic)。与此相反,酵母,诸如酿酒酵母的营养生长,则是通过单细胞菌体的芽殖(budding)进行,并且碳分解代谢可以是发酵的(fermentative)。
在甚至更优选的实施方案中,丝状真菌宿主细胞是,但不限于,枝顶孢霉属、曲霉属、镰孢属、腐质霉属、毛霉属、毁丝霉属、脉孢菌属、青霉属、梭孢壳属、弯颈霉属或木霉属的菌种的细胞。
在最优选的实施方案中,丝状真菌宿主细胞是泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一最优选的实施方案中,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在甚至最优选的实施方案中,丝状真菌亲本细胞是镶片镰孢(Nirenberg sp.nov.)细胞。在另一最优选的实施方案中,丝状真菌宿主细胞是特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
真菌细胞可通过下列方法、以本身已知手段进行转化,所述方法涉及原生质体形成、原生质体转化和细胞壁再生。曲霉属(Aspergillus)宿主细胞转化的合适方法在EP 238 023和Yelton et al.,1984,Proceedings of the NationalAcademy of Sciences USA 811470-1474中描述。转化镰孢属(Fusarium)菌种的合适方法,由Malardier et al.,1989,Gene 78147-156和WO 96/00787描述。酵母可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume194,pp 182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal ofBacteriology 153163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 751920中描述的方法进行转化。
生产方法 本发明也涉及产生本发明多肽的方法,所述方法包括(a)培养腐质霉属(Humicola)或多孔菌属(Meripilus)菌株,以产生含多肽的上清液;和(b)回收多肽。优选地,菌株为特异腐质霉菌种菌株或巨多孔菌菌种菌株。
本发明也涉及产生本发明多肽的方法,所述方法包括(a)在适于产生多肽的条件下培养如上所述的重组宿主细胞,和(b)从细胞和/或培养基回收多肽。
在本发明生产方法中,用本领域已知的方法,将细胞培养在适于多肽产生的营养培养基中。例如,所述细胞可通过摇瓶培养、在实验室或工业发酵罐中小规模或大规模发酵培养(包括连续的、分批的、补料分批的或固态发酵),在合适培养基中并在允许所述多肽表达和/或分离的条件下进行。所述培养用本领域已知方法,在含碳源、氮源和无机盐的合适营养培养基中进行。合适的培养基可从商业供应者获得或按公开组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果所述多肽分泌至营养培养基,那么所述多肽能直接从培养基回收。如果所述多肽不分泌,那么其能从细胞裂解物回收。
多肽可用对于多肽特异性的本领域已知方法进行检测。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶分析(enzymeassay)可用于测定本文所述多肽的活性。
所得多肽可通过本领域已知方法进行回收。例如,多肽可用常规方法从营养培养基回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明多肽也可通过本领域已知的多种方法进行纯化,所述方法包括但不限于层析(例如离子交换、亲和、疏水、色谱焦聚、和大小排阻)、电泳方法(例如制备等电聚焦(preparative isoelectric focusing))、溶解度差异(例如硫酸铵沉淀)、SDS-PAGE、或提取(参见例如,Protein Purification,J.-C.Janson和LarsRyden,editors,VCH Publishers,New York,1989)。
在植物中表达酶 可将编码目标多肽,如本发明阿拉伯糖呋喃糖苷酶的DNA序列,如下所述,在转基因植物中转化和表达。
转基因植物可为双子叶(dicotyledonous)或单子叶(monocotyledonous),简写为双子叶(dicot)或单子叶(monocot)。单子叶植物实例为草,例如草地早熟禾(meadow grass)(蓝草(blue grass),禾本科(Poa)),牧草(forage grass)例如羊茅属(Festuca)、黑麦草属(Lolium),温带草例如剪股颖属(Agrostis),以及谷类,例如小麦,燕麦,黑麦,大麦,水稻,高粱和玉米。
双子叶植物实例为烟草,豆类例如羽扇豆,马铃薯,糖甜菜,豌豆,菜豆,大豆,以及十字花科植物(十字花科(Brassicaceae family))例如花椰菜、油菜以及紧密相关的模型生物拟南芥(Arabidopsis thaliana)。
植物部分的实例为茎,愈伤组织,叶,根,果实,种子,块茎以及包含这些部分的独立组织,例如表皮、叶肉、薄壁组织、维管组织、分生组织。在本上下文中,特定植物细胞区室,例如叶绿体(chloroplast),质外体(apoplast),线粒体(mitochondria),液泡(vacuole),过氧物酶体(peroxisome)和细胞质,也都认为是植物部分。此外,任何植物细胞,无论其组织来源,都认为是植物部分。类似地,植物部分,如有利于本发明利用而分离的特定组织和细胞,也都认为是植物部分,例如胚(embryo),胚乳(endosperm),糊粉(aleurone)和种皮(seed coat)。
本发明范围也包括这些植物、植物部分和植物细胞的子代。
表达目标多肽的转基因植物或植物细胞可按本领域的已知方法构建。简言之,所述植物或植物细胞通过如下方法来构建将编码目标多肽的一个或多个表达构建体整合至植物宿主基因组,并将所得的修饰植物或植物细胞繁殖成转基因植物或植物细胞。
方便的是,表达构建体为DNA构建体,所述DNA构建体包含编码目标多肽的基因,所述基因与该基因在所选植物或植物部分中表达所需的合适调节序列操作性连接在一起。此外,表达构建体可包含用于鉴定已整合表达构建体的宿主细胞的选择标记和将构建体导入所述植物所必需的DNA序列(后者取决于所用的DNA导入方法)。
调节序列,如启动子和终止子序列以及可选地信号或转运序列的选择,基于例如预期酶表达的时间、地点及方式来确定。例如,编码本发明酶的基因的表达可为组成型或诱导型,或者表达可以是发育、阶段或组织特异性的,并且基因产物可靶向特定细胞区室、组织或植物部分,例如种子或叶。调节序列,例如由Tague et al,Plant,Phys.,86,506,1988描述。
就35S-CaMV组成型表达而言,可使用玉米泛素1和水稻肌动蛋白1启动子(Franck et al.1980.Cell 21285-294,Christensen AH,Sharrock RA andQuail 1992.Maize polyubiquitin genesstructure,thermal perturbation ofexpression and transcript splicing,and promoter activity following transfer toprotoplasts by electroporation.Plant Mo.Biol.18,675-689.;Zhang W,McElroy D.and Wu R 1991,Analysis of rice Actl 5’region activity in transgenic rice plants.Plant Cell 3,1155-1165)。器官特异性启动子可以是例如,来自贮存汇集组织(storage sink tissue)如种子、马铃薯块茎、和果实的启动子(Edwards&Coruzzi,1990.Annu.Rev.Genet.24275-303),或来自代谢汇集组织如分生组织的启动子(Ito et al.,1994.Plant Mol.Biol.24863-878),种子特异性启动子,如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu et al.,Plant and CellPhysiology Vol.39,No.8 pp.885-889(1998)),来自豆球蛋白B4的蚕豆(Viciafaba)启动子和来自Conrad U.et al,Journal of Plant Physiology Vol.152,No.6pp.708-711(1998)所述的蚕豆的未知种子蛋白基因,来自油籽体蛋白的启动子(Chen et al.,Plant and cell physiology vol.39,No.9 pp.935-941(1998),来自欧洲油菜(Brassica napus)的贮存蛋白napA启动子,或者本领域已知的任何其它种子特异性启动子,例如在WO 91/14772中所描述的。此外,启动子也可以是叶特异性启动子,例如来自水稻或番茄的rbcs启动子(Kyozuka et al.,PlantPhysiology Vol.102,No.3 pp.991-1000(1993),小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra,A.and Higgins,D W,Plant Molecular Biology Vol.26,No.1pp.85-93(1994),或来自水稻的aldP基因启动子(Kagaya et al.,Molecular andGeneral Genetics Vol.248,No.6 pp.668-674(1995),或伤口诱导启动子如马铃薯pin2启动子(Xu et al,Plant Molecular Biology Vol.22,No.4 pp.573-588(1993)。类似地,启动子可通过非生物处理例如温度、干旱或盐度改变来诱导,或者由激活启动子的外源施加的物质,例如乙醇,雌激素,植物激素如乙烯、脱落酸和赤霉酸以及重金属所诱导。
启动子增强元件在植物中可用于取得酶的较高表达。例如,启动子增强元件可为位于启动子与编码酶的核苷酸序列之间的内含子。例如,Xu et al.(前文已引用)公开了利用水稻肌动蛋白1基因的第一内含子来增强表达。
选择标记基因和表达构建体的任何其它部分可由本领域可用的那些来选择。
用本领域已知的常规技术将DNA构建体整合至植物基因组,所述常规技术包括农杆菌(Agrobacterium)-介导的转化,病毒-介导的转化,微注射(microinjection),粒子轰击,生物射弹转化,以及电穿孔(Gasser等,Science,244,1293;Potrykus,Bio/Techn.8,535,1990;Shimamoto等,Nature,338,274,1989)。
目前,根癌农杆菌(Agrobacterium tumefaciens)介导的基因转移是用于产生转基因双子叶植物的优选方法(参见综述Hooykas&Schilperoort,1992.Plant Mol.Biol.1915-38),并且其也能用于转化单子叶植物,尽管对单子叶植物通常使用其它转化方法。目前,用于产生转基因单子叶植物的优选方法除了农杆菌(Agrobacterium)法以外,还有胚愈伤组织或发育胚的粒子轰击(用转化DNA涂覆的精细金(microscopic gold)或钨颗粒)(Christou,1992.Plant J.2275-281;Shimamoto,1994.Curr.Opin.Biotechnol.5158-162;Vasil et al.,1992.Bio/Technology 10667-674)。转化单子叶植物的可选方法,基于如OmirullehS,et al.,Plant Molecular biology Vol.21,No.3 pp.415-428(1993)所述的原生质体转化来进行。
转化后,根据本领域熟知方法选择整合有表达构建体的转化体并将其再生成全植株。通常,将转化方法设计成通过利用例如两种独立T-DNA构建体的共转化或利用特异性重组酶位点特异性切除选择基因在再生期间或在后代中选择性地消除选择基因。
阿拉伯糖呋喃糖苷酶的用途 本发明也涉及本发明多肽即阿拉伯糖呋喃糖苷酶,在各种工业应用中的用途,例如在生物质转化,例如从含纤维素生物质生产燃料乙醇、从淀粉生产燃料和/或饮用乙醇中、在糖化用于啤酒生产中、在用于面包制备的生面团中或在动物饲料产品制备中的用途。
本发明进一步提供将含阿拉伯糖木聚糖的底物和/或生物质与能够从双取代木糖中释放阿拉伯糖的阿拉伯糖呋喃糖苷酶进行接触的方法。优选地,α-L-阿拉伯糖呋喃糖苷酶是GH43阿拉伯糖呋喃糖苷酶。GH43α-L-阿拉伯糖呋喃糖苷酶优选源自细菌、真菌或植物来源。优选地,含阿拉伯糖木聚糖的底物和/或生物质选自下列材料草本和/或木本能量作物,农业食品和饲料作物,动物饲料产品,块茎,根,茎,豆类,木薯外皮(cassava peel),可可豆荚(cocoa pod),稻皮和/或稻壳,来自米糠的稻麸(rice bran),穗轴,稻草,谷粒种皮和/或种壳,压榨甘蔗杆,甜菜渣,刺槐豆粕(locust bean pulp),蔬菜或水果渣(pomace),谷物或整粒农作物废弃物,麦杆(straw),秸秆,叶,玉米麸皮,壳,穗轴,外皮(rind),壳(shell),豆荚(pod),木材废弃物,树皮,刨花(shavings),锯屑(sawdust),木浆,纸浆液,废纸,纸板,建筑和废墟(demolition)木头废弃物,工业或城市废水固体物或淤泥,肥料,酿造和/或发酵工艺副产品,湿蒸馏酒糟(wet distillers grain),干蒸馏酒糟(dried distillers grain),酒糟(spentgrain),酒糟(vinasse)和甘蔗渣(bagasse)。
本发明也涉及包含本发明的多肽即阿拉伯糖呋喃糖苷酶的组合物,以及该组合物的用途。
材料与方法 阿拉伯糖和木糖从Merck(Darmstadt,Germany)购买。水溶性和水不溶性小麦阿拉伯糖木聚糖获自Megazyme(Bray,County Wicklow,Ireland)。
酶 将α-L-阿拉伯糖呋喃糖苷酶用基本分子技术克隆(Sambrook et al.,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,NewYork,Christgau et al.1995,Curr.Genet.27,135-141,Ausubel et al.,2003,Curr.Prot.Mol.Biol.,John Wiley&Sons,Cambridge,USA,)。
Van Laere et al.(1997) and Van den Broek et al.(2005)中的青春双歧杆菌α-L-阿拉伯糖呋喃糖苷酶获自Megazyme(Ireland)。
棘孢曲霉和疏棉状嗜热丝孢菌(Thermomyces lanuginosus)分别产生的单组分内-1,4-β-木聚糖酶制剂Shearzyme(GH10)和Pentopan Mono(GH11),从Novozymes A/S(

Denmark)商业获得。
制备特异的(specific)阿拉伯糖木聚糖聚合物和寡糖 通过如下方法制备双取代阿拉伯糖木聚糖将pH6.0 0.1M醋酸缓冲液(100mL)中的可溶性小麦阿拉伯糖木聚糖(1g)与每千克水溶性小麦阿拉伯糖木聚糖中0.167g来自巨多孔菌(GH51)的α-L-阿拉伯糖呋喃糖苷酶在30℃温育48小时。通过如下方法制备单取代阿拉伯糖木聚糖将pH6.0 0.1M醋酸缓冲液(42mL)中的水溶性小麦阿拉伯糖木聚糖(1g)与每千克水溶性小麦阿拉伯糖木聚糖中0.147g来自特异腐质霉(GH43)的α-L-阿拉伯糖呋喃糖苷酶在30℃温育48小时。为了终止酶反应,将混合物加热至100℃ 10min。通过添加乙醇(126ml)来沉淀阿拉伯糖木聚糖聚合物。将所述沉淀过滤(Miracloth)并且真空干燥。
通过如下方法制备含有连接于末端(1→3)的阿拉伯糖基的寡糖将pH6.00.1 M醋酸缓冲液(100mL)中的水不溶性小麦阿拉伯糖木聚糖(1g)与每千克水不溶性小麦阿拉伯糖木聚糖中6.67g Shearzyme(木聚糖酶GH10)在30℃温育2小时。通过如下方法制备含有连接于内部(1→3)的阿拉伯糖基的寡糖将pH6.0 0.1 M醋酸缓冲液(100mL)中的水不溶性小麦阿拉伯糖木聚糖(1g)与每公斤水不溶性小麦阿拉伯糖木聚糖中0.03g Pentopan Mono(木聚糖酶GH11)在30℃温育2小时。通过如下方法制备含有连接于内部(1→2)的阿拉伯糖基的寡糖将pH6.0,0.1 M醋酸缓冲液(100mL)中的水不溶性小麦阿拉伯糖木聚糖(1g)与每公斤水不溶性小麦阿拉伯糖木聚糖中0.03g Pentopan Mono(木聚糖酶GH11)和每公斤水溶性小麦阿拉伯糖木聚糖中来自特异腐质霉的α-L-阿拉伯糖呋喃糖苷酶(GH43)在30℃温育2小时。为了终止酶反应,将混合物加热至100℃ 10min。将阿拉伯糖木糖寡糖在旋转蒸发器上浓缩并且用1H-NMR评价。
对α-L-阿拉伯糖呋喃糖苷酶活性的活性分析 可使用5mM p-硝基苯基α-L-阿拉伯糖呋喃糖苷作为底物,如Poutanen etal.(Appl.Microbiol.Biotechnol.1988,28,425-432)所述,评估α-L-阿拉伯糖呋喃糖苷酶活性。反应可在50mM柠檬酸缓冲液中、于pH6.0 40℃进行,整个反应时间为30min。通过加入0.5ml 1M碳酸钠来终止反应,并在405nm检测所释放的对-硝基苯酚。活性以U/ml表示。
对C2-和C3-双取代木聚糖的活性分析 将中粘度水溶性小麦阿拉伯糖木聚糖(Megazyme,Bray,Ireland)用来自巨多孔菌的GH51α-阿拉伯糖呋喃糖苷酶(SEQ ID NO2)处理,以除去连接于阿拉伯糖木聚糖的C(O)-3阿拉伯糖的单个α-阿拉伯糖呋喃糖基取代基,从而产生具有连接于木糖残基的C(O)-2,3的阿拉伯糖呋喃糖基取代基的双取代阿拉伯糖木聚糖底物。将该底物透析并且冷冻干燥。
制备双取代阿拉伯糖木聚糖0.1%溶液,并通过在eppendorf管中混合0.1ml酶,0.9ml缓冲液(0.12M琥珀酸,pH6.0)和1.0ml底物溶液来检测α-阿拉伯糖呋喃糖苷酶活性。将eppendorf管在60℃振荡温育1小时。释放的阿拉伯糖的量可通过HPAEC(高效阴离子交换层析)测量。
HPAEC 将水解物(10μl)施加至装有Dionex CarboPacTM PA1保护柱(4×250mm)(Dionex Corporation,Sunnyvale,CA,USA)与CarboPacTM PA1预柱(4×50mm)组合的Dionex BioLC系统。用10mM KOH将单糖等度(isocratically)分离15min,流速1mL·min-1。可在脉冲安培检测模式中用脉冲电化学检测仪检测单糖。电极电压设计为+0.1V(t=0-0.4秒)至-2.0V(t=0.41-0.42秒)至0.6V(t=0.43秒)并且最终-0.1V(t=0.44-0.50秒),同时整合t=0.2-0.4秒所获信号。将阿拉伯糖和木糖混合物(各成分浓度0.0025-0.1g·L-1)用作标准。
1H-NMR分析 将所有降解产物从99.9%D2O冻干两次并再溶解于99.9%D2O中。将某些水解物透析(光谱/Por膜分子量截止1000)以在光谱分析之前除去游离阿拉伯糖。在以400MHz操作并装备有4-核自动切换探针的Varian Mercury-VX检测仪中在30℃记录1H-NMR光谱。收集128-512扫描数据,并且将 HDO信号用作参照信号(4.67ppm)。
实施例 实施例1 小麦阿拉伯糖木聚糖分别包含作为连接于内部木糖3-位(A)的单取代基的阿拉伯糖呋喃糖苷,和连接在双取代木糖的3-位(B)和2-位(C)的阿拉伯糖呋喃糖苷。产生每种仅含所述三种类型阿拉伯糖呋喃糖苷连接之一的底物。阿拉伯糖呋喃糖苷酶对这些底物的活性用1H NMR研究。
表1.α-L-阿拉伯糖呋喃糖苷酶活性的来源、家族及分子量
表2.在pH6,40℃温育2小时,对所选阿拉伯糖木聚糖聚合物的活性
xx表示多于75%水解,x(x)表示50-75%水解,x表示25-50%水解,(x)表示5-25%水解。-表示未检测到水解。
实施例2 将可溶小麦阿拉伯糖木聚糖与每千克DM中0.1g来自特异腐质霉(GH43),青春双歧杆菌(GH43),特异腐质霉(GH51)和巨多孔菌(GH51)的α-L-阿拉伯糖呋喃糖苷酶的酶蛋白温育24小时。检测释放的阿拉伯糖。结果以mg阿拉伯糖/g水溶性小麦阿拉伯糖木聚糖,作为三次检测的平均值表示,平均值偏差系数<6.4。
表3.用α-L-阿拉伯糖呋喃糖苷酶处理从可溶性小麦阿拉伯糖木聚糖释放的阿拉伯糖
实施例3 可将阿拉伯糖呋喃糖苷酶用在动物饲料组合物中以增加可消化性(digestibility)。玉米阿拉伯糖木聚糖大部分(heavily)用阿拉伯糖双取代。为了促进木聚糖降解,尽可能多地除去阿拉伯糖取代基是有利的。在体外消化系统中,对基于玉米的饲料中阿拉伯糖木聚糖的体外降解进行研究 在体外消化系统中对基于玉米的饲料中阿拉伯糖木聚糖的体外降解进行了研究,所述饲料补充有来自特异腐质霉的GH51阿拉伯糖呋喃糖苷酶和源自疏棉状嗜热丝孢菌的商业木聚糖酶。
体外消化系统的条件 底物800mg粉碎并预混合的30∶70大豆粉/玉米饲料(corn diet) pHpH5,4和3(胃)和4.0(过渡阶段),接着是小肠阶段pH6.8 胃蛋白酶3000U/g饲料 胰酶制剂 8mg/g饲料 温度40℃ 重复数4 酶剂量阿拉伯糖呋喃糖苷酶和木聚糖酶分别为50和67mg EP/kg 饲料 将样品用80%乙醇沉淀,离心并弃去上清液。将沉淀(pellet)在80%乙醇中洗涤,离心并弃去上清液。将沉淀溶解在乙酸缓冲液(pH5)中,在进行食物纤维(dietary fibre)分析前将淀粉除去。
表4.体外消化后残留的总非淀粉多糖残基中阿拉伯糖和木糖的含量
未共享相同字母标引的各列平均值具有不同的统计学显著性(P<0.05)。
序列表
<110>诺维信公司(Novozymes A/S)
<120>阿拉伯糖呋喃糖苷酶(Arabinofuranosidases)
<130>10814.204-W0
<160>4
<170>PatentIn version 3.3
<210>1
<211>1677
<212>DNA
<213>特异腐质霉(Humicola insolens)
<220>
<221>CDS
<222>(1)..(1677)
<220>
<221>信号肽
<222>(1)..(54)
<400>1
atg cta ggc ttg aag gtc ttg tgt ctc tcc gcc gtc gtg ggg acg gcg48
Met Leu Gly Leu Lys Val Leu Cys Leu Ser Ala Val Val Gly Thr Ala
1 5 10 15
gtc tct gtg ccg cac gcg ggc aat ctt ccc cgt cag gcc agc act ttc96
Val Ser Val Pro His Ala Gly Asn Leu Pro Arg Gln Ala Ser Thr Phe
20 25 30
acc aac ccc gtg ctt tgg gaa gat cac cca gat ctc gaa gtg ttc cgc 144
Thr Asn Pro Val Leu Trp Glu Asp His Pro Asp Leu Glu Val Phe Arg
35 40 45
gtc ggc tca gta ttc tac tac tcc tcg tcc acc ttc gcc tac tcc ccc 192
Val Gly Ser Val Phe Tyr Tyr Ser Ser Ser Thr Phe Ala Tyr Ser Pro
50 55 60
ggc gcg ccc gtc ctc aag tcc tac gac ctc gtc cac tgg acg ccc gtc 240
Gly Ala Pro Val Leu Lys Ser Tyr Asp Leu Val His Trp Thr Pro Val
65 70 75 80
acc cat tcc gtg ccg cgt ctc aac ttc ggc tcc aac tac gac ctc ccc 288
Thr His Ser Val Pro Arg Leu Asn Phe Gly Ser Asn Tyr Asp Leu Pro
85 90 95
agc ggc acc ccg ggc gcc tac gtc aag ggc atc tgg gcc tca acc ctc 336
Ser Gly Thr Pro Gly Ala Tyr Val Lys Gly Ile Trp Ala Ser Thr Leu
100 105 110
cgc tac cgc cgc tcc aat gac cgc ttc tac tgg tac ggc tgc gtc gaa 384
Arg Tyr Arg Arg Ser Asn Asp Arg Phe Tyr Trp Tyr Gly Cys Val Glu
115 120 125
ggg aga acc tac ctc tgg acc agc ccg ggc ggt aac gcg ctc gcc aac 432
Gly Arg Thr Tyr Leu Trp Thr Ser Pro Gly Gly Asn Ala Leu Ala Asn
130 135 140
aac ggc gag gtg ccc ccc tcg gca tgg aac tgg cag cac acc gcc acc 480
Asn Gly Glu Val Pro Pro Ser Ala Trp Asn Trp Gln His Thr Ala Thr
145 150 155 160
atc gac aac tgc tac tac gac gcc ggc ctg ctc atc gac gac gac gac 528
Ile Asp Asn Gys Tyr Tyr Asp Ala Gly Leu Leu Ile Asp Asp Asp Asp
165 170 175
acc atg tac atc gcg tac ggc aac ccg acc atc aac gtc gcg cag ctc 576
Thr Met Tyr Ile Ala Tyr Gly Asn Pro Thr Ile Asn Val Ala Gln Leu
180 185 190
tcc ccc gac ggc acc cgc cag gtg cgc gtg cag cag cgc gtc tac gcg 624
Ser Pro Asp Gly Thr Arg Gln Val Arg Val Gln Gln Arg Val Tyr Ala
195 200 205
cac ccg cag ggc cag acg gtc gag ggc gcg cgc atg tac aag atc cgc 672
His Pro Gln Gly Gln Thr Val Glu Gly Ala Arg Met Tyr Lys Ile Arg
210 215 220
ggc aac tac tac atc ctg gtg acc cgc ccc gcc gac gca gag tac gtg 720
Gly Asn Tyr Tyr Ile Leu Val Thr Arg Pro Ala Asp Ala Glu Tyr Val
225 230 235 240
ctg cgg tcg acg acg ggg tcg ccg ttc ggc ccg tac gag gcg cgc acg 768
Leu Arg Ser Thr Thr Gly Ser Pro Phe Gly Pro Tyr Glu Ala Arg Thr
245 250 255
ctg gtg tcg cgg atc cag ggc ccg ctg gcc aac gcc ggg ttc gcg cac 816
Leu Val Ser Arg Ile Gln Gly Pro Leu Ala Asn Ala Gly Phe Ala His
260 265 270
cag ggc ggc atc gtc gac gcg ccg gat ggg acg tgg cac tac gtc gcg 864
Gln Gly Gly Ile Val Asp Ala Pro Asp Gly Thr Trp His Tyr Val Ala
275 280 285
ttc atg gat gcg tat ccc ggc gga cgc atc ccc gtg gtg gcg ccg ctg 912
Phe Met Asp Ala Tyr Pro Gly Gly Arg Ile Pro Val Val Ala Pro Leu
290 295 300
cgg tgg acg gcg gat ggg tgg ccc gag gtg gtc acg gat tcg caa ggg 960
Arg Trp Thr Ala Asp Gly Trp Pro Glu Val Val Thr Asp Ser Gln Gly
305 310 315 320
agg tgg ggg acg agc tat ccc att cca gtt cgc gga gca aag aac gcg 1008
Arg Trp Gly Thr Ser Tyr Pro Ile Pro Val Arg Gly Ala Lys Asn Ala
325 330 335
acg gag ggg ctg gcg agc acg gat ctg gac gag ttc cgc ggg acg agg 1056
Thr Glu Gly Leu Ala Ser Thr Asp Leu Asp Glu Phe Arg Gly Thr Arg
340 345 350
ttc agc gag cat tgg gag tgg aat cat aac ccg gac acg agc aag ttt 1104
Phe Ser Glu His Trp Glu Trp Asn His Asn Pro Asp Thr Ser Lys Phe
355 360 365
acg ttg ctg ggc ggt aac gag ggc ggg ctc atc ctc cgg aca gcg acc 1152
Thr Leu Leu Gly Gly Asn Glu Gly Gly Leu Ile Leu Arg Thr Ala Thr
370 375 380
gtg acg ggg gat ttg ttt gcc gca agg aat acg ctc acg agg agg atc 1200
Val Thr Gly Asp Leu Phe Ala Ala Arg Asn Thr Leu Thr Arg Arg Ile
385 390 395 400
gcg gga ccc aag gcc agt gga atc ttc cgg ctg gat gtg cgc ggg atg 1248
Ala Gly Pro Lys Ala Ser Gly Ile Phe Arg Leu Asp Val Arg Gly Met
405 410 415
cgc gac ggt gac cgg gcc ggc gcc gtg ctg ttc cgg gat cgt gcg gcg 1296
Arg Asp Gly Asp Arg Ala Gly Ala Val Leu Phe Arg Asp Arg Ala Ala
420 425 430
tac atc ggg gtg tgg aag cag ggc aac gag gcg cgg att gtc atg gtg 1344
Tyr Ile Gly Val Trp Lys Gln Gly Asn Glu Ala Arg Ile Val Met Val
435 440 445
gac gac ctg cgg ttg aac gag gat ggt tgg agg acg gcg tcc acc ggc 1392
Asp Asp Leu Arg Leu Asn Glu Asp Gly Trp Arg Thr Ala Ser Thr Gly
450 455 460
aga gtg gcc gcc aac ggt ccg gtg atc gac acg aac gct cag cag gat 1440
Arg Val Ala Ala Asn Gly Pro Val Ile Asp Thr Asn Ala Gln Gln Asp
465 470 475 480
atc tgg ctg cga att gat gcg gac atc aca ccg gcg ttt ggg acg aac 1488
Ile Trp Leu Arg Ile Asp Ala Asp Ile Thr Pro Ala Phe Gly Thr Asn
485 490 495
acg gag cgc acg acg acg ttc tac tac agt att gat ggt ggg agg acg 1536
Thr Glu Arg Thr Thr Thr Phe Tyr Tyr Ser Ile Asp Gly Gly Arg Thr
500 505 510
tat acc agg ctg ggc cct gcc ttt gcg atg acc aat tct tgg aga tac 1584
Tyr Thr Arg Leu Gly Pro Ala Phe Ala Met Thr Asn Ser Trp Arg Tyr
515 520 525
ttc acc gga tac cgg ttt gga gtg ttc aac ttt tcg acc aag agt ctt 1632
Phe Thr Gly Tyr Arg Phe Gly Val Phe Asn Phe Ser Thr Lys Ser Leu
530 535 540
gga ggt gag gtg aag gtt aag ggg ttc aag atg aac atg atc tag 1677
Gly Gly Glu Val Lys Val Lys Gly Phe Lys Met Asn Met Ile
545 550 555
<210>2
<211>558
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>2
Met Leu Gly Leu Lys Val Leu Cys Leu Ser Ala Val Val Gly Thr Ala
1 5 10 15
Val Ser Val Pro His Ala Gly Asn Leu Pro Arg Gln Ala Ser Thr Phe
20 25 30
Thr Asn Pro Val Leu Trp Glu Asp His Pro Asp Leu Glu Val Phe Arg
35 40 45
Val Gly Ser Val Phe Tyr Tyr Ser Ser Ser Thr Phe Ala Tyr Ser Pro
50 55 60
Gly Ala Pro Val Leu Lys Ser Tyr Asp Leu Val His Trp Thr Pro Val
65 70 75 80
Thr His Ser Val Pro Arg Leu Asn Phe Gly Ser Asn Tyr Asp Leu Pro
85 90 95
Ser Gly Thr Pro Gly Ala Tyr Val Lys Gly Ile Trp Ala Ser Thr Leu
100 105 110
Arg Tyr Arg Arg Ser Asn Asp Arg Phe Tyr Trp Tyr Gly Cys Val Glu
115 120 125
Gly Arg Thr Tyr Leu Trp Thr Ser Pro Gly Gly Asn Ala Leu Ala Asn
130 135 140
Asn Gly Glu Val Pro Pro Ser Ala Trp Asn Trp Gln His Thr Ala Thr
145 150 155 160
Ile Asp Asn Cys Tyr Tyr Asp Ala Gly Leu Leu Ile Asp Asp Asp Asp
165 170 175
Thr Met Tyr Ile Ala Tyr Gly Asn Pro Thr Ile Asn Val Ala Gln Leu
180 185 190
Ser Pro Asp Gly Thr Arg Gln Val Arg Val Gln Gln Arg Val Tyr Ala
195 200 205
His Pro Gln Gly Gln Thr Val Glu Gly Ala Arg Met Tyr Lys Ile Arg
210 215 220
Gly Asn Tyr Tyr Ile Leu Val Thr Arg Pro Ala Asp Ala Glu Tyr Val
225 230 235 240
Leu Arg Ser Thr Thr Gly Ser Pro Phe Gly Pro Tyr Glu Ala Arg Thr
245 250 255
Leu Val Ser Arg Ile Gln Gly Pro Leu Ala Asn Ala Gly Phe Ala His
260 265 270
Gln Gly Gly Ile Val Asp Ala Pro Asp Gly Thr Trp His Tyr Val Ala
275 280 285
Phe Met Asp Ala Tyr Pro Gly Gly Arg Ile Pro Val Val Ala Pro Leu
290 295 300
Arg Trp Thr Ala Asp Gly Trp Pro Glu Val Val Thr Asp Ser Gln Gly
305 310 315 320
Arg Trp Gly Thr Ser Tyr Pro Ile Pro Val Arg Gly Ala Lys Asn Ala
325 330 335
Thr Glu Gly Leu Ala Ser Thr Asp Leu Asp Glu Phe Arg Gly Thr Arg
340 345 350
Phe Ser Glu His Trp Glu Trp Asn His Asn Pro Asp Thr Ser Lys Phe
355 360 365
Thr Leu Leu Gly Gly Asn Glu Gly Gly Leu Ile Leu Arg Thr Ala Thr
370 375 380
Val Thr Gly Asp Leu Phe Ala Ala Arg Asn Thr Leu Thr Arg Arg Ile
385 390 395 400
Ala Gly Pro Lys Ala Ser Gly Ile Phe Arg Leu Asp Val Arg Gly Met
405 410 415
Arg Asp Gly Asp Arg Ala Gly Ala Val Leu Phe Arg Asp Arg Ala Ala
420 425 430
Tyr Ile Gly Val Trp Lys Gln Gly Asn Glu Ala Arg Ile Val Met Val
435 440 445
Asp Asp Leu Arg Leu Asn Glu Asp Gly Trp Arg Thr Ala Ser Thr Gly
450 455 460
Arg Val Ala Ala Asn Gly Pro Val Ile Asp Thr Asn Ala Gln Gln Asp
465 470 475 480
Ile Trp Leu Arg Ile Asp Ala Asp Ile Thr Pro Ala Phe Gly Thr Asn
485 490 495
Thr Glu Arg Thr Thr Thr Phe Tyr Tyr Ser Ile Asp Gly Gly Arg Thr
500 505 510
Tyr Thr Arg Leu Gly Pro Ala Phe Ala Met Thr Asn Ser Trp Arg Tyr
515 520 525
Phe Thr Gly Tyr Arg Phe Gly Val Phe Asn Phe Ser Thr Lys Ser Leu
530 535 540
Gly Gly Glu Val Lys Val Lys Gly Phe Lys Met Asn Met Ile
545 550 555
<210>3
<211>2200
<212>DNA
<213>巨多孔菌(Miripilus giganteus)
<220>
<221>CDS
<222>(46)..(1974)
<220>
<221>信号肽
<222>(46)..(94)
<400>3
actagtaacg gccgccagtg tgctggaaag ggctcgctcg acacg atg aag ctg ctt57
Met Lys Leu Leu
1
ttc ttg ctc ggg gcc ttc gtt gcg caa tgt ctc gcg gtc aca gtg acc 105
Phe Leu Leu Gly Ala Phe Val Ala Gln Cys Leu Ala Val Thr Val Thr
5 10 15 20
gtt aac aag aac cct agt cac acg gta ccg tcc acg ctc tat ggc ctg 153
Val Asn Lys Asn Pro Ser His Thr Val Pro Ser Thr Leu Tyr Gly Leu
25 30 35
atg ttt gag gac atc aac cat agc ggt gat ggc ggc ctg tac gcg gag 201
Met Phe Glu Asp Ile Asn His Ser Gly Asp Gly Gly Leu Tyr Ala Glu
40 45 50
ttg ttg caa aac agg gct ttc caa cag gtt acc ccg aac acg gcc gct 249
Leu Leu Gln Asn Arg Ala Phe Gln Gln Val Thr Pro Asn Thr Ala Ala
55 60 65
gca ctc gct gca tgg cat ccc atc agc aat gcg aag ctg gcc gta ata 297
Ala Leu Ala Ala Trp His Pro Ile Ser Asn Ala Lys Leu Ala Val Ile
70 75 80
caa gac cca tct cct gtc tcc aat gca ttg ccg aat tcc ctt caa ttc 345
Gln Asp Pro Ser Pro Val Ser Asn Ala Leu Pro Asn Ser Leu Gln Phe
85 90 95 100
tcc gtg ccc agt gga tcg agc ggc agg gtc ggc ttt acc aac gag ggt 393
Ser Val Pro Ser Gly Ser Ser Gly Arg Val Gly Phe Thr Asn Glu Gly
105 110 115
ttc tgg gga atc aaa gtc gat tcc act tgg acg tac aaa gcc tcg ctc 441
Phe Trp Gly Ile Lys Val Asp Ser Thr Trp Thr Tyr Lys Ala Ser Leu
120 125 130
ttc ttc cgc ttc ccc aca tcg tcg tcc ttc tcg gga gcg ctc acc gtt 489
Phe Phe Arg Phe Pro Thr Ser Ser Ser Phe Ser Gly Ala Leu Thr Val
135 140 145
ggg ctg cag acg aac gcc ggg aga gtg ctg gca cag aac tcc acg cag 537
Gly Leu Gln Thr Asn Ala Gly Arg Val Leu Ala Gln Asn Ser Thr Gln
150 155 160
atc cgc ggg acg acc acg aag tgg acg cag atc aac ctg gag ctc cac 585
ILe Arg Gly Thr Thr Thr Lys Trp Thr Gln Ile Asn Leu Glu Leu His
165 170 175 180
cct acc gcc tct gcc ccc gac gtc agc aac agc ttc ttt gtc acg att 633
Pro Thr Ala Ser Ala Pro Asp Val Ser Asn Ser Phe Phe Val Thr Ile
185 190 195
gac ggg gcc gct ggc gcc ggt cag acg atc aac ttc gcc atg ttc tcg 681
Asp Gly Ala Ala Gly Ala Gly Gln Thr Ile Asn Phe Ala Met Phe Ser
200 205 210
ctc ttc cct ccc acg ttc aag aac agg ccg aat ggg ctg cgc gct gac 729
Leu Phe Pro Pro Thr Phe Lys Asn Arg Pro Asn Gly Leu Arg Ala Asp
215 220 225
atc gcc gag act ctg gcc gag atg ggc ccg tcc ttt ttc cgc ttc cca 777
Ile Ala Glu Thr Leu Ala Glu Met Gly Pro Ser Phe Phe Arg Phe Pro
230 235 240
ggt ggg aac aac ctg gag ggc caa acg acg gcg acg agg tgg cag tgg 825
Gly Gly Asn Asn Leu Glu Gly Gln Thr Thr Ala Thr Arg Trp Gln Trp
245 250 255 260
aat gct acc gtc ggc tcg ctg ctg gac cgc ccc ggc cgg gtg ggc gac 873
Asn Ala Thr Val Gly Ser Leu Leu Asp Arg Pro Gly Arg Val Gly Asp
265 270 275
tgg gga tac gtg aac acg gac ggt cta ggt ctt ctg gag tat ctc cag 921
Trp Gly Tyr Val Asn Thr Asp Gly Leu Gly Leu Leu Glu Tyr Leu Gln
280 285 290
ttc ttc gaa gat acg ggc atg gag ccg atc atg gcg gtc tgg gca ggc 969
Phe Phe Glu Asp Thr Gly Met Glu Pro Ile Met Ala Val Trp Ala Gly
295 300 305
tat tct ctc ggc ggc aca agc ctt gct gag aac cag ctc gca ccg tac1017
Tyr Ser Leu Gly Gly Thr Ser Leu Ala Glu Asn Gln Leu Ala Pro Tyr
310 315 320
ata cag caa gcg ata gat cag att aac ttt gtc atc ggg gac cct gca1065
Ile Gln Gln Ala Ile Asp Gln Ile Asn Phe Val Ile Gly Asp Pro Ala
325 330 335 340
aag agt gca cct gcg gcg ctc cgt gct tcc ctg ggc cac cca gag ccc1113
Lys Ser Ala Pro Ala Ala Leu Arg Ala Ser Leu Gly His Pro Glu Pro
345 350 355
ttc acg ctc cgc ttc gtg gaa gtg gga aac gag gac ttc ttc gcg gcg1161
Phe Thr Leu Arg Phe Val Glu Val Gly Asn Glu Asp Phe Phe Ala Ala
360 365 370
ggc tcg tac cca tac cgc tgg cac gac ttc gtt acc gca ctt cag gcg1209
Gly Ser Tyr Pro Tyr Arg Trp His Asp Phe Val Thr Ala Leu Gln Ala
375 380 385
caa ttc ccc cag atc aga ttc atc gcg acc acc aac gcc tgg aac ccg1257
Gln Phe Pro Gln Ile Arg Phe Ile Ala Thr Thr Asn Ala Trp Asn Pro
390 395 400
gtt ctg tcc ccc gtc ccg cag tcg tat gat gta cac gtc tat cag aca1305
Val Leu Ser Pro Val Pro Gln Ser Tyr Asp Val His Val Tyr Gln Thr
405 410 415 420
ccg acc tgg ttc tac caa aat gct ttc tac tac gac ggc ttc cag cgc1353
Pro Thr Trp Phe Tyr Gln Asn Ala Phe Tyr Tyr Asp Gly Phe Gln Arg
425 430 435
aac ggc acc aca tac ttt gag ggg gag tac gcc gcc atc tcc acc aac1401
Asn Gly Thr Thr Tyr Phe Glu Gly Glu Tyr Ala Ala Ile Ser Thr Asn
440 445 450
gcg aac gat ttg ttc ggt act gtt gcc gac ggt cgc ttg gcg ttc cct1449
Ala Asn Asp Leu Phe Gly Thr Val Ala Asp Gly Arg Leu Ala Phe Pro
455 460 465
aca gtg caa agt gct acc ggg gag gcc gca ttc atg acc ggc ttg gag1497
Thr Val Gln Ser Ala Thr Gly Glu Ala Ala Phe Met Thr Gly Leu Glu
470 475 480
cgc aac agc gac atc gtc ttc gcc gcg tcc tac gca cct ctg ctg cag1545
Arg Asn Ser Asp Ile Val Phe Ala Ala Ser Tyr Ala Pro Leu Leu Gln
485 490 495 500
cac gtc aac tcc act caa tgg acc ccc gac ctg gtt tcc tac gac gcc1593
His Val Asn Ser Thr Gln Trp Thr Pro Asp Leu Val Ser Tyr Asp Ala
505 510 515
ggc tcc gtt att aag tcg acg agc ttc ttc gcc cag aag ctg ttc gcc1641
Gly Ser Val Ile Lys Ser Thr Ser Phe Phe Ala Gln Lys Leu Phe Ala
520 525 530
ttg aac aag ggc gac caa tac ctc ccg agc acg ctc ccg acc aac ggt1689
Leu Asn Lys Gly Asp Gln Tyr Leu Pro Ser Thr Leu Pro Thr Asn Gly
535 540 545
ggc acg ctg cac tgg agc atc act cgg gcc tct agc tcc ggc aag acg1737
Gly Thr Leu His Trp Ser Ile Thr Arg Ala Ser Ser Ser Gly Lys Thr
550 555 560
ttc atc aag atc gcg aac gcc ggc agc tca gcg cag agc ctc acc ttc1785
Phe Ile Lys Ile Ala Asn Ala Gly Ser Ser Ala Gln Ser Leu Thr Phe
565 570 575 580
cag ctg acc cag ttc aac tcg gtc tcc agc acc gga acg ctc cag gtc1833
Gln Leu Thr Gln Phe Asn Ser Val Ser Ser Thr Gly Thr Leu Gln Val
585 590 595
ctc acc gga ccg gag acc gcc agc aac acg cct gag gcg ccg cag gcc1881
Leu Thr Gly Pro Glu Thr Ala Ser Ash Thr Pro Glu Ala Pro Gln Ala
600 605 610
atc gtt ccc aag acg agc acg atc ggc acc ggc aag act ttc acg tac1929
Ile Val Pro Lys Thr Ser Thr Ile Gly Thr Gly Lys Thr Phe Thr Tyr
615 620 625
aac gct ccc gca ttc agc gtc agt gtc atc acc gtc acc acg aac1974
Asn Ala Pro Ala Phe Ser Val Ser Val Ile Thr Val Thr Thr Asn
630 635 640
tgaacgaaga agcacaacgc agcacgagga ccagaggacg gcgcggatgc gagactgccg 2034
agataccatt gccgcgaagg ggtgcagtgg tgccgtaact cgcaaggggg aacgggatcg 2094
tccgaatcgg atgggtgtgg attaggttgc gtcttcactg tttactaggc ggtgtatgcg 2154
agcgtagcta gtgcggtcct attgtaattt tgtgaggtct atctcc 2200
<210>4
<211>643
<212>PRT
<213>巨多孔菌(Miripilus giganteus)
<400>4
Met Lys Leu Leu Phe Leu Leu Gly Ala Phe Val Ala Gln Cys Leu Ala
1 5 10 15
Val Thr Val Thr Val Asn Lys Asn Pro Ser His Thr Val Pro Ser Thr
20 25 30
Leu Tyr Gly Leu Met Phe Glu Asp Ile Asn His Ser Gly Asp Gly Gly
35 40 45
Leu Tyr Ala Glu Leu Leu Gln Asn Arg Ala Phe Gln Gln Val Thr Pro
50 55 60
Asn Thr Ala Ala Ala Leu Ala Ala Trp His Pro Ile Ser Asn Ala Lys
65 70 75 80
Leu Ala Val Ile Gln Asp Pro Ser Pro Val Ser Asn Ala Leu Pro Asn
85 90 95
Ser Leu Gln Phe Ser Val Pro Ser Gly Ser Ser Gly Arg Val Gly Phe
100 105 110
Thr Asn Glu Gly Phe Trp Gly Ile Lys Val Asp Ser Thr Trp Thr Tyr
115 120 125
Lys Ala Ser Leu Phe Phe Arg Phe Pro Thr Ser Ser Ser Phe Ser Gly
130 135 140
Ala Leu Thr Val Gly Leu Gln Thr Asn Ala Gly Arg Val Leu Ala Gln
145 150 155 160
Ash Ser Thr Gln Ile Arg Gly Thr Thr Thr Lys Trp Thr Gln Ile Asn
165 170 175
Leu Glu Leu His Pro Thr Ala Ser Ala Pro Asp Val Ser Asn Ser Phe
180 185 190
Phe Val Thr Ile Asp Gly Ala Ala Gly Ala Gly Gln Thr Ile Asn Phe
195 200 205
Ala Met Phe Ser Leu Phe Pro Pro Thr Phe Lys Asn Arg Pro Asn Gly
210 215 220
Leu Arg Ala Asp Ile Ala Glu Thr Leu Ala Glu Met Gly Pro Ser Phe
225 230 235 240
Phe Arg Phe Pro Gly Gly Asn Asn Leu Glu Gly Gln Thr Thr Ala Thr
245 250 255
Arg Trp Gln Trp Asn Ala Thr Val Gly Ser Leu Leu Asp Arg Pro Gly
260 265 270
Arg Val Gly Asp Trp Gly Tyr Val Asn Thr Asp Gly Leu Gly Leu Leu
275 280 285
Glu Tyr Leu Gln Phe Phe Glu Asp Thr Gly Met Glu Pro Ile Met Ala
290 295 300
Val Trp Ala Gly Tyr Ser Leu Gly Gly Thr Ser Leu Ala Glu Asn Gln
305 310 315 320
Leu Ala Pro Tyr Ile Gln Gln Ala Ile Asp Gln Ile ASn Phe Val Ile
325 330 335
Gly Asp Pro Ala Lys Ser Ala Pro Ala Ala Leu Arg Ala Ser Leu Gly
340 345 350
His Pro Glu Pro Phe Thr Leu Arg Phe Val Glu Val Gly Asn Glu Asp
355 360 365
Phe Phe Ala Ala Gly Ser Tyr Pro Tyr Arg Trp His Asp Phe Val Thr
370 375 380
Ala Leu Gln Ala Gln Phe Pro Gln Ile Arg Phe Ile Ala Thr Thr Asn
385 390 395 400
Ala Trp Asn Pro Val Leu Ser Pro Val Pro Gln Ser Tyr Asp Val His
405 410 415
Val Tyr Gln Thr Pro Thr Trp Phe Tyr Gln Asn Ala Phe Tyr Tyr Asp
420 425 430
Gly Phe Gln Arg Asn Gly Thr Thr Tyr Phe Glu Gly Glu Tyr Ala Ala
435 440 445
Ile Ser Thr Asn Ala Asn Asp Leu Phe Gly Thr Val Ala Asp Gly Arg
450 455 460
Leu Ala Phe Pro Thr Val Gln Ser Ala Thr Gly Glu Ala Ala Phe Met
465 470 475 480
Thr Gly Leu Glu Arg Asn Ser Asp Ile Val Phe Ala Ala Ser Tyr Ala
485 490 495
Pro Leu Leu Gln His Val Asn Ser Thr Gln Trp Thr Pro Asp Leu Val
500 505 510
Ser Tyr Asp Ala Gly Ser Val Ile Lys Ser Thr Ser Phe Phe Ala Gln
515 520 525
Lys Leu Phe Ala Leu Asn Lys Gly Asp Gln Tyr Leu Pro Ser Thr Leu
530 535 540
Pro Thr Asn Gly Gly Thr Leu His Trp Ser Ile Thr Arg Ala Ser Ser
545 550 555 560
Ser Gly Lys Thr Phe Ile Lys Ile Ala Asn Ala Gly Ser Ser Ala Gln
565 570 575
Ser Leu Thr Phe Gln Leu Thr Gln Phe Asn Ser Val Ser Ser Thr Gly
580 585 590
Thr Leu Gln Val Leu Thr Gly Pro Glu Thr Ala Ser Asn Thr Pro Glu
595 600 605
Ala Pro Gln Ala Ile Val Pro Lys Thr Ser Thr Ile Gly Thr Gly Lys
610 615 620
Thr Phe Thr Tyr Asn Ala Pro Ala Phe Ser Val Ser Val Ile Thr Val
625 630 635 640
Thr Thr Asn
权利要求
1.一种能从双取代木聚糖释放阿拉伯糖的阿拉伯糖呋喃糖苷酶,所述阿拉伯糖呋喃糖苷酶源自真菌。
2.一种阿拉伯糖呋喃糖苷酶,其为
a)具有SEQ ID NO2所示成熟肽氨基酸序列的多肽,或者能够从其通过取代、缺失和/或插入一个或多个氨基酸而获得的多肽;
b)(i)或(ii)中定义的多肽类似物,其
i)与所述多肽有至少80%同源性,
ii)为所述多肽的等位基因变体,
c)由核酸序列编码的多肽,所述核酸序列与编码成熟多肽的SEQ ID NO2的核酸序列互补链或其至少100个核苷酸的亚序列在高严紧条件下杂交。
3.一种阿拉伯糖呋喃糖苷酶,其为
a)具有SEQ ID NO4所示成熟肽氨基酸序列的多肽,或者能够从其通过取代、缺失和/或插入一个或多个氨基酸而获得的多肽;
b)(i)或(ii)中定义的多肽类似物,其
i)与所述多肽有至少60%同源性,
ii)为所述多肽的等位基因变体,
c)由核酸序列编码的多肽,所述核酸序列与编码成熟多肽的SEQ ID NO2的核酸序列的互补链或其至少100个核苷酸的亚序列在高严紧条件下杂交。
4.权利要求1-3中任一项所述的阿拉伯糖呋喃糖苷酶,其对于腐质霉属菌株,优选特异腐质霉,或者多孔菌属菌株,优选巨多孔菌是天然的。
5.核酸序列,其包含编码权利要求1-4任一项所述的阿拉伯糖呋喃糖苷酶的核酸序列。
6.核酸序列,其包括
a)DNA序列,其编码SEQ ID NO2和SEQ ID NO4所示任一阿拉伯糖呋喃糖苷酶,
b)DNA序列类似物,其
i)与任一所述DNA序列具有至少80%同源性,或
ii)与所述DNA序列互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交;
iii)为其等位基因变体,或
c)a)或b)的互补链。
7.权利要求6所述的核酸序列,其中多肽为含下列氨基酸序列的人工变体,所述氨基酸序列相对SEQ ID NO2的氨基酸1-558,有一处或多处截短,和/或氨基酸的至少一个取代、缺失和/或插入。
8.核酸序列,其与SEQ ID NO1和SEQ ID NO3任一所示DNA序列具有至少80%同源性,或者
a)与任一所述DNA序列的互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交,
b)为其等位基因变体,或
c)a)或b)的互补链。
9.权利要求8所述的核酸序列,其中多肽为含下列氨基酸序列的人工变体,所述氨基酸序列相对SEQ ID NO4的氨基酸1-643,有一处或多处截短,和/或氨基酸的至少一个取代、缺失和/或插入。
10.一种核酸构建体,其包含权利要求5-9任一的核酸序列,所述核酸序列与在合适表达宿主中能指导阿拉伯糖呋喃糖苷酶表达的一种或多种调控序列可操作地连接。
11.包含权利要求10的核酸构建体的重组表达载体。
12.包含权利要求11的表达载体的重组宿主细胞。
13.产生阿拉伯糖呋喃糖苷酶的方法,其包括在利于产生阿拉伯糖呋喃糖苷酶的条件下培养权利要求12的宿主细胞,和回收阿拉伯糖呋喃糖苷酶。
14.包含根据权利要求1-4中任一项的阿拉伯糖呋喃糖苷酶的组合物。
15.根据权利要求1-4中任一项的阿拉伯糖呋喃糖苷酶在生面团中的用途。
16.根据权利要求1-4中任一项的阿拉伯糖呋喃糖苷酶在乙醇工艺中的用途。
17.根据权利要求1或4中任一项的阿拉伯糖呋喃糖苷酶在糖化工艺中的用途。
18.根据权利要求1或4中任一项的阿拉伯糖呋喃糖苷酶在生产饲料产品的工艺中的用途。
全文摘要
本发明涉及具有α-L-阿拉伯糖呋喃糖苷酶活性的分离多肽和编码该多肽的分离核酸序列。本发明也涉及含所述核酸序列的核酸构建体、载体和宿主细胞,以及产生和使用该多肽的方法。
文档编号C12N9/24GK101166822SQ200680014246
公开日2008年4月23日 申请日期2006年4月25日 优先权日2005年4月26日
发明者汉尼·R·索伦森, 克里斯特尔·T·乔尔根森, 拉斯·H·克里斯坦森, 克里斯琴·I·乔尔根森, 卡斯滕·H·汉森, 莱尼·V·科福德 申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1