具有阿拉伯呋喃糖苷酶活性的多肽及其编码多核苷酸的制作方法

文档序号:571400阅读:289来源:国知局

专利名称::具有阿拉伯呋喃糖苷酶活性的多肽及其编码多核苷酸的制作方法具有阿拉伯呋喃糖苷酶活性的多肽及其编码多核苷酸涉及序列表本申请含有计算机可读形式的序列表。通过提述而将计算机可读形式并入本文。涉及生物材料的保藏本申请含有对生物材料的保藏的涉及,通过提述而将所述保藏并入本文。发明领域本发明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体、和宿主细胞以及生成和使用所述多肽的方法。
背景技术
:一般而言,植物细胞壁多糖构成90%的植物细胞壁,并且可以分成三组纤维素、半纤维素和果胶。纤维素代表细胞壁多糖的主要成分。半纤维素是植物细胞壁的第二丰富的成分。主要的半纤维素聚合物是木聚糖。植物细胞壁中存在的木聚糖结构可以随其起源而显著不同,但是它们总含有β-1,4-连接的D-木糖主链。β-1,4-连接的D-木糖主链可以用各种侧基,诸如L-阿拉伯糖、D-半乳糖、乙酰基、阿魏酰基、对香豆酰基和葡糖醛酸残基取代。对木聚糖主链的生物降解依赖于两类酶内切木聚糖酶和β-木糖苷酶。内切木聚糖酶(EC3.2.1.8)将木聚糖主链切割成较小的寡糖,其能被β-木糖苷酶(EC3.2.1.37)进一步降解成木糖。木聚糖降解中牵涉的其它酶包括例如乙酰木聚糖酯酶、阿拉伯糖酶、α-L-阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、阿魏酸酯酶、和对香豆酸酯酶。Kaji和Tagawa,1970,Biochim.Biophys.Acta207456-464描述了来自黑曲霉(Aspergillusniger)的α-L-阿拉伯呋喃糖苷酶的纯化、结晶和氨基酸组成。Kaji.和Yoshihara,1971,Biochim.Biophys.Acta250367-371描述了来自罗耳伏革菌(Corticiumrolfsii)的α-L-阿拉伯呋喃糖苷酶的特性。Tagawa和Kaji,1969,Carbohydr.Res.11293-301描述了含有L-阿拉伯糖的多糖的制备和α-L-阿拉伯呋喃糖苷酶对该多糖的作用。Filho等,1996,Appl.Environ.Microbiol.62:168_173公开了来自胶囊青霉(Penicilliumcapsulatum)的两种α-L-阿拉伯呋喃糖苷酶的纯化和表征。WO96/06935公开了来自黑曲霉的阿拉伯木聚糖降解酶。WO2006/125438描述了胶囊青霉α-L-阿拉伯呋喃糖苷酶及其多核苷酸。本发明涉及具有α-L-阿拉伯呋喃糖苷酶活性的多肽和编码该多肽的多核苷酸。发明概述本发明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分离的多肽,其选自下组(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严格条件下与SEQIDNO1的成熟多肽编码序列或其全长互补链杂交;(c)由多核苷酸编码的多肽,所述多核苷酸包含与SEQIDNO:1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO:2的成熟多肽的包含取代、缺失和/或插入一个或多个(数个)氨基酸的变体。本发明还涉及编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽的分离的多核苷酸,其选自下组(a)编码包含氨基酸序列的多肽的多核苷酸,所述氨基酸序列与SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)多核苷酸,其在至少中_高严格条件下与SEQIDNO1的成熟多肽编码序列或其全长互补链杂交;(c)多核苷酸,其包含与SEQIDNO=I的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列;和(d)编码变体的多核苷酸,所述变体为SEQIDNO:2的成熟多肽的包含取代、缺失、和/或插入一个或多个(数个)氨基酸的变体。本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体、重组宿主细胞,及生成具有α-L-阿拉伯呋喃糖苷酶活性的多肽的方法。本发明还涉及抑制细胞中多肽的表达的方法,包括对所述细胞施用双链RNA(dsRNA)分子或者在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的亚序列。本发明还涉及此类双链抑制性RNA(dsRNA)分子,其中任选地,所述dsRNA是siRNA或miRNA分子。本发明还涉及用于降解包含木聚糖的材料的方法。本发明还涉及包含分离的多核苷酸的植物,所述分离的多核苷酸编码所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽。本发明还涉及生成所述具有α-L-阿拉伯呋喃糖苷酶的多肽的方法,包括(a)在有益于所述多肽生成的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽的多核苷酸;并(b)回收所述多肽。本发明进一步涉及核酸构建体,其包含编码蛋白质的基因,其中所述基因与编码信号肽的核苷酸序列可操作连接,所述信号肽包含SEQIDNO:2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17组成,其中所述基因对于所述核苷酸序列而言是外来的。附图简述图IA和图IB显示了家族62特异腐质霉(Humicolainsolens)DSM1800α-L-阿拉伯呋喃糖苷酶的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:1和2)。图2显示了ρ匪ar4的限制图谱。图3显示了pHinsGH62A的限制图谱。定义α-L-阿拉伯呋喃糖苷酶活性术语“α_L_阿拉伯呋喃糖苷酶活性”在本文中定义为α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶活性(EC3.2.1.55),其催化对α_L_阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶活性对α-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_键的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本发明而言,根据下文所描述的方法或实施例10中所描述的方法来测定α-L-阿拉伯呋喃糖苷酶活性。本发明的多肽具有SEQIDNO2的成熟多肽的α-L-阿拉伯呋喃糖苷酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。特定阿拉伯木聚糖寡糖的制备。通过将IOOml0.IM乙酸盐ρΗ6.0缓冲液中的Ig水不溶性小麦阿拉伯木聚糖(Megazyme,Bray,CountyWicklow,爱尔兰)与每kg水不溶性小麦阿拉伯木聚糖6.67gSHEARZYME(棘孢曲霉(Aspergillusaculeatus)GH10内切-1,4-β-木聚糖酶,NovozymesA/S,BagSV出rd,丹麦)一起于30°C温育2小时来制备含有末端(1—3)连接的阿拉伯糖基基团的寡糖。通过将IOOml0.IM乙酸钠ρΗ6.0中的Ig水不溶性小麦阿拉伯木聚糖与每kg水不溶性小麦阿拉伯木聚糖0.03gPENTOPANMONO(疏棉状嗜热霉(Thermomyceslanuginosus)GHll内切_1,4_β-木聚糖酶;NovozymesA/S,Bagsvasrd,丹麦)一起于30°C温育2小时来制备含有内部(1—3)连接的阿拉伯糖基基团的寡糖。通过将IOOml0.IM乙酸钠ρΗ6.0中的Ig水不溶性小麦阿拉伯木聚糖与每kg水不溶性小麦阿拉伯木聚糖0.03gPENTOPANMONO和每kg水溶性小麦阿拉伯木聚糖0.03gα-L-阿拉伯呋喃糖苷酶一起于30°C温育2小时来制备含有内部(1—2)连接的阿拉伯糖基基团的寡糖。为了停止酶促反应,于100°c加热混合物10分钟。将阿拉伯木寡糖(arabinoxylo-oligosaccharide)在旋转蒸发器上浓缩,并通过1H-NMR来评估。最佳反应条件的测定。在双因素Box-Behnken响应面设计模板(Montgomery,2001,Designandanalysisofexperiments.Wiley,NewYork)中评估α-L-阿拉伯呋喃糖苷酶的最佳反应条件。每个模板包含ρΗ(3-7)和反应温度(30-70°C)的数种不同组合,具有3个中心点(with3centerpoints)。将水溶性小麦阿拉伯木聚糖(0.002g;Megazyme,Bray,CountyWicklow,爱尔兰)在2ml去离子水中溶解。然后将溶液与每kg水溶性小麦阿拉伯木聚糖每次测定0.Ig酶蛋白一起温育。反应正好24小时后取样,并于100°C立即加热10分钟以停止酶反应。然后以20,OOOxg离心样品10分钟,并通过HPAEC分析在上清液中测定阿拉伯糖水平。所报告的数值按每g小麦阿拉伯木聚糖mg计。α-L-阿拉伯呋喃糖苷酶的作用模式。将α-L-阿拉伯呋喃糖苷酶于40°C添加至Iml0.IM乙酸钠ρΗ6.0中的0.Olg水溶性小麦阿拉伯木聚糖、0.Olg含有末端(1—3)连接的阿拉伯糖基基团的寡糖、0.Olg含有内部(1—3)连接的阿拉伯糖基基团的寡糖、或0.Olg含有内部(1—2)连接的阿拉伯糖基基团的寡糖达2小时。于100°C使酶促反应失活10分钟。将样品在旋转蒸发器上浓缩,并通过1H-NMR来分析。HPAEC0将水解产物(10μ1)施用至装配有与CARB0PACPAl预柱(4x50mm)组合的CARB0PACPAl保护柱(4x250mm)(DionexCorporation,Sunnyvale,CA,USA)的BioLC系统(DionexCorporation,Sunnyvale,CA,USA)上。以每分钟Iml的流速用IOmMKOH等度分离阿拉伯糖15分钟。通过脉冲电化学检测器以脉冲安培计量检测模式检测阿拉伯糖。电极电压编程为+0.IV(t=0-0.4s)至-2.OV(t=0.41-0.42s)至0.6V(t=0.43s)和最终的-0.IV(t=0.44-0.50s),期间级分t=0.2-0.4s所得的信号。使用阿拉伯糖(Merck,Darmstadt,德国)作为标准品。1H-NMR分析。从99.9%D2O冻干所有降解产物两次,并在99.9%D2O中再溶解。对一些水解产物进行透析(Spectra/Por膜截留分子量1000)以在谱分析之前除去游离的阿拉伯糖。在以400MHz操作且装备有4-核自动可变换探针(4-nucleusauto-switchableprobe)的Varian汞-VX仪中于30°C记录1H-匪R谱。在128-512次扫描中收集数据,并使用HDO信号作为参照信号(4.67ppm)。含有木聚糖的材料术语“含有木聚糖的材料”在本文中定义为任何包含木聚糖作为成分的材料。木聚糖是含有β-1,4-连接的木糖残基主链的植物细胞壁多糖。一般而言,4-0-甲基葡糖醛酸和阿拉伯糖的侧链与乙酰基和阿魏酰基基团一起以不同量存在。木聚糖是半纤维素的一种主要成分。家族62或家族GH62术语“家族62”或“家族GH62”或“GH62”在本文中定义为根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatandBairoch,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696属于糖苷水解酶家族62的多肽。分离的多肽如本文中所使用的,术语“分离的多肽”指自来源分离的多肽。在一个优选的方面,如通过SDS-PAGE所测定的,多肽为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选处于基本上纯的形式,即所述多肽制备物基本上(essentially)没有与其天然或重组结合的其它多肽材料。例如,这能够通过以下实现通过公知的重组方法或由经典纯化方法制备多肽。成熟多肽术语“成熟多肽”在本文中定义为具有α-L-阿拉伯呋喃糖苷酶活性的多肽,所述多肽以其翻译和任何翻译后修饰之后的最终形式存在,所述修饰诸如N端加工、C端截短、糖基化、磷酸化等。在一个优选的方面,成熟多肽是基于SignalP程序的SEQIDNO2的氨基酸18至387,所述SignalP程序预测SEQIDNO2的氨基酸1至17是信号肽。成熟多肽编码序列术语“成熟多肽编码序列”在本文中定义为编码具有α-L-阿拉伯呋喃糖苷酶活性的成熟多肽的核苷酸序列。在一个优选的方面,成熟多肽编码序列是基于SignalP程序的SEQIDNO1的核苷酸52至1161,所述SignalP程序预测SEQIDΝ0:1的核苷酸1至51编码信号肽。同一性参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。7就本发明而言,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48443-453)来测定两个氨基酸序列之间的序列同一性程度,如EMBOSS包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277)的Needle程序(优选第3·0.0或其后版本)中所执行的。所使用的任选参数是缺口开放罚分10,缺口延伸罚分0.5,和EBL0SUM62(BL0SUM62的EMBOSS形式)取代矩阵。使用Needle标记为“最高同一性(longestidentity)”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下(相同的残基XlOO)/(比对长度-比对中缺口的总数)就本发明而言,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定两个脱氧核糖核苷酸序列之间的序列同一性程度,如EMBOSS包(EMBOSS=TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上文)的Needle程序(优选第3.0.0或其后版本)中所执行的。所使用的任选参数是缺口开放罚分10,缺口延伸罚分0.5,和EDNAFULL(NCBINUC4.4的EMBOSS形式)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下(相同的脱氧核糖核苷酸XlOO)/(比对长度-比对中缺口的总数)同源序列术语“同源序列”在本文中定义为在用SEQIDNO:2的特异腐质霉α-L-阿拉伯呋喃糖苷酶或其成熟多肽进行的tfasty搜索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols,S.Misener禾口S.A.Krawetz编,第185-219页)中E值(或期望值)小于0.001的预测蛋白质。多肽片段术语“多肽片段”在本文中定义为从SEQIDNO:2的成熟多肽或其同源序列的氨基和/或羧基末端缺失一个或多个(数个)氨基酸的多肽;其中所述片段具有α-L-阿拉伯呋喃糖苷酶活性。在一个优选的方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少310个氨基酸残基,更优选至少330个氨基酸残基,并且最优选至少350个氨基酸残基。亚序列术语“亚序列(subsequence)”在本文中定义为从SEQIDNO1的成熟多肽编码序列或其同源序列的5’和/或3’端缺失一个或多个(数个)核苷酸的核苷酸序列;其中所述亚序列编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽片段。在一个优选的方面,亚序列含有SEQIDNO:1的成熟多肽编码序列或其同源序列的至少930个核苷酸,更优选至少990个核苷酸,并且最优选至少1050个核苷酸。等位变体(allelicvariant)术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。分离的多核苷酸如本文中所使用的,术语“分离的多核苷酸”指自来源分离的多核苷酸。在一个优选的方面,如通过琼脂糖电泳所测定的,多核苷酸为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多核苷酸如本文中所使用的,术语“基本上纯的多核苷酸”指没有其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在8遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即所述多核苷酸制备物基本上没有与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组I=Iο编码序列在本文中使用时,术语“编码序列”指直接指定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界通常由读码框决定,所述读码框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。cDNA:术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少可存在于相应基因组DNA中的内含子序列。起始的、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称作剪接的过程除去内含子序列。因而源自mRNA的cDNA缺乏任何内含子序列。核酸构建体如本文中所使用的,术语“核酸构建体”指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或所述核酸分子以本来不存在于(nototherwiseexist)自然界中的方式修饰以含有核酸的区段,或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence)术语“调控序列”在本文定义为包括表达编码本发明多肽的多核苷酸所必需的所有组分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外来的,或各调控序列对于彼此可以是天然的或外来的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。可操作连接的术语“可操作连接的”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作连接。宿主细胞如本文中所使用的,术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。修饰术语“修饰”在本文中指对由SEQIDNO2的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个(数个)氨基酸的取代、缺失和/或插入以及一个或多个(数个)氨基酸侧链的置换。人工变体在本文中使用时,术语“人工变体”指具有α-L-阿拉伯呋喃糖苷酶活性的多肽,所述多肽由表达SEQIDNO:1的成熟多肽编码序列或其同源序列的修饰的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(humanintervention),通过修饰公开于SEQIDNO1的多核苷酸序列或它们的同源序列来获得。发明详述具有α-L-阿拉伯呋喃糖苷酶活性的多肽在第一个方面,本发明涉及包含氨基酸序列的分离的多肽,所述氨基酸序列与SEQIDNO2的成熟多肽具有优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,至少97%,至少98%,或至少99%的序列同一性程度,所述多肽具有α-L-阿拉伯呋喃糖苷酶活性(下文中的“同源多肽”)。在一个优选的方面,所述同源多肽具有氨基酸序列,其与SEQIDΝ0:2的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。本发明的多肽优选包含SEQIDNO2的氨基酸序列或其等位变体;或它们的具有α-L-阿拉伯呋喃糖苷酶活性的片段。在一个优选的方面,多肽包含SEQIDNO2的氨基酸序列。在另一个优选方面,多肽包含SEQIDNO:2的成熟多肽。在另一个优选方面,多肽包含SEQIDNO:2的氨基酸18至387,或其等位变体;或它们的具有α-L-阿拉伯呋喃糖苷酶活性的片段。在另一个优选方面,多肽包含SEQIDNO:2的氨基酸18至387。在另一个优选的方面,多肽由SEQIDNO:2的氨基酸序列或其等位变体;或它们的具有α-L-阿拉伯呋喃糖苷酶活性的片段组成。在另一个优选的方面,多肽由SEQIDNO:2的氨基酸序列组成。在另一个优选方面,多肽由SEQIDNO:2的成熟多肽组成。在另一个优选的方面,多肽由SEQIDNO2的氨基酸18至387或其等位变体;或它们的具有α-L-阿拉伯呋喃糖苷酶活性的片段组成。在另一个优选的方面,多肽由SEQIDNO2的氨基酸18至387组成。在第二个方面,本发明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在优选非常低的严格条件下,更优选低的严格条件下,更优选中等严格条件下,更优选中_高的严格条件下,甚至更优选高的严格条件下,并且最优选非常高的严格条件下,与以下杂交(i)SEQIDN0:1的成熟多肽编码序列,()⑴的亚序列,或(iii)⑴或(ii)的全长互补链(J.Sambrook,E.F.Fritsch,禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽片段。在一个优选的方面,所述互补链是SEQIDNO1的成熟多肽编码序列的全长互补链。可以使用SEQIDNO1的核苷酸序列或其亚序列,以及SEQIDNO2的氨基酸序列或其片段来设计核酸探针以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽的DNA。具体而言,遵循标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。此类探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针的长度可为至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,甚至更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白标记)。本发明涵盖此类探针。因此,可以对自此类其它菌株制备的基因组DNA或cDNA文库筛选DNA,所述DNA与上文所描述的探针杂交并且编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自此类其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝酸纤维素或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:1或其亚序列同源的克隆或DNA,优选在Southern印迹中使用载体材料。就本发明而言,杂交指明核苷酸序列在非常低至非常高的严格条件下与经标记的核酸探针杂交,所述核酸探针对应于SEQIDNO1的成熟多肽编码序列;其全长互补链;或它们的亚序列。可使用例如X射线片(X-rayfilm)来检测在这些条件下与核酸探针杂交的分子。在一个优选的方面,核酸探针是SEQIDNO:1的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQIDNO:1的核苷酸52至1161。在另一个优选的方面,核酸探针是编码SEQIDNO:2的多肽的多核苷酸序列,或其亚序列。在另一个优选的方面,核酸探针是SEQIDNO:1。在另一个优选的方面,核酸探针是质粒pHinsGH62A中含有的多核苷酸序列,所述质粒pHinsGH62A包含在大肠杆菌(E.coli)NRRLB-50075中,其中所述其多核苷酸序列编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽。在另一个优选的方面,核酸探针是质粒pHinsGH62A中含有的成熟多肽编码区,所述质粒pHinsGH62A包含在大肠杆菌NRRLB-50075中。对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低的严格性为25%的甲酰胺、对于中等的和中-高的严格性为35%的甲酰胺、或对于高的和非常高的严格性为50%的甲酰胺,遵循标准的Southern印迹法进行预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选于45°C(非常低的严格性),更优选于50°C(低严格性),更优选于55°C(中等严格性),更优选于60°C(中-高严格性),甚至更优选于65°C(高严格性),并且最优选于70°C(非常高的严格性)将载体材料最终清洗三次,每次15分钟。对于长度约15个核苷酸至约70个核苷酸的短探针,将严格条件定义为在比使用根据Bolton禾口McCarthy(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)的计算算出的Tm低约5°C至约10°C,在0.9MNaCl,0.09MTris-HClpH7.6、6mMEDTA.0.5%NP-40UXDenhardt氏溶液、ImM焦磷酸钠(sodiumpyrophosphate)、ImM磷酸二氢钠(sodiummonobasicphosphate),0.ImMATP和0.2mg每ml的酵母RNA中,遵循标准的Southern印迹方法进行预杂交、杂交和杂交后清洗最佳12至24小时。对于长度约15个核苷酸至约70个核苷酸的短探针,将所述载体材料在6XSCC加0.1%SDS中清洗一次15分钟,并使用6XSSC在比计算的Tm低5°C至10°C的温度清洗两次,每次15分钟。在第三个方面,本发明涉及由多核苷酸编码的具有α-L-阿拉伯呋喃糖苷酶活性的分离的多肽,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQIDNO1的成熟多肽编码序列具有优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,至少97%,至少98%,或至少99%的序列同一性程度,其编码活性多肽。参见本文的多核苷酸部分。在第四个方面,本发明涉及人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(数个)氨基酸的SEQIDNO2的成熟多肽;或其同源序列。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,诸如多组氨酸束(polyhistidinetract)、抗原性表位或结合域。保守取代的例子在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性的氨基酸取代是本领域己知的,并且由例如H.Neurath禾PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr>Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe>Ala/Pro>Lys/Arg>Asp/Asn>Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。除了20种标准的氨基酸外,非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2_氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上可获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4-甲基脯氨酸和3,3-二甲基脯氨酸。或者,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适PH等。可以根据本领域已知的方法,诸如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science244:1081_1085)来鉴定亲本多肽中的必需氨基酸。在后一种技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物学活性(即,α-L-阿拉伯呋喃糖苷酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。还可参见Hilton等,1996,J.Biol.Chem.271=4699-4708酶的活性位点或其它生物学相互作用也能通过对结构的物理分析来测定,如通过以下这些技术如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等,1992,Science255:306_312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。可以使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,诸如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152_2156;WO95/17413;或WO95/22625公开的方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。可以使用的其它方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochem.3010832-10837;美国专利号5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。可以从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且可以应用于未知结构的多肽。SEQIDNO2的成熟多肽,诸如SEQIDNO2的氨基酸18至387的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。具有α-L-阿拉伯呋喃糖苷酶活性的多肽的来源本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽可以获自任何属的微生物。就本发明而言,如本文中所使用的,与给定的来源有关的术语“获自”,应当意味着核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在一个优选的方面,获自给定来源的多肽是胞外分泌的。本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽可以是细菌多肽。例如,所述多肽可以是具有α-L-阿拉伯呋喃糖苷酶活性的革兰氏阳性细菌多肽诸如芽孢杆菌属(Bacillus)、链球菌属(Str印tococcus)、链霉菌属(Str印tomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)>It^M(Clostridium)>jft^ifeff^M(Geobacillus)胃属(Oceanobacillus)多肽;或具有α-L-阿拉伯呋喃糖苷酶活性的革兰氏阴性细菌多肽,诸如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)lifM(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多妝。在一个优选的方面,所述多肽是具有ex-L-阿拉伯呋喃糖苷酶活性的嗜碱芽孢杆胃(Bacillusalkalophilus)、Ι定㈱Ii包If胃(Bacillusamyloliquefaciens)、失豆Ii包If菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillus13clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热月旨肪芽孢杆菌(Bacillusstearothermophilus),枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。在另一个优选的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的似马链球菌(Streptococcusequisimilis)、酉良胺链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽痕亚禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一个优选的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多月太。本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽也可以是真菌多肽,并且更优选具有α-L-阿拉伯呋喃糖苷酶活性的酵母多肽诸如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选具有α-L-阿拉伯呋喃糖苷酶活性的丝状真菌多肽诸如枝顶孢霉属(Acremonium)、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟赌菌属(Ceriporiopsis)、毛_壳属(Chaetomidium)、金抱子菌属(Chrysosporium)、麦角菌属(Clavic印s)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes>棒囊壳属(Corynascus)、β急丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、奉巴齿菌属(Irpex)、香燕属(Lentinula)、小球腔菌属(Leptospaeria)>梨孢菌属(Magnaporthe)、Melanocarpus、节毛菌属(Meripilus)、毛霉属Mucor)、毁丝霉属(Myceliophthora)、新考玛月旨霄属(Neocallimastix)、脉抱菌属(Neurospora)>拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia,假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉属(Rhizomucor)、裂裙菌属(Schizophyllum)、节隔孢属/柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、热子囊菌属/嗜热霉属(Thermoascus)、梭抱壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝孢属(Verticillium)、草属(Volvariella)、或炭角菌属(Xylaria)多肽。在一个优选的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。14在另一个优选方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的解纤维枝丁页抱霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、^^ffiβ(Aspergillusawamori)Λffiβ(Aspergillusfumigatus)、1ffiβ(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、构巢曲霉(Sspergillusnidulans)、漂曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角质金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrvsosporiumzonatum、杆抱状德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、库威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、肤色,廉?包(Fusariumsarcochroum)、拟分枝抱,廉抱(Fusariumsporotrichioides)、硫色镰?包(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)、白囊奉巴齿菌(Irpexlacteus)、^■€β(Mucormiehei)、口f%罾M胃(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱壳(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱壳(Thielaviamicrospora)、卵抱梭抱壳(Thielaviaovispora)、Thielaviaperuviana、罾包冑(Thielaviaspededonium)、毛梭抱壳(Thielaviasetosa)、Thielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木毒(Trichodermaharzianum)、康宁木毒(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多月太。在另一个优选的方面,所述多肽是灰色腐质霉(Humicolagrisea)、特异腐质霉或疏棉状腐质霉多肽。在一个更优选的方面,所述多肽是具有ex-L-阿拉伯呋喃糖苷酶活性的特异腐质霉。在一个最优选的方面,所述多肽是具有α-L-阿拉伯呋喃糖苷酶活性的特异腐质霉DSM1800多肽,例如包含SEQIDNO2的成熟多肽的多肽。应当理解的是对于前述的种,本发明涵盖完全和不完全阶段(perfectmdimperfectstates),和其它分类学的等同物(equivalent),例如无性型(mamorph),而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的同一性。这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection,ATCC)、德意志微生物禾口细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures,CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter,NRRL)。此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得此类多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选所述微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就可以使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见例如,Sambrook等,1989,见上文)。本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在读码框中,并且使融合多肽的表达在相同启动子和终止子的控制下。融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白质释放具有α-L-阿拉伯呋喃糖苷酶活性的多肽。切割位点的例子包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3568-576;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-ffiIsonφ,1997,Appl.Environ.Microbiol.633488-3493;Ward等,1995,Biotechnology13498-503;和Contreras等,1991,Biotechnology9:378_381);Ile_(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过FactorXa蛋白酶切割(Eaton等,1986,Biochem.25:505_512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。多核苷酸本发明还涉及分离的多核苷酸,其包含编码本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽的核苷酸序列,或由所述核苷酸序列组成。在一个优选的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO=I组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRLΒ-50075中所含质粒pHinsGH62A中含有的序列,或由该序列组成。在另一个优选的方面,核苷酸序列包含SEQIDNO:1的成熟多肽编码序列或由SEQIDNO:1的成熟多肽编码序列组成。在另一个优选的方面,核苷酸序列包含SEQIDNO:1的核苷酸52至1161或由SEQIDNO:1的核苷酸52至1161组成。在另一个更优选的方面,核苷酸序列包含质粒pHinsGH62A中含有的成熟多肽编码序列或由该成熟多肽编码序列组成,所述质粒pHinsGH62A包含在大肠杆菌NRRLB-50075中。本发明还涵盖编码多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽,或由SEQIDNO:2的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽编码序列。本发明还涉及SEQIDNO:1的亚序列,所述亚序列编码SEQIDN0:2中具有α-L-阿拉伯呋喃糖苷酶活性的片段。本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQIDNO1的成熟多肽编码序列中包含至少一个突变或由具有至少一个突变的SEQIDNO:1的成熟多肽编码序列组成,其中所述突变核苷酸序列编码SEQIDNO2的成熟多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共享结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork0可以使用其它核酸扩增方法,诸如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从腐质霉属(Humicola)菌株,或其它或相关生物体克隆多核苷酸,并且因而可以是例如所述核苷酸序列的多肽编码区的等位变体或种变体。本发明还涉及分离的多核苷酸,其包含下述核苷酸序列或由其组成,所述核苷酸序列与SEQIDNO:1的成熟多肽编码序列具有优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,至少97%,至少98%,或至少99%的序列同一性程度,所述多核苷酸编码活性多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适PH等方面不同的人工变体。可以在作为SEQIDNO:1的成熟多肽编码序列呈现的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpressionandPurification2一107。对于本领域技术人员显而易见的是,这些取代能在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定点诱变或丙氨酸扫描诱变(参见,例如,Cunningham和Wells,1989,见上文)来鉴定。在后一种技术中,将突变引入到分子中的每个带正电荷的残基处,并且测试所得突变分子的α-L-阿拉伯呋喃糖苷酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物_酶相互作用的位点也能够通过分析三维结构来测定,如通过核磁共振分析、晶体学或光亲和标记等技术所测定的(参见,例如,deVos等,1992,见上文;Smith等,1992,见上文;Wlodaver等,1992,见上文)。本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低的严格条件下,优选低严格条件,更优选中等严格条件,更优选中_高严格条件,甚至更优选高严格条件,并且最优选非常高的严格条件下,与以下序列杂交SEQIDNO:1的成熟多肽编码序列或其全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。本发明还涉及分离的多核苷酸,所述分离的多核苷酸通过以下方法获得(a)在非常低、低、中等、中-高、高或非常高严格条件下,将DNA的群体与SEQIDNO:1的成熟多17肽编码序列或其全长互补链杂交;和(b)分离杂交的多核苷酸,其编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽。核酸构建体本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个(数个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的例子是从下述获得的启动子大肠杆菌Iac操纵子、天蓝色链霉菌(Str印tomycescoelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727_3731),以及tac启动子(DeBoer等,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21-25)。另外的启动子在"Usefulproteinsfromrecombinantbacteria,,于ScientificAmerican,1980,242:74_94中;禾口在Sambrook等,1989,见上文中描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的例子是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(WC)00/56900)、镶片镰孢Quirm(W000/56900)、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423_488描述。18调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3,末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。调控序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列,其与编码分泌多肽的编码序列片段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列异源的信号肽编码序列。异源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码序列可在本发明中使用。对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列芽孢杆菌属NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。在一个优选的方面,信号肽包含SEQIDNO:2的氨基酸1至17或者由SEQIDNO:2的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQIDNO1的核苷酸1至51或者由SEQIDNO1的核苷酸1至51组成。调控序列还可以是前肽编码序列,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情况下称为酶原(zymogen))0前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(W095/33836)的基因获得前肽编码序列。当信号肽和前肽序列二者均出现在多肽的氨基末端时,将前肽序列置于紧接着(nextto)多肽氨基末端,并且将信号肽序列置于紧接着前肽序列的氨基末端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的例子是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GALl系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它例子是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(数个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。本发明的载体优选地含有一个或几个选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。细菌选择性标记的例子是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthraniIatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霄的amdS禾口pyrG基因禾口吸水链霄菌(Streptomyceshygroscopicus)的bar基因。本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(r印licator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。细菌复制起点的例子是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUBllO、pE194、pTA1060和ρΑΜβ1的复制起点。用于酵母宿主细胞中的复制起点的例子是2微米复制起点,ARSl,ARS4,ARSl和CEN3的组合,和ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的例子是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分离AMAl基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知21的(参见,例如,Sambrook等,1989,见上文)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,所述重组宿主细胞在所述多肽的重组生产中有利使用。将包含本发明多核苷酸的载体导入宿主细胞中,使得载体作为染色体整合物或者作为自我复制的染色体外载体维持,如较早所描述的。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择会很大程度上取决于编码多肽的基因及其来源。宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。在一个优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在一个更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。在一个优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。在一个优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。可通过如下方法实现将DNA引入到芽孢杆菌属细胞例如原生质体转化(参见,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受态细胞(参见,例如,Young禾口Spizizen,1961,JournalofBacteriology81:823_829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56:209_221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742_751)或接合(参见,例如,Koehler禾口Thorne,1987,JournalofBacteriologyl69:5771_5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399_405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通过如下方法实现将DNA引入到假单胞菌细胞例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)。可通过如下方法实现将DNA引入到链球菌属细胞例如天然感受态(naturalcompetence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.321295-1297),原生质体转化(参见,例如,Cart和Jollick,1991,Microbios.68189-2070),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用本领域已知的将DNA导入宿主细胞中的任何方法。宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。在一个优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽抱纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.Μ·,禾口Davenport,R.R编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一个甚至更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在一个最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进23行,而碳分解代谢可以是发酵的。在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属/嗜热霉属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干(Ceriporiopsisaneirina)、干if^lii、Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa>Ceriporiopsissubvermispora、B誉角质金包子菌、Chrysosporiumlucknowense、热带金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、|£金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata),刺芹侧耳(Pleurotuseryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton^,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volumel94,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o生产方法本发明还涉及用于生产本发明多肽的方法,其包括(a)在有益于生产多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在一个优选的方面,所述细胞是腐质霉属细胞。在一个更优选的方面,所述细胞是特异腐质霉。在一个最优选的方面,所述细胞是特异腐质霉DSM1800。本发明还涉及用于生产本发明的多肽的方法,其包括(a)在有益于生产多肽的条件下培养重组宿主细胞,如本文所描述的;和(b)回收所述多肽。本发明还涉及用于生产本发明的多肽的方法,其包括(a)在有益于生产多肽的条件下培养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQIDN0:1的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码多肽,所述多肽包含SEQIDNO:2的成熟多肽或由该成熟多肽组成,和(b)回收所述多肽。在本发明的生产方法中,使用本领域熟知的方法在适合于生产所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(Iysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(pr印arative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS_PAGE或提取(参见,例如,ProteinPurification,J.-C.Janson禾口LarsRyden编,VCHPublishers,NewYork,1989)。植物本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核苷酸,所述多核苷酸编码本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的例子是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的例子是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模型生物体拟南芥(Arabidopsisthaliana)。植物部分的例子是茎(stem)、愈伤组织(calIus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)禾口细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码本发明多肽的一个或多个(数个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86:506所述。对于组成性表达,可以使用35S_CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块莲和果实的启动子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275_303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863_878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantandCellPhysiology39:885_889),来自豆球蛋白(Iegumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantandCellPhysiology39:935_941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本
技术领域
公知的任何其他种子特异性的启动子,例如,在TO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecularandgeneralgenetics248:668_674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙26烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasil等,1992,Bio/Technology10:667_674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。本发明还涉及用于生产本发明多肽的方法,其包括(a)在有益于生产所述多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽;和(b)回收所述多肽。去除或减少α-L-阿拉伯呋喃糖苷酶活性本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。可以使用本领域熟知的方法通过减少或消除编码本发明多肽的核苷酸序列的表达,所述方法例如,插入、破坏、替代或缺失来构建突变细胞。在一个优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的例子可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变来进行。此外,可以通过使用这些诱变剂的任何组合来进行诱27变。适合于本发明目的的物理或化学诱变剂的例子包括紫外(UV)照射、羟胺、N-甲基-N,-硝基-N-亚硝基胍(MNNG)、0_甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。通过导入、取代或去除基因中的一个或多个(数个)核苷酸或其转录或翻译所需的调控元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在一个特别优选的方面,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许所述互补反义核苷酸序列与mRNA杂交的条件下,由此减少或消除翻译的蛋白质的量。本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。这样生成的多肽缺陷型突变细胞作为表达天然和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产天然或异源多肽的方法,其包括(a)在有益于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。在另一方面,本发明涉及通过发酵可产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无α-L-阿拉伯呋喃糖苷酶活性的蛋白质产品的方法在发酵之前、过程中或发酵完成之后向发酵液(fermentationbroth)中添加有效量的能够抑制α-L-阿拉伯呋喃糖苷酶活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。在另一方面,本发明涉及通过如下生产基本上无α-L-阿拉伯呋喃糖苷酶活性的蛋白质产物的方法在允许产物表达的条件下培养细胞,将得到的培养液进行组合的PH和温度处理以基本上减少α-L-阿拉伯呋喃糖苷酶活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的PH和温度处理。所述组合的PH和温度处理可任选地与α-L-阿拉伯呋喃糖苷酶抑制剂处理组合使用。依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的α-L-阿拉伯呋喃糖苷酶活性。可使用此方法获得α-L-阿拉伯呋喃糖苷酶活性的完全去除。组合的ρΗ和温度处理优选在2-4或9-11范围内的ρΗ和至少60_70°C范围内的温度进行一段足够的时间以达到期望的效果,通常30至60分钟是足够的。用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。用于产生基本上无α-L-阿拉伯呋喃糖苷酶产物的本发明的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(amylolyticenzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolyticenzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的例子包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。α-L-阿拉伯呋喃糖苷酶缺陷细胞也可以用于表达在制药上引起兴趣的异源蛋白质如激素、生长因子、受体等。可理解的是术语“真核多肽”不仅包括天然多肽,也包括那些多肽例如酶,其通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、PH耐受性等。在另外的方面,本发明涉及基本上无α-L-阿拉伯呋喃糖苷酶活性的蛋白质产物,其通过本发明的方法产生。抑制多肽表达的方法本发明还涉及抑制多肽在细胞中表达的方法,其包括对细胞施用双链RNA(dsRNA)分子或者在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包含本发明多核苷酸的亚序列。在一个优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多的双链体核苷酸。dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面,dsRNA是用于抑制转录的小干扰RNA(SiRNA)。在另一个优选的方面,dsRNA是用于抑制翻译的微RNA(miRNA)。本发明还涉及所述双链RNA(dsRNA)分子,其包含SEQIDNO1的成熟多肽编码序列中用于抑制多肽在细胞中表达的部分。本发明不受到任何特定作用机制的限制,dsRNA能进入细胞,并引起相似或相同序列的单链RNA(ssRNA)的降解,所述RNA包括内源mRNA。当细胞接触dsRNA时,来自同源基因的mRNA选择性地受到称为RNA干扰(RNAi)的过程的降解。本发明的dsRNA可以用于基因沉默疗法。在一个方面,本发明提供使用本发明的dsRNAi选择性地降解RNA的方法。所述过程可以在体外、在活体外(exvivo)或在体内进行。在一个方面,dsRNA分子能够用于产生细胞、器官或动物中的功能缺失突变(loss-of-functionmutation)。制备或使用选择性降解RNA的dsRNA分子的方法在本领域中公知,参见,例如,美国专利号6,506,559;美国专利号6,511,824;美国专利号6,515,109;和美国专利号6,489,127。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的α-L-阿拉伯呋喃糖苷酶活性,例如,以至少1.1的富集因数(enrichmentfactor)增力口。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。用途本发明还涉及使用具有α-L-阿拉伯呋喃糖苷酶活性的多肽或其组合物的方法。可以在数种应用中使用本发明具有α-L-阿拉伯呋喃糖苷酶活性的多肽来降解或转化含有木聚糖的材料,其通过用有效量的所述多肽处理所述材料来进行(参见例如WO2002/18561)。优选地,在必须降解木聚糖的方法中与其它木聚糖降解酶诸如木聚糖酶、乙酰木聚糖酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、阿魏酸酯酶、葡糖醛酸糖苷酶,和其组合联合使用本发明的多肽。由于脱酰反应,木聚糖对木聚糖酶和其它木聚糖降解酶的易接近性变得更好。具有α-L-阿拉伯呋喃糖苷酶活性的多肽在许多应用中是有用的体内修饰含有木聚糖的动物饲料以改善消化率;在例如燃料和/或可饮乙醇的生产中源于生物量降解或转化成可发酵糖类的普遍应用;纸浆和纸脱木质化中使用的加工助剂;纺织品的酶促煮炼(scouring)系统的成分;食物应用,例如烘焙,与其它酶促功能性组合以改善烘焙物品的物理特性;和与其它酶功能性组合的洗衣洗涤剂应用。可以在根据美国专利号5,658,765的用于处理Kraft浆的方法中使用多肽。一般而言,通常用木聚糖酶处理Kraft浆以除去纸产品制备物中的木质素。当在木聚糖酶处理前或与木聚糖酶处理同时用α-L-阿拉伯呋喃糖苷酶处理纸浆时,木聚糖酶的效率得到很大地提高。也可以在根据美国专利号5,658,765的用于生成木糖或木寡糖的方法中使用所述多肽。所述多肽也可以作为根据美国专利号6,245,546的饲料增强酶使用,所述饲料增强酶改良饲料消化率以提高其利用效率。α-L-阿拉伯呋喃糖苷酶在饲料中的使用可以降低饲料组分的溶解度,由此减少粘性,并降低戊聚糖(pentosanes)的抗营养效果。也可以在根据美国专利号5,693,518的烘焙中使用所述多肽。可以进一步在根据WO2002/24926的酿造中使用所述多肽,其中可以使用此酶与其它酶的组合来降解生物细胞壁材料以在涉及果汁或啤酒制备的应用中提高溶解度或流动特征。因此,本发明还涉及降解木聚糖的方法,包括用所述具有α-L-阿拉伯呋喃糖苷酶活性的多肽处理含有木聚糖的材料。在一个优选的方面,进一步用一种或多种木聚糖降解酶处理含有木聚糖的材料。信号月太本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,其中所述基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQIDNO2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17组成,其中所述基因对于该核苷酸序列是外源的。在一个优选的方面,所述核苷酸序列包括SEQIDNO=I的核苷酸1至51或由SEQIDNO1的核苷酸1至51组成。本发明还涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。本发明还涉及用于产生蛋白质的方法,包括(a)在适合于产生所述蛋白质的条件下培养这样的重组宿主细胞;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和蛋白质。术语“蛋白质”还包含组合以形成编码产物的两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一个或多个(数个)对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程改造的变异。优选蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报告蛋白(reporter)。在一个更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在一个更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以从任何原核、真核或其它来源获得。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。31实施例材料作为缓冲液和底物使用的化学品是至少试剂级的商业产品。菌株使用特异腐质霉DSM1800作为编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽的家族62基因的来源。使用黑曲霉MBinl20菌株(W02004/090155)来表达编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽的特异腐质霉基因。培养基PDA平板每升由39g马铃薯右旋糖琼脂组成。YP培养基每升由IOg酵母提取物和20g细菌用蛋白胨组成。COVEA尿素-乙酰胺+平板每升由20mlCOVEA盐溶液、220g山梨糖醇、IOg葡萄糖、IOmlIM乙酰胺、和30g细菌pH5.2。COVEA盐溶液每升由26gKCl、26gMgS04、76gKH2PO4、和50mlCOVEA痕量元素溶液组成。COVEA痕量元素溶液每升由0.04gNa2B4O7·10Η20、0·4gCuSO4·5Η20、0·8gFeSO4·7Η20、0·7gMnSO4·H20,0.8gNa2MoO2·2H20、10gZnSO4·7H20、禾口IOg柠檬酸组成。M410培养基每升由50g麦芽糖、50g葡萄糖、2gMgSO4·7H20、2gKH2PO4,4g柠檬酸无水粉末、8g酵母提取物、2g尿素、0.5gAMG痕量金属溶液和0.5gCaCl2组成;pH6.0。AMG痕量金属溶液每升由14.3gZnSO4·7Η20、2·5gCuSO4·5Η20、0·5gNiCl2·6Η20、13.8gFeSO4·7Η20、8·5gMnSO4·7Η20和3g柠檬酸组成。LB培养基每升由IOg胰蛋白胨、5g酵母提取物和5gNaCl组成。实施例1具有α-L-阿拉伯呋喃糖苷酶活性的特异腐质霉GH62A多肽的鉴定ULTRAFL0L的蛋白质分级。首先使用HIPREP26/10脱盐柱(GEHealthcare,Piscataway,NJ,USA)来将2ml等分试样的ULTRAFLOUNovozymesA/S,Bagsvaerd,丹麦)缓冲液交换入150mM氯化钠-20mM乙酸钠pH5中。然后通过用装备有3,000道尔顿截留分子量膜(VivascienceAG,Hannover,德国)的VIVASPIN20旋转柱进行超滤来将所得的经缓冲液交换的材料(18.5ml)浓缩至3ml。然后通过在与等度洗脱相同的缓冲液条件下在HIL0AD26/60SUPERDEX200制备级大小排阻柱(GEHealthcare,Piscataway,NJ,USA)上进行大小排阻层析来分级2ml等分试样的经缓冲液交换并且浓缩的ULTRAFLOL材料。将在280nm处显示UV吸光度的级分组合成来自不同洗脱时间的六份不同汇合物,每份范围为20-40ml总体积。通过用装备有3,OOODa截留分子量膜的VIVASPIN20旋转柱进行超滤来将汇合的级分浓缩至l_5ml。在CRITERION8-16%Tris-HClSDS-PAGE凝胶(Bio-RadLaboratories,Inc.,Hercules,CA,USA)上根据制造商建议的条件分离20μ1每种浓缩的汇合级分。使用PRECISIONPLUSPROTEIN标准品(Bio-RadLaboratories,Inc.,Hercules,CA,USA)作为分子量标志物。从盒取出凝胶,并用考马斯蓝(G250)蛋白质染料(ΒΙΟ-SAFE考马斯染料,Bio-RadLaboratories,Inc.,Hercules,CA,USA)染色,并用剃刀刀片切割可见条带,用于蛋白质鉴定分析。对多肽的凝胶内消化以进行肽测序。使用MultiPROBEΠ液体操作机器人(LiquidHandlingRobot)(PerkinElmerLifeandAnalyticalSciences,Boston,MA,32USA)来实施凝胶内消化。用50μ1在IOOmM碳酸氢铵ρΗ8.0中的IOmM二硫苏糖醇(DTT)来还原45kDa蛋白质凝胶条带30分钟。还原后,用50μ1在IOOmM碳酸氢铵ρΗ8.0中的55mM碘乙酰胺来使凝胶块烷基化20分钟。容许干燥的凝胶块在25μ1在50mM碳酸氢铵PH8中的胰蛋白酶消化溶液(6ng/l·!1测序级胰蛋白酶;Promega,Madison,WI,USA)中于室温膨胀30分钟,接着于40°C消化8小时。上文所描述的每个反应步骤之后是遵循制造商的标准方案用合适的溶液进行的许多清洗和预清洗。使用50μ1乙腈来使各反应间的凝胶块脱水,并在各步骤间风干凝胶块。用HPLC级水中的甲酸/2%乙腈提取肽两次达30分钟。将肽提取溶液转移至96孔有缘PCR型平板(ABGene,Rochester,NY,USA),其已经冷却至10-15°C,并用96孔板盖(PerkinElmerLifeandAnalyticalSciences,Boston,ΜΑ,USA)覆盖以阻止蒸发。于4°C进一步贮存平板,直至可以实施质谱术分析。蛋白质鉴定。为了通过串联质谱术进行从头肽测序,使用Q-T0FMICR0,即混合IE交四极飞时1、司质i普仪(hybridorthogonalquadrupo1etime—of—flightmassspectrometer)(WatersMicromassMSTechnologies,Milford,MA)jftSifLC/MS/MS^>丰斤。Q-TOFMICRO装备有ULTIMATE毛细管和纳流(nano-flow)HPLC系统,其偶联有FAM0S微自动取样器和SWITCH0SII柱开关装置(LCPackings/Dionex,Sunnyvale,CA,USA),用于使样品浓缩和脱盐。将样品上样至注射环(injectionloop)中安装的保护柱(300μmIDX5cm,PEPMApC18)上,并使用SwitchosII泵用水中的0.1%甲酸以每分钟40μ1清洗2分钟。使用ΝΑΝ-75校准器(calibrator)(Dionex,Sunnyvale,CA,USA)将肽在75μmIDχ15cm,C18,3μm,ΙΟΟΑPEPMAP(LCPackings,SanFrancisco,CA,USA)纳流融合型毛细管柱(nanoflowfusedcapillarycolumn)上以来自175ul/分钟的分流的175nl/分钟的流速分离。在45分钟时间间隔里施用0.甲酸中的5%至80%乙腈的步骤洗脱梯度。在215nm监测柱洗脱液,并经由安装有纳喷雾(nanospray)界面的电喷雾离子源引入Q-TOFMICRO中。Q-TOFMICRO完全受微处理器控制,其使用MASSLYNX软件第4.1版(WatersMicromassMSTechnologies,Milford,MA,USA)来实现。在调查(survey)扫描模式中并且从m/z400至1990的质量范围及MS至MS/MS的开关标准获得数据,以包括大于每秒10.0次计数的离子强度和+2、+3和+4的电荷状态。可以获得扫描时间为1.9秒和中间扫描时间为0.1秒的多至4个共洗脱种类的分析谱。通常使用45伏的锥孔电压(conevoltage),并将碰撞能量编程为随洗脱肽的质量和电荷状态而变化,并且在10_60伏的范围内。以自动方式将所获得的谱组合,使它们平滑,并集中(center),并且产生峰列表。使用PR0TEINLYNXGlobalServer2.2.05软件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio第4·5版SPl(BioinformaticSolutionsInc.,Waterloo,Ontario,加拿大)针对选定的数据库搜索此峰列表。评估来自PR0TEINLYNX和PEAKSStudio搜索的结果,通过评估每个感兴趣离子的MS/MS谱来进一步分析未鉴定的蛋白质,并通过鉴定y和b离子系列并将质量差异与合适的氨基酸匹配来确定从头序列。自凝胶内消化的45kDa多肽凝胶条带的数个多电荷离子(multiplychargedion)获得从通过质谱术进行的从头测序确定的肽序列。双电荷胰蛋白酶肽离子604.26m/z序列测定为[[ILE/Leu]或Asp]-Thr-Ser-Glu-Asn-Asn-Pro-Phe-Ala-Gly-Arg(SEQIDNO:2的氨基酸249至259)。另一种双电荷胰蛋白酶肽离子698.32m/z序列测定为[Gln/Lys]-Tyr-[Ile/Leu]-Met-[Ile/Leu]-Val-Glu-Ser-[Ile/Leu]-Gly-Ser-Arg(SEQIDNO2的氨基酸218至229)。另一种双电荷胰蛋白酶肽离子711.32m/z序列测定为Asn-[Ile/Leu]-Trp-Val-[Ile/Leu]-Ala-Tyr-[Gln/Lys]-Trp-Gly-Arg(SEQIDNO2的氨基酸105至115)。另一种双电荷胰蛋白酶肽离子726.84m/z序列测定为Ala-Ala-Val-Ala-Pro-Thr-Leu-Phe-Tyr-Phe-[Gln/Lys]-Pro-Lys(SEQIDNO2的氨基酸92至104)。另一种双电荷胰蛋白酶肽离子1005.42m/z序列测定为Asn-Asp-[Ile/Leu]-Phe-Glu-Ala_Val-[Gln/Lys]-Val-Tyr-Thr-IIe-Asp-Gly-Ser-Asn-Pro-[Gln/Lys](SEQIDNO2的氨基酸200至217)。不能辨别[Ile/Leu]和[Gln/Lys],因为它们具有等同的质量。实施例2特异腐质霉DSM1800基因组DNA提取于45°C将特异腐质霉DSM1800在PDA平板上培养至汇合。从PDA平板切割三块4mm2正方形,并于41°C和200rpm接种入在带挡板的125ml摇瓶中的25ml含有2%葡萄糖的YP培养基中达2天,期间以200rpm摇动。通过使用MIRACLOTH(Calbiochem,LaJolla,CA,USA)进行过滤来收获菌丝体,在去离子水中清洗两次,并在液氮下冷冻。通过研钵和杵将冷冻的菌丝体研磨成细粉末,并使用DNEASY植物Maxi试剂盒(QIAGENInc.,Valencia,CA,USA)来分离总DNA。实施例3自特异腐质霉DSM1800分离GH62Aα-L-阿拉伯呋喃糖苷酶基因的部分片段使用共有-简并杂合寡核苷酸引物程序(C0DEH0P;Rose等,1998,NucleicAcidsResearch261628-1635),基于实施例1中所描述的鉴定出的肽片段将简并引物设计成相关GH62序列的同源性区域。用于生成特异腐质霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的片段的简并引物为引物HinsGH62sense15,-CCAAGTCGATCTGGGTNCTCGCNTAYCA-3,(SEQIDNO3)简并引物HinsGH62sensel的蛋白质翻译PKSIffVLAYQ(SEQIDNO4)引物HinsGH62antil5,-AGTTGGCGCGNCCNGCRAANGG-3,(SEQIDNO5)简并引物HinsGH62antil的蛋白质翻译PFAGRAN为了获得特异腐质霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的初始DNA片段,于范围为40°C至60°C的6个不同退火温度实施梯度PCR。扩增反应(25μ1)由80ng特异腐质霉DSM1800基因组DNA作为模板,0.4mM各种dATP、dTTP、dGTP和dCTP,50pmol各种引物HinsGH62sensel禾Π弓丨物HinsGH62antil,IXADVANTAGEGC-熔解LA缓冲液(ClontechLaboratories,Inc.,MountainView,CA,USA),和1.25个单位的ADVANTAGEGC基因组聚合酶混合物(ClontechLaboratories,Inc.,MountainView,CA,USA)组成。使用EPPENDORFMASTERCYCLER5333(EppendorfScientific,Inc.,ffestbury,NY,USA)来实施扩增反应,所述EPPENDORFMASTERCYCLER5333编程为于95°C预变性1分钟;各为于95°C的变性温度达30秒;30个循环,每个循环为于50°C+/-1(TC的温度退火30秒(6个梯度选项)和于72°C延伸1分钟;和于72°C最终延伸6分钟。通过在TBE(每升10.8gTris碱、5.5g硼酸和4ml0.5MEDTApH8.0)缓冲液中进行1.0%琼脂糖凝胶电泳来分离反应产物。从凝胶切割来自59.8°C退火温度的约500bpPCR产物条带,使用QIAQUICK凝胶提取试剂盒(QIAGENInc.,Valencia,CA,USA)根据制造商的说明来纯化,并采用染料终止剂化学(Giesecke等,1992,JournalofVirologyMethods38:47_60)引物步行策略以Perkin-ElmerAppliedBiosystemsModel377XL自动DNA测序仪(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA,USA)使用引物HinsGH62sensel和引物HinsGH62antil来测序。实施例4全长特异腐质霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的鉴定使用GEN0MEWALKER通用试剂盒(ClontechLaboratories,Inc.,MountainView,CA,USA)根据制造商的说明从特异腐质霉DSM1800鉴定全长家族62α-L-阿拉伯呋喃糖苷酶基因。简言之,用四种不同留下平端的限制酶(DraI、EcoRV,PvuII和StuI)分别消化来自特异腐质霉DSM1800的总基因组DNA。然后分别将每批消化过的基因组DNA连接至GEN0MEWALKER衔接头(ClontechLaboratories,Inc.,MountainView,CA,USA)以创建四个文库。然后采用这四个文库作为PCR反应中的模板,所述PCR反应使用下文所显示的四种基因特异性引物,两种用于通过编码α-L-阿拉伯呋喃糖苷酶的N端的5’末端扩增片段上游的初次和再次PCR,而两种用于通过编码α-L-阿拉伯呋喃糖苷酶的C端的3’末端扩增片段下游的初次和再次PCR。基于来自实施例3中所描述的特异腐质霉的部分家族62α-L-阿拉伯呋喃糖苷酶基因序列来设计下列引物。N端引物Hins_GH62_GSPl_R(初次)5’-AGCTGTCGCTGATGGAGCCCGAGAAGA-3‘引物Hins_GH62_GSP2_R(再次)5,-GAAGGCAGTCCGGCCCCATTGATATGC-3‘C-端引物Hins_GH62_GSPl_F(初次)5,-GCTCCAACCCCAAGCAGTACCTCATGC-3,(SEQIDNO8)引物Hins_GH62_GSP2_F(再次)5,-CCGCTACTTCCGCTCCTACGTCTCCAA-3,(SEQIDNO9)初次扩增由最终体积25μ1中1μ1(约6ng)每个文库作为模板、0.4mM各种dATP、dTTP、dGTP和dCTP、IOpmol衔接头引物1(ClontechLaboratories,Inc.,MountainView,CA,USA)、50pmol弓丨物Hins_GH62_GSPl_R或Hins_GH62_GSPl_F、IXADVANTAGEGC-熔解LA缓冲液(ClontechLaboratories,Inc.,MountainView,CA,USA)和1.25个单位的ADVANTAGEGC基因组聚合酶混合物组成。使用EPPENDORFMASTERCYCLER5333来实施扩增反应,编程为于95°C预变性1分钟;7个循环,每个为于95°C的温度变性25秒;于72°C退火和延伸5分钟;和32个循环,每个为于95°C的温度变性25秒;于67°C退火和延伸5分钟;和于67°C最终延伸7分钟。再次扩增由最终体积25μ1中1μ1每种初次PCR产物作为模板、0.4mM各种dATP、dTTP、dGTP禾口dCTP、IOpmol祎接头引物2(ClontechLaboratories,Inc.,MountainView,CA,USA)、50pmol弓丨物Hins_GH62_GSP2_R或Hins_GH62_GSP2_F、IXADVANTAGE(SEQIDNO6)(SEQIDNO7)35GC-熔解LA缓冲液和1.25个单位的ADVANTAGEGC基因组聚合酶混合物组成。使用EPPENDORFMASTERCYCLER5333来实施扩增反应,编程为于95°C预变性1分钟;5个循环,每个为于95°C的温度变性25秒;于72°C退火和延伸5分钟;和20个循环,每个为于95°C的温度变性25秒;于67°C退火和延伸7分钟;和于67°C最终延伸5分钟。通过在TBE缓冲液中进行1.0%琼脂糖凝胶电泳来分离反应产物。从5’端PCR扩增物中,从凝胶切割来自DraI文库的600bp产物条带,使用QIAQUICK凝胶提取试剂盒根据制造商的说明来纯化、并测序。从3’端PCR扩增物中,从凝胶切割来自DraI文库的1.Skb产物条带,并从凝胶切割来自EcoRV文库的700bp产物条带,使用QIAQUICK凝胶提取试剂盒根据制造商的说明来纯化、并测序。通过使用染料终止剂化学(Giesecke等,1992,见上文)的Perkin-ElmerAppliedBiosystemsModel377XL自动DNA测序仪和引物步行策略来实施PCR片段的DNA测序。使用衔接头引物2、引物Hins_GH62_GSP2_R和引物Hins_GH62_GSP2_F来测序。对核苷酸序列数据细察质量,并通过PHRED/PHRAP软件(华盛顿大学,Seattle,WA,USA)的帮助来彼此比较所有序列。与实施例3中所描述的来自特异腐质霉的部分家族62α-L-阿拉伯呋喃糖苷酶基因序列比较和比对PCR片段序列结果。基于本文和实施例3中所获得的基因片段来构建基因模型,其容许用其它同源家族62α-L-阿拉伯呋喃糖苷酶测定基因的5’和3’端。实施例5全长特异腐质霉GH62Aα-L-阿拉伯呋喃糖苷酶基因的克隆和黑曲霉表达载体的构建设计下文所显示的两种合成的寡核苷酸引物以从由实施例2中制备的基因组DNAPCR扩增出全长特异腐质霉DSM1800α-L-阿拉伯呋喃糖苷酶基因。使用InFusion克隆试剂盒(BDBiosciences,PaloAlto,CA,USA)以将片段直接克隆入表达载体pBM120a(TO2006/078256)中。BDinfGH62有义NCO5,-ACACAACTGGCCATGAGGTCGGTTGCTGCTTTCCTC-3,(SEQIDNO10)BDinfantiGH62PACl5,-CAGTCACCTCTAGTTATTACTTACAAGGATTCGAGT-3,(SEQIDNO11)粗体字母代表编码序列。剩余序列与pBM120a的插入位点同源。在PCR反应中使用50皮摩尔的上述引物之每种,所述PCR反应由25μ1最终体积中80ng特异腐质霉基因组DNA,IXADVANTAGEGC-熔解LA缓冲液,0.4mM各种dATP、dTTP、dGTP和dCTP,和1.25个单位的ADVANTAGEGC基因组聚合酶混合物组成。使用EPPENDORFMASTERCYCLER5333来实施扩增,编程为于94°C1分钟的1个循环;5个循环,每个为于94°C30秒,50°C30秒和72°C90秒;和30个循环,每个为于94°C30秒、60°C30秒和72°C90秒;和于72°C最终延伸5分钟。然后加热块转到4°C浸泡循环。通过在TBE缓冲液中进行1.0%琼脂糖凝胶电泳来分离反应产物,其中从凝胶切割出约1.1-1.2kb产物条带,并使用QIAQUICK凝胶提取试剂盒根据制造商的说明来纯化。用NcoI和PacI来消化质粒pBM120a,通过在TBE缓冲液中进行1.0%琼脂糖凝胶电泳来分离,并使用QIAQUICK凝胶提取试剂盒根据制造商的说明来纯化。36使用InFusion克隆试剂盒(BDBiosciences,PaloAlto,CA,USA)将基因片段和消化过的载体连接在一起,产生pMMar4(图2),其中α_L_阿拉伯呋喃糖苷酶基因的转录在来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂合体(NA2_tpi启动子)的控制下。连接反应(20μ1)由IXInFusion缓冲液(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1InFusion酶(稀释110)(BDBiosciences,PaloAlto,CA,USA),106ng用NcoI和PacI消化的pBM120a,禾口163ng纯化的特异腐质霉PCR产物组成。于室温温育反应达30分钟。使用2μ1反应物来转化大肠杆菌XLlOSOLOPACKGold超感受态细胞(Stratagene,LaJolla,CA,USA)。通过限制性消化来检测含有pMMar4的大肠杆菌转化体,并使用BIOROBOT9600(QIAGENInc.,Valencia,CA,USA)来制备质粒DNA0使用染料_终止剂化学(Giesecke等,1992,见上文)和引物步行策略以Perkin-ElmerAppliedBiosystemsModel377XL自动DNA测序仪通过DNA测序来确认pMMar4中的特异腐质霉GH62A插入物。使用引物996271Na2tpi启动子fwd和996270AMGrev(下文所显示)来测序。996271Na2tpi启动子fwd5,-ACTCAATTTACCTCTATCCACACTT-3,(SEQ.IDNO12)996270AMGrev5,-CTATAGCGAAATGGATTGATTGTCT-3,(SEQ.IDNO13)将含有pMMar4的克隆挑入2X50ml补充有每ml100μg氨苄青霉素的LB培养基中,并在250ml玻璃烧杯中于37°C和200rpm振动培养过夜。使用QIAGENMidi试剂盒根据制造商的说明从培养液分离质粒pMMar4。用PmeI消化质粒pMMar4,通过在TBE缓冲液中进行1.0%琼脂糖凝胶电泳来分离,并使用QIAQUICK凝胶提取试剂盒根据制造商的说明来纯化含有GH62Aci-L-阿拉伯呋喃糖苷酶基因的片段以准备好转化黑曲霉MBinl20原生质体。使用TOPOTACLONING试剂盒来将约1.1-1.2kb的片段克隆入pCR2.1-TOPO载体(Invitrogen,Carlsbad,CA,USA)中以生成pHinsGH62A(图3)。通过DNA测序来确认pHinsGH62A中的特异腐质霉GH62A插入物。在2007年11月20日将大肠杆菌pHinsGH62A保藏于农业研究机构专利培养物保藏中心(AgriculturalResearchServicePatentCultureCollection),北区石if究中心(NorthernRegionalResearchCenter),Peoria,IL0实施例6编码具有α-L-阿拉伯呋喃糖苷酶的GH62A多肽的全长特异腐质霉基因组序列的表征对核苷酸序列数据(实施例5)细察质量,并通过PHRED/PHRAP软件(华盛顿大学,Seattle,WA,USA)的帮助来彼此比较所有序列。图IA和图IB中显示了核苷酸序列(SEQIDNO1)和推导的氨基酸序列(SEQIDNO2)。基因组片段编码387个氨基酸的多肽。全长编码序列和成熟编码序列的%G+C含量分别是64.9%和65%。使用SignalP软件程序(Nielsen等,1997,ProteinEngineering101-6),预测17个残基的信号肽。预测的成熟蛋白含有370个氨基酸,具有40.3kDa的分子量。使用Needleman-Wunsch算法(Needleman禾口Wunsch,1970,J.Mol.Biol.48443-453)来测定氨基酸序列的比较配对全局比对,如EMBOSS的Needle程序中所执行的,其中缺口开放罚分10,缺口延伸罚分0.5,和EBL0SUM62矩阵。比对显示特异腐质霉家族62α-L-阿拉伯呋喃糖苷酶基因的成熟多肽的推导氨基酸序列与黑曲霉阿拉伯木聚糖降解酶(GeneSeqP登录号AAR94170)的推导氨基酸序列共享65.7%同一性(排除缺口)。实施例7特异腐质霉GH62Aα-L-阿拉伯呋喃糖苷酶基因在黑曲霉MBinl20中的表达根据Christensen等,1988,Bio/Technology61419-1422的方法来制备黑曲霉MBinl20原生质体。使用4ygPmeI消化过的pMMar4来转化黑曲霉MBinl20。用经PmeI消化的pMMar4转化黑曲霉MBinl20产生约50个转化体。将22个转化体分离至各个COVEA尿素-乙酰胺+平板。从22个转化体的汇合的COVEA尿素-乙酰胺+平板切割二块3mm平方琼脂块,并分别接种入125ml塑料摇瓶中的25mlM410培养基中,并于34°C,250rpm温育。温育5天后,通过SDS-PAGE来分析6μ1来自每种培养物的上清液,所述SDS-PAGE使用CRITERION8-16%Tris-HClSDS-PAGE凝胶及CRITERIONCell(Bio-RadLaboratories,Inc.,Hercules,CA,USA)根据制造商的说明来进行。用ΒΙΟ-SAFE考马斯染料(Bio-RadLaboratories,Inc.,Hercules,CA,USA)对所得的凝胶染色。培养物的SDS-PAGE谱显示约半数的转化体具有约45kDa的主要条带。选择一个称作黑曲霉MMar202的转化体用于在黑曲霉中表达具有α_L_阿拉伯呋喃糖苷酶活性的特异腐质霉GH62A多肽。实施例8黑曲霉MMar202的发酵摇瓶培养基每升由70g蔗糖和100大豆浓缩物组成。痕量金属溶液每升由13.SgFeSO4·7H20、14.3gZnSO4·7H20、11.6gMnSO4·Η20、2.5gCuSO4·5Η20、0·5gNiCl2·6H20禾口3.3g—水合柠檬酸组成。将100ml摇瓶培养基添加至500ml摇瓶。用来自黑曲霉MMar202的甘油孢子原液的200μ1接种摇瓶,并于30°C在轨道振荡器上以220rpm温育72小时。使用50ml来自4个不同摇瓶之每个的摇瓶培养液来接种3升发酵容器。发酵分批培养基每升由250g葡萄糖、5g(NH4)2S04、2.5gKH2P04、0.5gCaCl2·2H20、2gMgSO4-7H20,3gK2SO4Ug柠檬酸、Iml消沫剂和0.75ml痕量金属溶液组成。痕量金属溶液每升由13.8gFeSO4·7Η20、14·3gZnS04·7Η20、11·6gMnSO4·H20,2.5gCuSO4·5Η20、0·5gNiCl2·6Η20和3.3g—水合柠檬酸组成。发酵补料培养基每千克由406g麦芽糖、0.5g—水合柠檬酸、和Iml消泡剂组成。将总共2升发酵分批培养基添加至ApplikonBiotechnology二升玻璃夹套发酵罐(ApplikonBiotechnology,Schiedam,荷兰)。以0至4g/l/小时的速率定量给料发酵补料培养基185小时的一段时间。将发酵容器维持于34°C的温度,并使用Applikon1030控制系统(ApplikonBiotechnology,Schiedam,荷兰)来将pH控制于设定点5.1+/-0.1。以Ivvm的速率将空气添加至容器,并通过以IlOOrpm旋转的Rushton叶轮来搅动培养液。发酵结束时,从容器收获全培养液,并以3000Xg离心来除去生物量。将上清液无菌过滤,并于5至10°C贮存。实施例9具有α-L-阿拉伯呋喃糖苷酶活性的特异腐质霉GH62A多肽的纯化首先将含有黑曲霉中表达的具有α-L-阿拉伯呋喃糖苷酶活性的重组特异腐质霉GH62A多肽的发酵培养液上清液(实施例8)缓冲液交换入25mM乙酸钠pH5.1中,38其通过流过400ml在相同缓冲液中平衡的SEPHADEXG-25细树脂(GEHealthcare,Piscataway,NJ,USA)来进行。然后使用以相同缓冲液平衡的MONOSHR16/10柱(GEHealthcare,Piscataway,NJ,USA)来纯化所得的经缓冲液交换的材料(50ml),然后用0-0.5M氯化钠的线性梯度来洗脱。接着,通过SDS-PAGE来分析在280nm处显示UV吸光度的级分。在CRITERION8-16%Tris-HClSDS-PAGE凝胶上根据制造商建议的条件来分离2.5μ1级分等分试样。使用PRECISIONPLUSPROTEIN标准品作为分子量标志物。从盒取出凝胶,并用INSTANTBLUE考马斯蓝蛋白质染料(ExpedeonProteinSolutions,Cambridge,UK)根据制造商建议的条件来染色。还用中等粘度小麦阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,爱尔兰)对在280nm处显示UV吸光度的级分测定活性。将级分稀释,并在96孔COSTAR微量滴定板(CorningInc.,Corning,NY,USA)中与每ml具有0.01%(w/v)TWEEN20的50mM乙酸钠pH5中4.75mg小麦阿拉伯木聚糖在总体积200μ1中于40°C—起温育70分钟。通过添加50μ12%氢氧化钠来停止反应,并使用适用于96孔微板形式的对羟基苯甲酸酰胼(PHBAH,Sigma,St.Louis,MO,USA)测定法来测定还原糖含量,如下文所述。简言之,在96孔锥底COSTAR微量滴定板中放置100μ1等分试样的样品。通过将50μ1在2%NaOH中的1.5%(w/v)PHBAH添加至每孔来起始反应。在无盖的情况中于95°C加热平板10分钟。容许平板冷却至室温,并将50μ1H2O添加至每孔。将100μ1来自每孔的等分试样转移至平底96孔板,并使用SPECTRAMAX微板读板仪(MolecularDevices,Sunnyvale,CA,USA)来测量在410nm的吸光度。使用葡萄糖标准品(0.100-0.065mg/ml)来准备标准曲线以将在410nm获得的吸光度值转化成葡萄糖等同物,并量化测定法中释放的还原糖量。汇集含有SDS-PAGE上40-150kD的长的扩散条带,而且还在小麦阿拉伯木聚糖的情况中具有活性的级分,总体积为48ml。接着使用具有IOkDa截留分子量膜的VIVASPIN20超滤浓缩器来将汇集的材料浓缩至1.5ml体积。然后使用HIL0AD26/60SUPERDEX75制备级柱(GEHealthcare,Piscataway,NJ,USA)在具有125mM氯化钠的25mM乙酸钠pH5中纯化浓缩的材料。以与上文所描述类似的方式通过SDS-PAGE和小麦阿拉伯木聚糖活性来分析和汇集柱级分,以产生纯化的特异腐质霉α-L-阿拉伯呋喃糖苷酶。使用微板BCA蛋白质测定试剂盒(Pierce,Rockford,IL,USA)来测定纯化的特异腐质霉α-L-阿拉伯呋喃糖苷酶的蛋白质浓度。实施例10具有α-L-阿拉伯呋喃糖苷酶活性的特异腐质霉GH62A多肽的酶活性将具有α-L-阿拉伯呋喃糖苷酶活性的纯化的特异腐质霉GH62A多肽(实施例9)稀释,并在96孔COSTAR微量滴定板中与每mlIOOmM乙酸钠pH5中5mg中等粘度小麦阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,爱尔兰)在总体积200μ1中于40°C—起温育30分钟。温育后,在冰上冷却平板,然后通过具有BIOMAX5kDa截留分子量膜(Millipore,Billerica,MA,USA)的ULTRAFREE-0.5离心滤器来过滤反应物。然后对滤液分析糖含量。通过具有0.05%w/w苯甲酸的0.005M硫酸以每分钟0.6ml的流速从4.6x250mmAMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)于65°C洗脱后,通过积分来自通过纯糖样品校准的折射率检测器(CHEMSTATION,AGILENT1100HPLC,AgilentTechnologies,SantaClara,CA,USA)的葡萄糖、阿拉伯糖和木糖信号来定量,从而测量样品滤液的糖浓度。观察到具有α-L-阿拉伯呋喃糖苷酶活性的特异腐质霉多肽在测定条件下从小麦阿拉伯木聚糖释放92.6mg阿拉伯糖/mg酶蛋白和7.4mg木糖/mg酶蛋白。生物材料保藏依据布达佩斯条约的条款,下述的生物学材料已经保藏于农业研究机构专利培养物保藏中心(AgriculturalResearchServicePatentCultureCollection)或农业研究培养物保藏中心(AgriculturalResearchCultureCollection,NRRL),北区研究中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,USA,并给予下述的保藏号保藏物保藏号保藏日期大肠杆菌pHinsGH62ANRRLB-500752007年11月20日所述菌株于下述条件下保藏确保在本专利申请未决期间,由外国专利法授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得所述保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。通过下列编号的段落来进一步描述本发明[1]具有α-L-阿拉伯呋喃糖苷酶活性的分离的多肽,其选自下组(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQIDNO:2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严格条件下与SEQIDNO:1的成熟多肽编码序列或其全长互补链杂交;(c)由多核苷酸编码的多肽,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一个或多个(数个)氨基酸的变体。[2]段落1的多肽,其包含与SEQIDNO2的成熟多肽具有至少70%序列同一性的氨基酸序列。[3]段落2的多肽,其包含与SEQIDNO2的成熟多肽具有至少75%序列同一性的氨基酸序列。[4]段落3的多肽,其包含与SEQIDNO2的成熟多肽具有至少80%序列同一性的氨基酸序列。[5]段落4的多肽,其包含与SEQIDNO2的成熟多肽具有至少85%序列同一性的氨基酸序列。[6]段落5的多肽,其包含与SEQIDNO2的成熟多肽具有至少90%序列同一性的氨基酸序列。[7]段落6的多肽,其包含与SEQIDNO2的成熟多肽具有至少95%序列同一性的氨基酸序列。[8]段落7的多肽,其包含与SEQIDNO2的成熟多肽具有至少97%序列同一性的氨基酸序列。[9]段落1的多肽,其包含SEQIDNO2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段,或由SEQIDNO:2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段组成。[10]段落9的多肽,其包含SEQIDNO2的氨基酸序列或由SEQIDNO2的氨基酸序列组成。[11]段落9的多肽,其包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽组成。[12]段落1的多肽,其由多核苷酸编码,所述多核苷酸在至少中-高严格条件下与SEQIDNO1的成熟多肽编码序列或其全长互补链杂交。[13]段落12的多肽,其由多核苷酸编码,所述多核苷酸在至少高严格条件下与SEQIDNO1的成熟多肽编码序列或其全长互补链杂交。[14]段落1的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDN0:1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列。[15]段落14的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少75%序列同一性的核苷酸序列。[16]段落15的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少80%序列同一性的核苷酸序列。[17]段落16的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少85%序列同一性的核苷酸序列。[18]段落17的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少90%序列同一性的核苷酸序列。[19]段落18的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少95%序列同一性的核苷酸序列。[20]段落19的多肽,其由多核苷酸编码,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少97%序列同一性的核苷酸序列。[21]段落1的多肽,其由多核苷酸编码,所述多核苷酸包含SEQIDN0:1的核苷酸序列或其编码具有α-L-阿拉伯呋喃糖苷酶活性的片段的亚序列,或由SEQIDΝ0:1的核苷酸序列或其编码具有α-L-阿拉伯呋喃糖苷酶活性的片段的亚序列组成。[22]段落21的多肽,其由多核苷酸编码,所述多核苷酸包含SEQIDNO=I的核苷酸序列或由SEQIDNO1的核苷酸序列组成。[23]段落21的多肽,其由多核苷酸编码,所述多核苷酸包含SEQIDNO=I的成熟多肽编码序列或由SEQIDNO1的成熟多肽编码序列组成。[24]段落1的多肽,其中所述多肽是SEQIDNO:2的成熟多肽的包含取代、缺失和/或插入一个或多个(数个)氨基酸的变体。[25]段落1的多肽,其由质粒pHinsGH62A中所含的所述多核苷酸编码,所述质粒pHinsGH62A包含在大肠杆菌NRRLB-50075中。[26]段落1-25中任一项的多肽,其中所述成熟多肽是SEQIDNO2的氨基酸18至387。[27]段落1-26中任一项的多肽,其中所述成熟多肽编码序列是SEQIDNO1的核苷酸52至1161。[28]分离的多核苷酸,其包含编码段落1-27中任一项的多肽的核苷酸序列。[29]段落28的分离的多核苷酸,其在SEQIDNO:1的成熟多肽编码序列中包含至少一个突变,其中所述突变核苷酸序列编码SEQIDNO:2的成熟多肽。[30]核酸构建体,其包含段落28或29的多核苷酸,所述多核苷酸与一个或多个(数个)调控序列可操作连接,所述调控序列指导多肽在表达宿主中生成。[31]重组表达载体,其包含段落30的核酸构建体。[32]重组宿主细胞,其包含段落30的核酸构建体。[33]生成段落1-27中任一项的多肽的方法,包括(a)在有益于所述生产多肽的条件下培养细胞,所述细胞以其野生型形式生成所述多肽;和(b)回收所述多肽。[34]生产段落1-27中任一项的多肽的方法,包括(a)在有益于所述生产多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和(b)回收所述多肽。[35]生成亲本细胞的突变体的方法,包括破坏或缺失编码段落1-27中任一项的多肽的核苷酸序列,得到与所述亲本细胞相比产生更少所述多肽的突变体。[36]通过段落35的方法生成的突变细胞。[37]段落36的突变细胞,其进一步包含编码天然的或异源的蛋白质的基因。[38]生产蛋白质的方法,包括(a)在有益于所述蛋白质生产的条件下培养段落37的突变细胞;和(b)回收所述蛋白质。[39]段落28或29的分离的多核苷酸,其通过如下获得(a)在至少中-高严格条件下,将DNA的群体与SEQIDNO=I的成熟多肽编码序列或其全长互补链杂交;和(b)分离杂交的多核苷酸,其编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽。[40]段落39的分离的多核苷酸,其通过如下获得(a)在至少高严格条件下,将DNA的群体与SEQIDNO=I的成熟多肽编码序列或其全长互补链杂交;和(b)分离杂交的多核苷酸,其编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽。[41]段落39或40的分离的多核苷酸,其中所述成熟多肽编码序列是SEQIDNO1的核苷酸52至1161。[42]生成多核苷酸的方法,所述多核苷酸包含编码具有α-L-阿拉伯呋喃糖苷酶活性的多肽的突变核苷酸序列,所述方法包括(a)将至少一个突变引入SEQIDN0:1的成熟多肽编码序列,其中所述突变核苷酸序列编码多肽,该多肽包含SEQIDNO:2的成熟多肽或由SEQIDNO2的成熟多肽组成;和(b)回收包含所述突变核苷酸序列的多核苷酸。[43]通过段落42的方法生成的突变多核苷酸。[44]生产多肽的方法,包括(a)在有益于所述生产多肽的条件下培养细胞,所述细胞包含编码所述多肽的段落43的突变多核苷酸;和(b)回收所述多肽。[45]生产段落1-27中任一项的多肽的方法,包括(a)在有益于所述生产多肽的条件下培养转基因植物或植物细胞,其包含编码多肽的多核苷酸;和(b)回收所述多肽。[46]转基因植物、植物部分或植物细胞,其用编码段落1-27中任一项的多肽的多核苷酸转化。[47]双链抑制性RNA(dsRNA)分子,其包含段落28或29的多核苷酸的亚序列,其中任选地所述dsRNA是siRNA或miRNA分子。[48]段落47的双链抑制性RNA(dsRNA)分子,其长度为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。[49]抑制细胞中多肽的表达的方法,包括对所述细胞施用双链RNA(dsRNA)分子或者在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含段落28或29的多核苷酸的亚序列。[50]段落49的方法,其中所述dsRNA的长度为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。[51]核酸构建体,其包含编码蛋白质的基因,所述基因与编码信号肽的核苷酸序列可操作连接,所述信号肽包含SEQIDNO2的氨基酸1至17或由SEQIDNO2的氨基酸1至17组成,其中所述基因对于所述核苷酸序列而言是外来的。[52]重组表达载体,其包含段落51的核酸构建体。[53]重组宿主细胞,其包含段落51的核酸构建体。[54]生产蛋白质的方法,包括(a)在有益于所述蛋白质生产的条件下培养段落53的重组宿主细胞;和(b)回收所述蛋白质。[55]用于降解木聚糖的方法,包括用具有段落1-27中任一项的具有α-L-阿拉伯呋喃糖苷酶活性的多肽处理含有木聚糖的材料。[56]段落55的方法,其进一步包括用一种或多种(数种)木聚糖降解酶处理所述含有木聚糖的材料。[57]段落56的方法,其中所述一种或多种(数种)木聚糖降解酶选自下组木聚糖酶、阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、木糖苷酶和葡糖醛酸糖苷酶。[58]段落55的方法,其中所述含有木聚糖的材料是动物饲料。[59]段落55的方法,其中所述含有木聚糖的材料是Kraft浆。[60]段落55的方法,其中所述含有木聚糖的材料是纤维素或木素纤维素材料。本文描述和要求保护的发明并不受限于本文所公开的具体方面的范围,因为这些方面意欲作为本发明几个方面的说明。任何等同的方面意欲在本发明的范围之内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的各种修改对于本领域的技术人员而言会是显而易见的。这些修改也意欲落入所附权利要求书的范围内。在冲突的情况下,将以包括定义的本公开内容为准。4权利要求一种具有αL阿拉伯呋喃糖苷酶活性的分离的多肽,其选自下组(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQIDNO2的成熟多肽具有至少70%序列同一性;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中高严格条件下与SEQIDNO1的成熟多肽编码序列或其全长互补链杂交;(c)由多核苷酸编码的多肽,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列;和(d)SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一个或多个(数个)氨基酸的变体。2.权利要求1的多肽,其包含SEQIDNO2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段,或由SEQIDNO:2的氨基酸序列或其具有α-L-阿拉伯呋喃糖苷酶活性的片段组成。3.权利要求1的多肽,其由多核苷酸编码,所述多核苷酸包含SEQIDNO:1的核苷酸序列或其编码具有α-L-阿拉伯呋喃糖苷酶活性的片段的亚序列,或由SEQIDNO:1的核苷酸序列或其编码具有α-L-阿拉伯呋喃糖苷酶活性的片段的亚序列组成。4.权利要求1的多肽,其由质粒pHinsGH62A中所含的所述多核苷酸编码,所述质粒pHinsGH62A包含在大肠杆菌NRRLB-50075中。5.一种分离的多核苷酸,其包含编码权利要求1-4中任一项的多肽的核苷酸序列。6.一种核酸构建体,其包含权利要求5的多核苷酸,所述多核苷酸与一个或多个(数个)调控序列可操作连接,所述调控序列指导所述多肽在表达宿主中生成。7.—种重组宿主细胞,其包含权利要求6的核酸构建体。8.—种生成权利要求1-4中任一项的多肽的方法,包括(a)在有益于所述多肽生成的条件下培养细胞,所述细胞以其野生型形式生成所述多肽;并(b)回收所述多肽。9.一种生成权利要求1-4中任一项的多肽的方法,包括(a)在有益于所述多肽生成的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;并(b)回收所述多肽。10.一种生成亲本细胞的突变体的方法,包括破坏或缺失编码权利要求1-4中任一项的多肽的核苷酸序列,得到与所述亲本细胞相比产生更少所述多肽的突变体。11.通过权利要求10的方法生成的突变细胞。12.—种生成权利要求1-4中任一项的多肽的方法,包括(a)在有益于所述多肽生成的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述多肽的多核苷酸;并(b)回收所述多肽。13.转基因植物、植物部分或植物细胞,其用编码权利要求1-4中任一项的多肽的多核苷酸转化。14.一种双链抑制性RNA(dsRNA)分子,其包含权利要求5的多核苷酸的亚序列,其中任选地,所述dsRNA是siRNA或miRNA分子。15.一种抑制多肽在细胞中表达的方法,包括对所述细胞施用双链RNA(dsRNA)分子或者在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含权利要求5的多核苷酸的亚序列。16.一种核酸构建体,其包含编码蛋白质的基因,所述基因与编码信号肽的核苷酸序列可操作连接,所述信号肽包含SEQIDNO2的氨基酸1至17,或由SEQIDNO2的氨基酸1至17组成,其中所述基因对于所述核苷酸序列而言是外来的。17.—种重组宿主细胞,其包含权利要求16的核酸构建体。18.—种生成蛋白质的方法,包括(a)在有益于所述蛋白质生成的条件下培养权利要求17的重组宿主细胞;并(b)回收所述蛋白质。19.一种用于降解木聚糖的方法,包括用权利要求1-4中任一项的具有α-L-阿拉伯呋喃糖苷酶活性的多肽处理含有木聚糖的材料。20.权利要求19的方法,其进一步包括用一种或多种(数种)木聚糖降解酶处理所述含有木聚糖的材料。全文摘要本发明涉及具有α-L-阿拉伯呋喃糖苷酶活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体、和宿主细胞以及生成和使用所述多肽的方法。文档编号C12N9/24GK101978049SQ200880125640公开日2011年2月16日申请日期2008年11月20日优先权日2007年11月30日发明者米歇尔·马兰塔,詹姆斯·兰斯顿,金伯利·布朗申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1