阿拉伯糖呋喃糖苷酶的制作方法

文档序号：471232阅读：669来源：国知局

阿拉伯糖呋喃糖苷酶的制作方法
【专利摘要】本发明涉及阿拉伯糖呋喃糖苷酶，具体地涉及具有α-L-阿拉伯糖呋喃糖苷酶活性的分离多肽和编码该多肽的分离核酸序列。本发明也涉及含所述核酸序列的核酸构建体、载体和宿主细胞，以及产生和使用该多肽的方法。
【专利说明】阿拉伯糖呋喃糖苷酶
[0001]本申请是申请日为2006年04月25日，申请号为“200680014246.8”(国际申请号为PCT/DK2006/000213)，名称为“阿拉伯糖呋喃糖苷酶”的发明专利申请的分案申请。
【技术领域】
[0002]本发明涉及具有a -L-阿拉伯糖呋喃糖苷酶活性的分离多肽和编码该多肽的分离核酸序列。本发明也涉及含该核酸序列的核酸构建体、载体、宿主细胞，以及产生和使用该多肽的方法。
【背景技术】
[0003]阿拉伯糖呋喃糖苷酶能水解a -L-阿拉伯糖苷中的末端非还原性a _L_阿拉伯糖呋喃糖苷残基，并分类为EC3.2.1.55。已从多种生物体，包括丝状真菌中分离了阿拉伯糖呋喃糖苷酶。然而，已知几乎没有α-阿拉伯糖呋喃糖苷酶能从双取代木糖中释放阿拉伯糖。已经描述了一种来自青春双歧杆菌(Bifidobacterium adolescentis)的胞内酶能从双取代木糖的C3(也就是内部)释放阿拉伯糖(Van Laere, 1997, Appl.Microbiol.Biotechnol, 47，231-235 和 Van den Broek, 2005, Applied Microbiology andBiotechnology)。已从大麦分离了对单取代和末端双取代木糖有活性的酶,但其对内部双取代木糖几乎没有活性(Ferre, 2000，Eur.J.Biochem.，267，6633-6641)。来自里氏木霉(Trichoderma reesei)的酶可能对末端双取代残基有活性(观察到对3，5_ 二 _0_ a-L-阿拉伯糖呋喃糖基_a -L-阿拉伯糖呋喃糖苷(3，5-d1-0-alpha-Larabinofuranosyl-alpha-L-arabinofuranoside)的活性)，但其对具有内部C3取代阿拉伯糖的寡底物却没有活性(Nogawa, 1999, Appl.Environ.Microbiol., 65, 3964-3968)。
[0004]与全长现有技术序列比较显示，SEQ ID N0:2所示成熟氨基酸序列与球毛壳菌(Chaetomium globosum)氨基酸序列有72%同源性,其相应SEQ ID NO:1DNA序列与相应球毛壳菌DNA序列有73%同源性。SEQ ID NO: 2所示序列与双歧杆菌属(Bifidobacteriumsp.)的细菌GH43a-L-阿拉伯糖呋喃糖苷酶之间的同源性是25%。SEQ ID N0:4所示成熟氨基酸序列与黑曲霉(Aspergillus niger)阿拉伯糖呋喃糖苷酶有38%同源性。

【发明内容】

[0005]本发明的发明人分离了来自丝状真菌特异腐质霉(Humicola insolens) (SEQ IDNO:2)和巨多孔菌(Meripilus giganteus) (SEQ ID NO:4)菌株的a-L-阿拉伯糖呋喃糖苷酶。本发明的发明人也分离了编码新a -L-阿拉伯糖呋喃糖苷酶的基因。该酶是细胞外的。来自特异腐质霉的a-L-阿拉伯糖呋喃糖苷酶属于GH43家族，来自巨多孔菌的a-L-阿拉伯糖呋喃糖苷酶属于GH51家族。
[0006]来自特异腐质霉的a -L-阿拉伯糖呋喃糖苷酶能从双取代木糖释放阿拉伯糖，即该a -L-阿拉伯糖呋喃糖苷酶对具有连接至C2和C3的阿拉伯糖的小麦阿拉伯糖木聚糖(arabinoxylan)的木糖单元有活性。对双取代木糖的活性在将阿拉伯糖木聚糖完全水解为单糖时，例如从生物质(biomass)产生乙醇中是必要的。
[0007]因此，在第一方面，本发明提供了源自真菌的阿拉伯糖呋喃糖苷酶，优选腐质霉属(Humicola)内的菌种,所述阿拉伯糖呋喃糖苷酶能从双取代木糖释放阿拉伯糖。
[0008]因此，在第二方面，本发明提供了阿拉伯糖呋喃糖苷酶，其为:a)具有SEQ ID NO:2所示成熟肽氨基酸序列的多肽，或者可从其通过一个或多个氨基酸的取代、缺失和/或插入而获得的多肽；b)下述i)或ii)所定义的多肽的类似物，其:i)与所述多肽有至少80%同源性，ii)为所述多肽的等位基因变体(allelic variant), c)由核酸序列编码的多肽，所述核酸序列在高严紧条件下与编码成熟多肽的SEQ ID NO:1核酸序列互补链或其具有至少100个核苷酸的亚序列杂交。
[0009]因此，在第三方面，本发明提供了阿拉伯糖呋喃糖苷酶，其为:a)具有SEQ ID N0:4所示成熟肽氨基酸序列的多肽，或可从其通过一个或多个氨基酸的取代、缺失和/或插入而获得的多肽；b)下述i)或ii)所定义的多肽的类似物，其:i)与所述多肽有至少60%同源性，ii)为所述多肽的等位基因变体，c)由核酸序列编码的多肽，所述核酸序列在高严紧条件下与编码成熟多肽的SEQ ID NO: 3核酸序列互补链或其具有至少100个核苷酸的亚序列杂父。
[0010]在第四方面，本发明提供了核酸序列，其包含编码第一或第二方面的阿拉伯糖呋喃糖苷酶的核酸序列。
[0011]在第五方面，本发明提供了核酸序列，其包括:a)DNA序列，其编码SEQ ID N0:2和SEQ ID N0:4所示任一阿拉伯糖呋喃糖苷酶，b)DNA序列类似物，其:i)与所述任一 DNA序列有至少80%同源性，或 ii)与所述任一 DNA序列互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交，或iii)为其等位基因变体，或者c) a)或b)的互补链。
[0012]在第六方面，本发明提供了核酸序列，其与SEQ ID NO:1和SEQ ID NO: 3所示任一DNA序列有至少80%同源性，或者a)与所述任一 DNA序列互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交的核酸序列，b)为其等位基因变体的核酸序列，或c)a)或
b)互补链。
[0013]在第七方面，本发明提供了核酸构建体，其包含与一个或多个调控序列可操作连接的第二、第三、第四方面的核酸序列，所述调控序列能指导阿拉伯糖呋喃糖苷酶在合适表达宿主中表达。
[0014]在第八方面，本发明提供了重组表达载体，其包含第七方面所述核酸构建体。
[0015]在第九方面，本发明提供了重组宿主细胞，其包含第七方面所述核酸构建体。
[0016]在第十方面，本发明提供了产生阿拉伯糖呋喃糖苷酶的方法，其包括在有利于产生阿拉伯糖呋喃糖苷酶的条件下培养第九方面的宿主细胞，和回收阿拉伯糖呋喃糖苷酶。
[0017]在第十一方面，本发明提供了包含第一、第二方面的阿拉伯糖呋喃糖苷酶的组合物。
[0018]在其它方面，本发明提供了第一、第二方面的阿拉伯糖呋喃糖苷酶的用途。
[0019]本发明具体涉及如下各项:
[0020]1.一种能从双取代木聚糖释放阿拉伯糖的阿拉伯糖呋喃糖苷酶，所述阿拉伯糖呋喃糖苷酶源自真菌。
[0021]2.一种阿拉伯糖呋喃糖苷酶，其为:[0022]a)具有SEQ ID NO:2所示成熟肽氨基酸序列的多肽，或者能够从其通过取代、缺失和/或插入一个或多个氨基酸而获得的多肽；
[0023]b)⑴或(ii)中定义的多肽类似物，其
[0024]i)与所述多肽有至少80%同源性，
[0025]ii)为所述多肽的等位基因变体，
[0026]c)由核酸序列编码的多肽，所述核酸序列与编码成熟多肽的SEQ ID NO:2的核酸序列互补链或其至少100个核苷酸的亚序列在高严紧条件下杂交。
[0027]3.一种阿拉伯糖呋喃糖苷酶，其为:
[0028]a)具有SEQ ID N0:4所示成熟肽氨基酸序列的多肽，或者能够从其通过取代、缺失和/或插入一个或多个氨基酸而获得的多肽；
[0029]b)⑴或(ii)中定义的多肽类似物，其
[0030]i)与所述多肽有至少60%同源性，
[0031]ii)为所述多肽的等位基因变体，
[0032]c)由核酸序列编码的多肽，所述核酸序列与编码成熟多肽的SEQ ID NO:2的核酸序列的互补链或其至少100个核苷酸的亚序列在高严紧条件下杂交。
[0033]4.项1-3中任一项所述的阿拉伯糖呋喃糖苷酶，其对于腐质霉属菌株，优选特异腐质霉，或者多孔菌属菌株，优选巨多孔菌是天然的。
[0034]5.核酸序列，其包含编码项1-4任一项所述的阿拉伯糖呋喃糖苷酶的核酸序列。
[0035]6.核酸序列，其包括:
[0036]a)DNA序列，其编码SEQ ID N0:2和SEQ ID NO:4所示任一阿拉伯糖呋喃糖苷酶，
[0037]b) DNA序列类似物，其
[0038]i)与任一所述DNA序列具有至少80%同源性，或
[0039]ii)与所述DNA序列互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交；
[0040]iii)为其等位基因变体，或
[0041]c) a)或b)的互补链。
[0042]7.项6所述的核酸序列，其中多肽为含下列氨基酸序列的人工变体，所述氨基酸序列相对SEQ ID NO: 2的氨基酸1-558，有一处或多处截短，和/或氨基酸的至少一个取代、缺失和/或插入。
[0043]8.核酸序列，其与SEQ ID NO:1和SEQ ID NO: 3任一所示DNA序列具有至少80%同源性，或者
[0044]a)与任一所述DNA序列的互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交，
[0045]b)为其等位基因变体，或
[0046]c) a)或b)的互补链。
[0047]9.项8所述的核酸序列，其中多肽为含下列氨基酸序列的人工变体，所述氨基酸序列相对SEQ ID NO:4的氨基酸1-643，有一处或多处截短，和/或氨基酸的至少一个取代、缺失和/或插入。
[0048]10.一种核酸构建体,其包含项5-9任一的核酸序列,所述核酸序列与在合适表达宿主中能指导阿拉伯糖呋喃糖苷酶表达的一种或多种调控序列可操作地连接。
[0049]11.包含项10的核酸构建体的重组表达载体。
[0050]12.包含项11的表达载体的重组宿主细胞。
[0051]13.产生阿拉伯糖呋喃糖苷酶的方法，其包括在利于产生阿拉伯糖呋喃糖苷酶的条件下培养项12的宿主细胞,和回收阿拉伯糖呋喃糖苷酶。
[0052]14.包含根据项1-4中任一项的阿拉伯糖呋喃糖苷酶的组合物。
[0053]15.根据项1-4中任一项的阿拉伯糖呋喃糖苷酶在生面团中的用途。
[0054]16.根据项1-4中任一项的阿拉伯糖呋喃糖苷酶在乙醇工艺中的用途。
[0055]17.根据项1-4中任一项的阿拉伯糖呋喃糖苷酶在糖化工艺中的用途。
[0056]18.根据项1-4中任一项的阿拉伯糖呋喃糖苷酶在生产饲料产品的工艺中的用途。
[0057]附图简述
[0058]图1A-C显示了阿拉伯糖木聚糖聚合物。
[0059]图1A显示了完整的阿拉伯糖木聚糖。 [0060]图1B显示了双取代的阿拉伯糖木聚糖。
[0061]图1C显示了单取代的阿拉伯糖木聚糖。
[0062]图2A-C 显不了阿拉伯糖木糖寡糖(arabinoxylo-oligosaccharides)。
[0063]图2A显示了连接于内部C-3上的阿拉伯糖基。
[0064]图2B显示了连接于末端C-3上的阿拉伯糖基。
[0065]图2C显示了连接于内部C-2上的阿拉伯糖基。
[0066]发明详述
[0067]在本发明第二方面的【具体实施方式】中，分离多肽具有的氨基酸序列与SEQ IDNO: 2的氨基酸1-558所示氨基酸序列有至少80%同一性。在本发明感兴趣的【具体实施方式】中，多肽与SEQ ID NO: 2的氨基酸1-558所示氨基酸序列有至少75%，至少85%，至少90%，至少95%，至少96%，至少97%，至少98%，或至少99%同一性。
[0068]在本发明第三方面【具体实施方式】中，分离多肽具有的氨基酸序列与SEQ ID N0:4的氨基酸1-643所示氨基酸序列有至少50%同一性。在本发明感兴趣的【具体实施方式】中，多肽与SEQ ID NO: 4的氨基酸1-643所示氨基酸序列有至少60%，至少70%，至少80%，至少85%,至少90%，至少95%，至少96%，至少97%，至少98%，或至少99%同一性。
[0069]在优选【具体实施方式】中，分离多肽具有的氨基酸序列与SEQ ID N0:2的氨基酸1-558和SEQ ID N0:4的氨基酸1-643所示任一氨基酸序列，相差五个氨基酸，例如相差四个氨基酸，如相差三个氨基酸，相差两个氨基酸，或相差一个氨基酸。
[0070]在本发明第二方面【具体实施方式】中，分离多肽是能从双取代的木糖释放阿拉伯糖的a -L-阿拉伯糖呋喃糖苷酶，例如，所述a -L-阿拉伯糖呋喃糖苷酶对具有连接于C2和C3的阿拉伯糖的小麦阿拉伯糖木聚糖的木糖单元有活性。
[0071]序列比对和同源性计算可通过本领域已知的计算机程序，例如GCG程序包中所提供的 GAP 来适当确定(Program Manual for the Wisconsin Package, Version8, Augustl994,Genetics Computer Group,575Science Drive, Madison, Wisconsin, USA53711)(Needleman, S.B.和Wunsch, C.D.，(1970), Journal of Molecular Biology, 48，443-453)。氨基酸序列比较采用下列设定:GAP产生罚分(GAP creation penalty) 3.0, GAP延伸罚分0.1。用于同源性测定的氨基酸序列相关部分为成熟多肽，即不含信号肽。
[0072]优选地，本发明多肽包含SEQ ID NO: 2的氨基酸1-558和SEQ ID NO: 4的氨基酸1-643所示的任一氨基酸序列，其等位基因变体，或其有阿拉伯糖呋喃糖苷酶活性的片段。很显然，本发明多肽也可以由SEQ ID NO: 2的氨基酸1-558和SEQ ID NO: 4的氨基酸1-643所示任一氨基酸序列组成。
[0073]等位基因变体意味着占据相同染色体基因座的基因的任意两种或多种可选形式。等位基因变体通过突变天然产生，并且可导致群体内的多态性。基因突变可以是沉默突变(编码多肽没有改变)，也可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位变体所编码的多肽。
[0074]在本发明【具体实施方式】中，分离多肽由下列核酸序列编码，所述核酸序列在低严紧条件下，优选在中严紧条件下，更优选在高严紧条件下与(i)SEQID N0:1的核苷酸1-1677和SEQ ID NO: 3的核苷酸46-1974所示任一核酸序列的互补链，或(ii)至少100个核苷酸的(i)的亚序列杂交(J.Sambrook, E.F.Fritsch 和 T.Maniatus, 1989, MolecularCloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York)。
[0075]SEQ ID NO:1的核苷酸1-1677和SEQ ID NO: 3的核苷酸46-1974所示任一核酸序列互补链的亚序列，可为至少100个核苷酸或优选至少200个核苷酸。此外，亚序列应该编码具有阿拉伯糖呋喃糖苷酶活性的多肽片段。多肽也可以是具有阿拉伯糖呋喃糖苷酶活性的多肽的等位基因变体或片段。
[0076]多肽变体具体包含一个或多个氨基酸的取代、缺失和/或插入。在特定【具体实施方式】中，多肽是具体多肽的热稳定变体。
[0077]变体多肽的氨基酸序列可与SEQ ID NO:2的氨基酸1-558或SEQ ID N0:4的氨基酸1-643的具体氨基酸序列，因插入或缺失一个或多个氨基酸残基和/或用不同氨基酸残基取代一个或多个氨基酸残基而不同。优选地，氨基酸改变是次要特性的改变，即不显著影响蛋白折叠和/或活性的保守氨基酸取代；小的缺失，通常是I至约30个氨基酸；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至约20-25残基的小接头肽；或者通过改变净电荷或其它功能有利于纯化的小延伸，例如聚组氨酸簇(poly-histidine tract)、抗原表位或结合域。
[0078]保守取代的实例是下列组内的取代:碱性氨基酸组(精氨酸，赖氨酸和组氨酸)，酸性氨基酸组(谷氨酸和天冬氨酸)，极性氨基酸组(谷氨酰氨和天冬酰氨)，疏水性氨基酸组(亮氨酸，异亮氨酸和缬氨酸)，芳香氨基酸组(苯丙氨酸，色氨酸和酪氨酸)以及小氨基酸组(甘氨酸，丙氨酸，丝氨酸，苏氨酸和甲硫氨酸)。通常不改变特异活性(specific activity)的氨基酸取代是本领域已知的，并例如由H.Neurath andR.L.Hill, 1979, In, The Proteins, Academic Press, New York 描述。最通常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/Ile, Leu/Val, Ala/Glu 和 Asp/Gly 及它们反过来交换。
[0079]本文所指多肽可以包含指定的氨基酸序列，或者它们也可以是其等位基因变体；或其具有相关酶活性的片段。在一个【具体实施方式】中，多肽包含指定的氨基酸序列或其等位基因变体；或其具有相关酶活性的片段。在另一【具体实施方式】中，多肽由指定的氨基酸序列或其等位基因变体或其具有相关酶活性的片段所组成。
[0080]指定的氨基酸序列片段是从该氨基酸序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽。在一个【具体实施方式】中，所述片段包含至少60个氨基酸残基，或至少68个，或至少70个，或至少75个，或至少100个，或至少150个，或至少160个，或至少170个，或至少180个，或至少190个，或至少200个，或至少210个，或至少220个，或至少240个，或至少260个，或至少280个，或至少300个，或至少310个，或至少320个，或至少330个，或至少334个，或至少350个，或至少375个，或至少400个，或至少425个，或至少430个氨基酸残基。
[0081]等位基因变体意味着占据相同染色体基因座的基因的任意两种或多种可选形式。等位基因变体通过突变自然产生，并且可导致群体内的多态性。基因突变可以是沉默突变(编码多肽没有改变)，也可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位变体所编码的多肽。
[0082]成熟多肽或成熟氨基酸序列是指将潜在信号肽部分切去后剩下的那部分氨基酸序列。类似地，基因的成熟多肽编码部分是指相应于成熟多肽的那部分基因。
[0083]SEQ ID NO:1和SEQ ID NO:3任一的核酸序列或其亚序列，以及SEQ ID N0:2和SEQ ID N0:4任一的氨基酸序列或其片段，可用于按照本领域已知方法设计核酸探针，以从不同属或种的菌株鉴定和克隆DNA，所述DNA编码具有阿拉伯糖呋喃糖苷酶活性的多肽。特别地，这些探针能够用于根据标准Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交，以鉴定和分离其中的相应基因。这些探针可比全长序列短许多，但其长度应当是至少15，优选至少25，更优选至少35个核苷酸。也可以使用较长探针。DNA和RNA探针均可使用。通常将探针标记以检测相应基因(例如32P，3H，35S，生物素，或抗生物素蛋白)。这些探针包括在本发明中。
[0084]因此，从其它类似生物体制备的基因组DNA或cDNA文库，可用于筛选与上述探针杂交并且编码具有阿拉伯糖呋喃糖苷酶活性的多肽的DNA。这些其它生物体的基因组或其它DNA，可以通过琼脂糖或聚丙烯酰氨凝胶电泳分离，或通过本领域技术人员已知的其它分离技术分离。可将来自文库的DNA或分离DNA转移到并固定至硝化纤维素或其它合适载体材料上。为了鉴定与SEQ ID NO:1或SEQ ID NO: 3或其亚序列同源的克隆或DNA，将载体材料用于Southern印迹。就本发明而言，杂交显示核酸序列与SEQ ID NO:1和SEQ ID N0:3、其互补链或其亚序列任一所示核酸序列相应的标记核酸探针在低至高严紧条件下杂交。在这些条件下与核酸探针杂交的分子用X-射线片来检测。
[0085]在另一感兴趣【具体实施方式】中，核酸探针是编码SEQ ID N0:2和SEQ ID N0:4任一的(成熟)多肽，或其亚序列的核酸序列。在第三感兴趣的【具体实施方式】中，核酸探针是SEQ ID NO:1和SEQ ID NO: 3中的任意一个。在第四感兴趣的【具体实施方式】中，核酸探针是SEQ ID NO:1和SEQ ID NO: 3成熟多肽编码区中的任意一个。
[0086]对于长度至少100个核苷酸的长探针，将低严紧性条件至高严紧性条件定义为，在42°C，在5XSSPE、0.3%SDS、200 μ g/ml已剪切和变性的鲑精DNA，对于低严紧性25%甲酰胺，对于中严紧性35%甲酰胺，或对于高严紧性50%甲酰胺中，根据标准的Southern印迹方法进行预杂交和杂交。[0087]对于长度至少100个核苷酸的长探针，将载体材料最终用2XSSC，0.2%SDS，优选至少在50°C (低严紧性)，更优选至少在55°C (中严紧性)，甚至更优选至少在65°C (高严紧性)洗涤三次，每次15分钟。
[0088]对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严紧性条件定义为在比用 Bolton 和 McCarthy 的计算法(1962, Proceedings of the National Academy ofSciences USA48:1390)计算得出的 T1Jg 5°C至 10°C，在 0.9MNaCl，0.09M Tris-HCl ρΗ7.6，6mM EDTA, 0.5%NP-40,1 X 登哈特溶液(Denhardt，s solution), ImM 焦憐酸钠(sodiumpyrophosphate), ImM憐酸二氢钠(sodium monobasic phosphate) ,0.1mM ATP和每ml0.2mg的酵母RNA中，根据标准的Southern印迹方法进行预杂交、杂交和杂交后洗漆(washingpost-hybridization)。
[0089]对于长度大约15个核苷酸至大约70个核苷酸的短探针，将载体材料在6 X SSC加0.1%SDS中洗涤一次15分钟，并用6 X SSC在低于计算的Tm5°C至10°C洗涤两次，每次15分钟。
[0090]如上所述，本发明多肽可以是具有SEQ ID N0:2和SEQ ID N0:4任一氨基酸序列的多肽，或其成熟多肽，其中一个或多个氨基酸被另一(其它)氨基酸所取代，其中一个或多个氨基酸缺失，和/或其中一个或多个氨基酸插入。
[0091]优选地，氨基酸改变是次要特性的改变，即不显著影响蛋白折叠和/或活性的保守氨基酸取代；小的缺失，通常为I至约30个氨基酸；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至约20-25残基的小接头肽；或者通过改变净电荷或其它功能而有利于纯化的小延伸，例如聚组氨酸簇、抗原表位或结合域。
[0092]保守取代的实例是下列组内的取代:碱性氨基酸组(精氨酸，赖氨酸和组氨酸)，酸性氨基酸组(谷氨酸和天冬氨酸)，极性氨基酸组(谷氨酰氨和天冬酰氨)，疏水性氨基酸组(亮氨酸，异亮氨酸和缬氨酸)，芳香氨基酸组(苯丙氨酸，色氨酸和酪氨酸)以及小氨基酸组(甘氨酸，丙氨酸，丝氨酸，苏氨酸和甲硫氨酸)。通常不改变特异活性的氨基酸取代是本领域已知的，并例如由 H.Neurath and R.L.Hill, 1979, In, The Proteins, AcademicPress, New York 描述。最通常发生的交换是 Ala/Ser, Val/Ile, Asp/Glu, Thr/Ser, Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/He, Leu/Val, Ala/Glu和Asp/Gly及它们反过来交换。
[0093]通常而言，优选本发明多肽具有的阿拉伯糖呋喃糖苷酶活性是具有SEQ ID NO:2的氨基酸1-558和SEQ ID N0:4的氨基酸1_643任一所示氨基酸序列的多肽的至少20%。特别优选的多肽具有的阿拉伯糖呋喃糖苷酶活性是具有SEQ ID NO:2的氨基酸1-558和SEQID NO: 4的氨基酸1-643所示任一氨基酸序列的多肽的至少30%，例如至少40%，例如至少50%，优选至少60%，如至少70%，例如至少80%，更优选至少90%，或至少95%。
[0094]本发明多肽可从任何属的微生物得到。就本发明而言，本文所用术语“从…中得到 ”连同给出的来源，可指由核酸序列编码的多肽通过所述来源或通过细胞产生，其中所述细胞已经插入来自所述来源的核酸序列。在优选的实施方案中，多肽是分泌到细胞外的。
[0095]本发明多肽可为真菌多肽，更优选丝状真菌多肽，例如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、丝梗霉属(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉抱菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂殖菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多妝。
[0096]在另一优选实施方案中，多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、杆抱状德抱(Fusarium bactridioides)、禾谷德抱(Fusariumcerealis)、库威德抱(Fusarium crookwellense)、大刀德抱(Fusarium culmorum)、禾本科德抱(Fusarium graminearum)、禾赤德抱(Fusarium graminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusarium negundi)、尖抱德抱(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色德抱(Fusarium sarcochroum)、拟分枝抱德抱(Fusariumsporotrichioides)、硫色德抱(Fusarium sulphureum)、圆德抱(Fusarium torulosum)、拟丝抱德抱(Fusarium trichothecioides)、壤片德抱(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、巨多孔菌(Meripilusgiganteus)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糖脉抱菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma1ngibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)多肽。
[0097]在本发明优选的实施方案中，本发明多肽源自子囊菌门(Ascomycota)菌株，例如腐质霉属(Humicol a)，如疏棉状腐质霉、棕黑腐质霉(H.fuscoatra)、灰色腐质霉(H.grisea)、藤黄腐质霉(H.1utea)、黑腐质霉(H.nigrescens)、以及特别是特异腐质霉，或者是源自担子菌门(Basidiomycota)菌株，例如多孔菌属(Meripilus)，如巨多孔菌。
[0098]可以理解，对于上述菌种，本发明包括其完全阶段和不完全阶段以及其他分类学上的等同物，例如无性型，而不管它们的已知种名。本领域的技术人员将容易地辨别适当等同物的同一性。
[0099]这些菌种的菌株容易地被公众在许多培养物保藏中心获得，诸如美国典型培养物保藏中心(the American Type Culture Collection) (ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH) (DSM)、荷兰微生物保藏中心(Centraalbureau Voor Schimmelcultures) (CBS)和美国农业研究菌种保藏中心(Agricultural Research Service Patent Culture Collection, NorthernRegional Research Center)(NRRL)。
[0100]在本发明特别优选实施方式中，本发明多肽源自W09117243中所记载的特异腐质霉菌株，其根据布达佩斯条约规定于1980年4月14日以DSM号1800保藏于德国微生物和细胞培养物保藏中心(DSM，Deutsche Sammlung von Mikroorganismen undZellkulturen) Gdttingeru德国。[0101]在本发明第二特别优选的实施方式中，本发明多肽源自巨多孔菌特定菌株，该菌株在荷兰微生物保藏中心(CBS)，Uppsalalaan8, 3584CT Utrecht, The Netherlands (或者，P.0.Box85167, 3508AD Utrecht, The Netherlands)具有登录号 CBS521.95。
[0102]此外，用上述探针可从其它资源，包括从自然界(例如土壤、堆肥、水等)分离的微生物来鉴定和获得这些多肽。从自然环境分离微生物的技术是本领域众所周知的。然后通过类似地筛选其它微生物基因组或cDNA文库来获得核酸序列。一旦用探针检测到编码多肽的核酸序列，该序列就可用本领域普通技术人员已知的技术分离或克隆(参见例如，Sambrook 等，1989，见前文)。
[0103]由本发明核酸序列编码的多肽也包括另一多肽融合在该多肽或其片段N-末端或C-末端的融合多肽或可切割融合多肽。融合多肽可通过将编码另一多肽的核酸序列(或其部分)融合于本发明核酸序列(或其部分)来制备。制备融合多肽的技术是本领域已知的，包括将编码多肽的编码序列连接以使它们位于框中，并且使融合多肽的表达在相同启动子和终止子的控制下。
[0104]核酸序列
[0105]本发明也涉及编码本发明多肽的分离核酸序列。
[0106]在一个感兴趣的实施方式中，核酸序列与SEQ ID NO:1的核苷酸1-1677和SEQ IDNO: 3的核苷酸46-1974所不任一核酸序列有至少80%同一性。优选地,核酸序列与SEQ IDNO:1的核苷酸1-1677和SEQ ID NO: 3的核苷酸46-1974所示任一核酸序列有至少至少85%,至少90%，至少95%，至少96%，至少97%，至少98%，或至少99%同一性。在本发明另一感兴趣的实施方式中，核酸序列包含SEQ ID NO:1的核苷酸1-1677所示氨基酸序列，其等位基因变体，或其能编码本发明多肽的片段中的任何一种。显然，核酸序列可由SEQ ID NO:1的核苷酸1-1677和SEQ ID NO: 3的核苷酸46-1974所示的任一氨基酸序列所组成。
[0107]本发明也包括核酸序列，其编码具有SEQ ID NO: 2或SEQ ID NO:4任一氨基酸序列的多肽或其成熟多肽，由于遗传密码简并性，所述核酸序列不同于SEQ ID N0:1或SEQ IDNO: 3序列。本发明也涉及SEQ ID NO:1或SEQ ID NO: 3的亚序列，所述亚序列编码SEQ IDN0:2或SEQ ID N0:4具有阿拉伯糖呋喃糖苷酶活性的片段。SEQ ID NO:1或SEQ ID NO:3的亚序列是SEQ ID NO:1的核苷酸1-1677或SEQ ID NO: 3的核苷酸46-1974包含的核酸序列，只是从5’和/或3’端缺失一个或多个核苷酸。
[0108]本发明也涉及编码本发明多肽的分离核酸序列，所述核酸序列在低严紧条件下，优选在中严紧条件下，更优选在高严紧条件下，与(i) SEQ ID NO:1核苷酸1-1677和SEQ IDN0:3的核苷酸46-1974所示任一核酸序列的互补链，或(ii) (i)的至少100个核苷酸的亚序列杂交。本发明也涉及(i)和(ii)的互补链。
[0109]用于分离或克隆编码多肽的核酸序列的技术是本领域已知的，包括从基因组DNA分离、从cDNA制备或两者组合。将本发明核酸序列从这种基因组DNA克隆，可能通过例如使用熟知的聚合酶链式反应(PCR)或筛选表达文库的抗体以检测具有共有结构特征的克隆DNA片段的来实现。参见，例如，Innis等，1990，PCR:A Guide to Methods andApplication, Academic Press, New York。也可使用其它核酸扩增法,例如连接酶链式反应(ligase chain reaction, LCR),连接激活转录(ligated activated transcription, LAT)和基于核酸序列的扩增(nucleic acid sequence-based amplification, NASBA)。核酸序列可从特异腐质霉菌株或巨多孔菌菌株，或者其它或相关生物体克隆，例如，可以是该核酸序列多肽编码区的等位基因变体或种属变体(species variant)。
[0110]分离核酸序列，例如能够通过在遗传工程中使用的标准克隆方法获得，该方法将核酸序列从其天然位置重新定位至将其再生的不同位点。该克隆方法可涉及将包含编码多肽的核酸序列的期望核酸片段剪切和分离，将所述片段插入至载体分子，以及将重组载体整合至其中核酸序列的多拷贝或克隆将会复制的宿主细胞。核酸序列可以是基因组，CDNA，RNA,半合成，或合成来源的，或它们的任意组合。
[0111]就本发明而言，两核酸序列之间的同一性程度如上所述确定。
[0112]对于合成与所述多肽基本相似的多肽而言，修饰本发明多肽的编码核酸序列是必需的。术语与所述多肽“基本相似”是指多肽的非天然存在形式。这些多肽可与从天然来源分离的多肽在某些工程方式上不同，例如在比活、热稳定性、最适PH等方面不同的变体。变体序列可基于SEQ ID N0:1多肽编码部分所示核酸序列，例如其亚序列来构建，和/或通过引入核苷酸取代来构建，所述核苷酸取代不产生由核酸序列编码多肽的其它氨基酸序列，但符合用于产生所述酶的宿主生物体的密码子选择，或通过引入可产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的概括描述，参见例如Ford等，1991，ProteinExpression and Purification2:95-107。
[0113]本领域技术人员显而易见，这些取代可在分子功能的关键区外进行而仍将产生活性多肽。对于由本发明的分离核酸序列编码的多肽活性必需的氨基酸残基(因此优选不对所述残基进行取代)，可通过本领域已知方法来鉴定，例如定位诱变或丙氨酸分区诱变(参见例如，Cunningham 和 Wells, 1989，Science244:1081-1085)。在后一技术中，在分子中每个带正电荷的残基处引入突变，然后测试所得突变分子的阿拉伯糖呋喃糖苷酶活性以鉴定对于所述分子活性关键的氨基酸残基。底物-酶相互作用的位点也可通过三维结构分析来确定，例如通过诸如核磁共振分析、结晶学或光亲和标记技术来确定(参见例如，deVos 等，1992，Science255:306-312; Smith 等，1992，Journal of MolecularBiology224:899-904;Wlodaver 等，1992，FEBS Letters309:59-64)。
[0114]核酸构建体
[0115]本发明也涉及包含本发明核酸序列的核酸构建体，所述本发明核酸序列与一个或多个调控序列可操作连接，所述调控序列能指导所述多肽在合适宿主细胞中的表达。
[0116]可以各种方式操作编码本发明多肽的分离核酸序列以提供所述多肽的表达。核酸序列插入载体之前的操作可能是期望的或必需的，这取决于表达载体。用重组DNA方法修饰核酸序列的技术是本领域众所周知的。
[0117]调控序列包括对本发明多肽表达必需或有益的所有元件。每一调控序列对于编码多肽的核酸序列可以是天然或异源的。这样的调控序列包括，但不限于前导序列，聚腺苷酸化序列，前肽序列，启动子，信号肽序列，和转录终止子。最低限度，调控序列包括启动子，以及转录和翻译的终止信号。调控序列可与接头一起提供，以引入有利于调控序列与编码多肽的核酸序列编码区连接的特定限制位点。
[0118]调控序列可以是合适的启动子序列一被宿主细胞识别用于核酸序列表达的核酸序列。启动子序列包含介导多肽表达的转录调控序列。启动子可以是在所选择宿主细胞中显示转录活性的任何核酸序列，包括突变、截短和杂合启动子，并可获自与宿主细胞同源或异源的编码胞外或胞内多肽的基因。
[0119]指导本发明核酸构建体转录，特别是在细菌宿主细胞中转录的合适启动子的实例，为获自大肠杆菌(E.coli) Iac操纵子，天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)，枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)，地衣芽抱杆菌(Bacillus licheniformis) α -淀粉酶基因(amyL)，嗜热脂肪芽抱杆菌(Bacillusstearothermophi lus)产麦芽糖淀粉酶基因(amyM)，解淀粉芽孢杆菌(Bacillusamyloliquefaciens) α -淀粉酶基因(amyQ)，地衣芽孢杆菌青霉素酶基因(penP)，枯草芽孢杆菌xyIA和xyIB基因，和原核β _内酰胺酶基因的启动子(Vi Ila-Kamaroff等，1978，Proceedings of the National Academy of Sciences USA75:3727-3731)，以及 tac 启动子(DeBoer 等，1983，Proceedings of the National Academy of SciencesUSA80:21-25) o 更多的启动子在〃Useful proteins from recombinant bacteria〃inScientific American, 1980，242:74-94 且在 Sambrook 等，1989，见前文，中有记载。
[0120]指导本发明核酸构建体在丝状真菌宿主细胞中转录的合适启动子实例，为获自下列酶的基因的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、和尖孢镰孢胰蛋白酶样蛋白酶(W096/00787)，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的杂合启动子)；及其突变、截短和杂合的启动子。
[0121]在酵母宿主中，有用的启动子从下列酶的基因中得到:酿酒酵母(Saccharomycescerevisiae)稀醇酶(enolase) (ENO-1)、酿酒酵母半乳糖激酶(galactokinase)(GALl)、酿酒酵母醇脱氢酶(alcohol dehydrogenase) /3-磷酸甘油醒脱氢酶(glyceraldehyde-3-phosphate dehydrogenase) (ADH2/GAP)、和酿酒酵母 3_ 憐酸甘油酸激酶(3-phosphoglycerate kinase)。酵母宿主细胞的其他有用的启动子在Romanos等，1992，Yeast8:423-488 中描述。
[0122]所述调控序列也可为合适的转录终止序列，即由宿主细胞识别以终止转录的序列。所述终止序列可操作地与编码多肽的核酸序列3’端连接。任何在所选宿主细胞中有功能的终止子都可用于本发明。
[0123]丝状真菌宿主细胞的优选终止子得自如下酶的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶(anthranilate synthase)、黑曲霉α -葡萄糖苷酶(alpha-glucosidase)和尖孢镰孢胰蛋白酶样蛋白酶。
[0124]对于酵母宿主细胞优选的终止子得自如下酶的基因:酿酒酵母烯醇酶、酿酒酵母细胞色素C (cytochrome C) (CYCl)和酿酒酵母3_磷酸甘油醛脱氢酶。酵母宿主细胞的其他有用终止子在前述Romanos等，1992中描述。
[0125]所述调控序列也可为合适的前导序列，即对宿主细胞翻译重要的mRNA非翻译区。所述前导序列可操作地与编码多肽的核酸序列5’端连接。任何在所选宿主细胞中有功能的前导序列都可用于本发明。
[0126]对于丝状真菌宿主细胞优选的前导序列得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。[0127]对于酵母宿主细胞合适的前导序列得自如下酶的基因:酿酒酵母烯醇酶(EN0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α -因子和酿酒酵母醇脱氢酶/3-磷酸甘油醛脱氢酶(ADH2/GAP)。
[0128]所述调控序列也可为聚腺苷酸化序列，即可操作地与核酸序列3’端连接的序列，而且在转录时，其被宿主细胞识别为将聚腺苷残基添加于转录mRNA的信号。任何在所选宿主细胞中有功能的聚腺苷酸化序列都可用于本发明。
[0129]对于丝状真菌宿主细胞优选的聚腺苷酸化序列得自如下酶的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶。
[0130]对于酵母宿主细胞有用的聚腺苷酸化序列在Guo和Sherman, 1995, MolecularCellular Biologyl5:5983-5990 中描述。
[0131]所述调控序列也可为信号肽编码区，所述信号肽编码区编码与多肽氨基末端连接的氨基酸序列，并且指导所编码的多肽进入细胞的分泌途径。所述核酸序列的编码序列5’端，可固有包含信号肽编码区，所述信号肽编码区与编码分泌多肽的编码区的区段以符合翻译可读框的方式天然连接。可替换地，编码序列5’端可包含编码序列外源的信号肽编码区。当编码序列天然不含信号肽编码区时，可能需要外源信号肽编码区。可替换地，外源信号肽编码区可简单替换天然信号肽编码区，以增强多肽的分泌。然而，任何指导表达多肽进入所选宿主细胞分泌途径的信号肽编码区都可用于本发明。
[0132]对于细菌宿主细胞有效的信号肽编码区是得自如下酶的基因的信号肽编码区:芽孢杆菌属(Bacillus) NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶基因(nprT, nprS, nprM)和枯草芽孢杆菌prsA。更多的信号肽由Simonen和Palva, 1993, Microbiological Reviews57:109-137 描述。
[0133]对于丝状真菌宿主细胞有效的信号肽编码区是得自如下酶的基因的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶和疏棉状腐质霉脂肪酶。
[0134]对于酵母宿主细胞有用的信号肽得自酿酒酵母α-因子(alpha-factor)和酿酒酵母转化酶(invertase)的基因。其他有用的信号肽编码区由Romanos等，1992描述,见前文。
[0135]所述调控序列也可为前肽编码区，所述前肽编码区编码位于多肽氨基末端的氨基酸序列。所得多肽称为前酶(proenzyme)或前多肽(propolypeptide)(或有些情况下称为酶原(zymogen))。前多肽通常是无活性的，并可通过从前多肽催化或自催化切割前肽来转化为成熟活性多肽。前肽编码区可得自如下酶的基因:枯草芽孢杆菌碱性蛋白酶(aprE)，枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(Iaccase) (W095/33836)。
[0136]当信号肽区和前肽区都存在于多肽氨基末端时，前肽区位于紧接着多肽的氨基末端，而信号肽区位于紧接着前肽区的氨基末端。
[0137]可能也期望添加允许调节与宿主细胞生长相关的多肽表达的调节序列。调节系统的实例是那些响应化学或物理刺激，包括在调节化合物存在的情况下，使所述基因表达开启或关闭的调节系统。在原核系统中，调节系统包括lac, tac,和trpf呆纵基因系统。在酵母中，可采用ADH2系统或GALl系统。在丝状真菌中，TAKA α -淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可用作调节序列。调节序列的其他实例是那些允许基因扩增的调节序列。在真核系统中，这些包括在甲氨喋呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和在重金属存在下扩增的金属硫蛋白(metallothionein)基因。在这些情况下，编码多肽的核酸序列可操作地与调节序列连接。
[0138]表达载体
[0139]本发明也涉及包含本发明核酸序列、启动子以及转录和翻译终止信号的重组表达载体。可将上述多种核酸和调控序列连接在一起以产生重组表达载体，所述重组表达载体可包括一个或多个方便的限制酶切位点，以允许编码多肽的核酸序列在这些位点上的插入或取代。可替换地，本发明核酸序列可通过将所述核酸序列或含该序列的核酸构建体插入至合适的表达载体来进行表达。在构建所述表达载体的过程中，编码序列位于所述载体中以使编码序列与合适的表达调控序列可操作地连接。
[0140]重组表达载体可为能够方便地进行重组DNA方法并且能够使核酸序列表达的任何载体(例如，质粒或病毒)。载体的选择通常取决于载体与该载体将导入的宿主细胞之间的相容性。载体可为线性或闭合环状质粒。
[0141]载体可为自主复制载体，即作为染色体外实体存在、其复制不依赖于染色体复制的载体，例如质粒、染色体外元件(element)、微型染色体(minichromosome)或人工染色体。载体可包含确保自复制的任何元件。可替换地，载体是当其导入宿主细胞时，其整合入基因组并与所整合染色体一起复制的载体。此外，可采用单载体或质粒，或者两个或更多个载体或质粒，或者转座子(transposon),所述两个或更多个载体或质粒一起含有待导入宿主细胞基因组的总DNA。
[0142]本发明载体优选包含一个或多个允许容易选择转化细胞的可选择标记。可选择标记为基因，该基因的产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养等。细菌选择标记的实例为来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性，例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。对于酵母宿主细胞合适的标记为ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于丝状真菌宿主细胞的可选择标记，包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶(ornithine carbamoyltransferase)) > bar (勝丝菌素乙酉先基转移酶(phosphinothricinacetyltransferase))、hygB (潮霉素憐酸转移酶(hygromycin phosphotransferase))、niaD(硝酸盐还原酶(nitrate reductase))、pyrG(乳清酸核苷_5’ -磷酸脱羧酶(orotidine-5’-phosphate decarboxylase))、 sC(硫酸腺苷酸基转移酶(sulfateadenyltransf erase))、trpC(邻氨基苯甲酸合酶)，以及其等同物。优选用于曲霉属细胞的标记是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)的 bar 基因。
[0143]本发明载体优选含有元件，所述元件允许载体稳定整合入宿主细胞基因组或允许所述载体在细胞中独立于基因组自主复制。
[0144]为了整合入宿主细胞基因组，载体可依赖于编码多肽的核酸序列或通过同源或非同源重组将载体稳定整合至基因组的任何其它载体元件。可替换地，所述载体可包含指导通过同源重组整合入宿主细胞基因组的额外核酸序列。所述额外核酸序列使载体能在染色体精确位置整合入宿主细胞基因组。为了提高精确位置整合可能性，整合元件应优选含有足够数量的核酸，如100-1，500个碱基对，优选400-1，500个碱基对，最优选800-1，500个碱基对，所述核酸与相应靶序列高度同源，以增加同源重组的可能性。整合元件可以为与宿主细胞基因组中靶序列同源的任何序列。
[0145]此外，整合元件可为非编码或编码核酸序列。另一方面，载体可通过非同源重组整合入宿主细胞的基因组。
[0146]为了自我复制，载体可进一步包含使载体能在所述宿主细胞中自主复制的复制起点。细菌复制起点的实例为允许在大肠杆菌中复制的质粒PBR322，pUC19, pACYCl77，和PACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110，pE194，pTA1060，和pAM?l的复制起点。酵母宿主细胞中使用的复制起点实例为2micron复制起点、ARS1、ARS4、ARSl与CEN3的组合、以及ARS4与CEN6的组合。复制起点可为具有突变的复制起点，所述突变使其功能在宿主细胞中是温度敏感的(参见例如，Ehrlich, 1978，Proceedings of theNational Academy of Sciences USA75:1433)。
[0147]可将多于一个拷贝的本发明核酸序列插入宿主细胞以增加基因产物的产生。核酸序列拷贝数的增加可通过将序列的至少一个额外拷贝整合入宿主细胞基因组而获得，或者通过将带有核酸序列的可扩增选择标记基因包括在其中而获得，其中含有选择标记基因的扩增拷贝的细胞(并因而核酸序列的额外拷贝)，可在合适的选择剂存在下通过培养细胞来选择。
[0148]用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员所熟知的(参见例如，Sambrook等，1 989，见前文)。
[0149]宿主细胞
[0150]本发明也涉及包含本发明核酸序列的重组宿主细胞，所述重组宿主细胞可有利地用于多肽的重组生产。
[0151]将包含本发明核酸序列的载体引入宿主细胞，以使所述载体作为染色体整合体保留，或作为自复制的染色体外载体保留，如前文所述。宿主细胞的选择在很大程度上取决于编码所述多肽的基因及其来源。
[0152]宿主细胞可为单细胞微生物，例如原核生物，或非单细胞微生物，例如真核生物。
[0153]有用的单细胞为细菌细胞，例如革兰氏阳性细菌，包括但不限于芽孢杆菌属细胞，例如嗜碱芽孢杆菌(Bacillus alkalophilus)，解淀粉芽孢杆菌，短芽孢杆菌(Bacillusbrevis),环状芽胞杆菌(Bacillus circulans),克劳氏芽抱杆菌(Bacillus clausii),凝结芽孢杆菌(Bacillus coagulans),灿烂芽孢杆菌(Bacillus lautus),迟缓芽孢杆菌(Bacillus lentus),地衣芽抱杆菌(Bacillus licheniformis),巨大芽抱杆菌(Bacillusmegaterium),嗜热脂肪芽抱杆菌(Bacillus stearothermophi lus),枯草芽抱杆菌(Bacillus subtilis),和苏云金芽抱杆菌(Bacillus thuringiensis);或者链霉菌属细胞，例如浅青紫链霉菌(Streptomyces Iividans)或鼠灰链霉菌(Streptomyces murinus)；或者革兰氏阴性细菌，例如大肠杆菌和假单胞菌属菌种(Pseudomonas sp.)。在优选的实施方式中，细菌宿主细胞为迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一优选实施方式中，芽孢杆菌属细胞是嗜碱的芽孢杆菌。[0154]将载体导入细菌宿主细胞可通过，例如原生质体转化(参见例如，Chang和Cohen，1979，Molecular General Geneticsl68:111-115)、使用感受态细胞(参见例如，Young 和 pizizin，1961，Journal of Bacteriology81:823-829,或 Dubnau andDavidoff-Abelsonj 1971, Journal of Molecular Biology56:209_221)、电穿孔(参见例如，Shigekawa 和 Dower, 1988，Biotechniques6:742-751)、或接合(参见例如，Koehler 和Thorne, 1987, Journal of Bacteriology 169:5771-5278)来实现。
[0155]所述宿主细胞可为真核生物，例如哺乳动物、昆虫、植物或真菌细胞。在优选的实施方式中，宿主细胞为真菌细胞。本文所用“真菌”包括子囊菌门(Ascomycota)，担子菌门(Basidiomycota)，壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如 Hawksworth等，In，Ainsworth and Bisby^ s Dictionary of The Fungi, 8th edition，1995，CABInternational, University Press，Cambridge，UK 中所定义)，以及卵菌门(Oomycota)(如在Hawksworth等，1995，见前文，171页所引用的)和所有有丝分裂孢子真菌(Hawksworth等，1995，见前文)。
[0156]在更优选的实施方案中，所述真菌宿主细胞是酵母细胞。本文所用“酵母”，包括产子囊酵母(ascosporogenous yeast)(内抱霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽抱纲(Blastomycetes))的酵母。由于酵母的分类在将来可能变化，所以就本发明而言，将酵母定义为如 Biology and Activities of Yeast (Skinner, F.A., Passmore, S.M.和Davenport, R.R.，eds，Soc.App.Bacteriol.Symposium Series N0.9，1980)中所描述的。
[0157]在甚至更优选的实施方案中，所述的酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓄霉(Yarrowia)细胞。
[0158]在最优选的实施方案中，所述酵母宿主细胞是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomycesoviformis)细胞。在另一最优选实施方案中，所述酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces Iactis)细胞。在另一最优选实施方案中，所述酵母宿主细胞是YarrowiaIipolytica 细胞。
[0159]在另一更优选的实施方案中，所述真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括所有丝状形式的真菌(Eumycota)和卵菌(Oomycota)亚门(如由Hawksworth等，1995，见前文所定义的)。所述丝状真菌的特征在于由壳多糖(chitin)、纤维素、葡聚糖(glucan)、脱乙酰壳多糖(chitosan)、甘露聚糖(mannan)和其它复杂多糖(complexpolysaccharides)所组成的菌丝体壁(mycelial wall)。营养生长(vegetative growth)通过菌丝延长(hyphal elongation)来进行，并且碳分解代谢(carbon catabolism)是专性需氧的(obligately aerobic)。与此相反，酵母，诸如酿酒酵母的营养生长，贝丨j是通过单细胞菌体的芽殖(budding)进行，并且碳分解代谢可以是发酵的(fermentative)。
[0160]在甚至更优选的实施方案中，丝状真菌宿主细胞是，但不限于，枝顶孢霉属、曲霉属、德抱属、腐质霉属、毛霉属、毁丝霉属、脉抱国属、青霉属、梭抱壳属、弯颈霉属或木霉属的菌种的细胞。
[0161]在最优选的实施方案中，丝状真菌宿主细胞是泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一最优选的实施方案中，丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在甚至最优选的实施方案中，丝状真菌亲本细胞是镶片镰孢(Nirenberg sp.nov.)细胞。在另一最优选的实施方案中，丝状真菌宿主细胞是特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糖脉抱囷、广紫青霉、土生梭抱霉、哈次木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
[0162]真菌细胞可通过下列方法、以本身已知手段进行转化，所述方法涉及原生质体形成、原生质体转化和细胞壁再生。曲霉属(Aspergillus)宿主细胞转化的合适方法在 EP238023 和 Yelton 等，1984，Proceedings of the NationalAcademy ofSciences USA81:1470-1474中描述。转化镰孢属(Fusarium)菌种的合适方法，由Malardier 等，1989，Gene78:147-156 和 W096/00787 描述。酵母可使用 Becker 和Guarente, In Abelson, J.N.和 Simon, M.1.编，Guide to YeastGenetics and MolecularBiology, Methods in Enzymology, Volumel94, ppl82-187, Academic Press, Inc., NewYork; Ito 等，1983，Journal of Bacteriology 153:163;和 Hinnen 等，1978，Proceedingsof the National Academy of SciencesUSA75:1920 中描述的方法进行转化。
[0163]生产方法
[0164]本发明也涉及产生本发明多肽的方法，所述方法包括:(a)培养腐质霉属(Humicola)或多孔菌属(Meripilus)菌株，以产生含多肽的上清液；和(b)回收多肽。优选地，菌株为特异腐质霉菌种菌株或巨多孔菌菌种菌株。
[0165]本发明也涉及产生本发明多肽的方法，所述方法包括:(a)在适于产生多肽的条件下培养如上所述的重组宿主细胞，和(b)从细胞和/或培养基回收多肽。
[0166]在本发明生产方法中，用本领域已知的方法,将细胞培养在适于多肽产生的营养培养基中。例如，所述细胞可通过摇瓶培养、在实验室或工业发酵罐中小规模或大规模发酵培养(包括连续的、分批的、补料分批的或固态发酵)，在合适培养基中并在允许所述多肽表达和/或分离的条件下进行。所述培养用本领域已知方法，在含碳源、氮源和无机盐的合适营养培养基中进行。合适的培养基可从商业供应者获得或按公开组成(例如，在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果所述多肽分泌至营养培养基，那么所述多肽能直接从培养基回收。如果所述多肽不分泌，那么其能从细胞裂解物回收。
[0167]多肽可用对于多肽特异性的本领域已知方法进行检测。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶分析(enzymeassay)可用于测定本文所述多肽的活性。
[0168]所得多肽可通过本领域已知方法进行回收。例如，多肽可用常规方法从营养培养基回收，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
[0169]本发明多肽也可通过本领域已知的多种方法进行纯化，所述方法包括但不限于层析(例如离子交换、亲和、疏水、色谱焦聚、和大小排阻)、电泳方法(例如制备等电聚焦(preparative isoelectric focusing))、溶解度差异(例如硫酸铵沉淀)、SDS-PAGE、或提取(参见例如，Protein Purification, J._C.Janson 和 Lars Ryden, editors, VCHPublishers, New York, 1989)。
[0170]在植物中表达酶
[0171]可将编码目标多肽，如本发明阿拉伯糖呋喃糖苷酶的DNA序列，如下所述，在转基因植物中转化和表达。
[0172]转基因植物可为双子叶(dicotyledonous)或单子叶(monocotyledonous),简写为双子叶(dicot)或单子叶(monocot)。单子叶植物实例为草,例如草地早熟禾(meadowgrass)(蓝草(blue grass),禾本科(Poa)),牧草(forage grass)例如羊茅属(Festuca)、黑麦草属(Lolium),温带草例如剪股颖属(Agrostis),以及谷类,例如小麦，燕麦，黑麦，大麦，水稻，高粱和玉米。
[0173]双子叶植物实例为烟草，豆类例如羽扇豆，马铃薯，糖甜菜，豌豆，菜豆，大豆，以及十字花科植物(十字花科(Brassicaceae family))例如花椰菜、油菜以及紧密相关的模型生物拟南芥(Arabidopsis thaliana)。
[0174]植物部分的实例为茎，愈伤组织，叶，根，果实，种子，块茎以及包含这些部分的独立组织，例如表皮、叶肉、薄壁组织、维管组织、分生组织。在本上下文中，特定植物细胞区室，例如叶绿体(chloroplast),质外体(apoplast),线粒体(mitochondria),液泡(vacuole),过氧物酶体(peroxisome)和细胞质，也都认为是植物部分。此外，任何植物细胞，无论其组织来源，都认为是植物部分。类似地，植物部分，如有利于本发明利用而分离的特定组织和细胞，也都认为是植物部分，例如胚(embryo),胚乳(endosperm),糊粉(aleurone)和种皮(seed coat)。
[0175]本发明范围也包括这些植物、植物部分和植物细胞的子代。
[0176]表达目标多肽的转基因植物或植物细胞可按本领域的已知方法构建。简言之，所述植物或植物细胞通过如下方法来构建:将编码目标多肽的一个或多个表达构建体整合至植物宿主基因组，并将所得的修饰植物或植物细胞繁殖成转基因植物或植物细胞。
[0177]方便的是，表达构建体为DNA构建体，所述DNA构建体包含编码目标多肽的基因，所述基因与该基因在所选植物或植物部分中表达所需的合适调节序列操作性连接在一起。此外,表达构建体可包含用于鉴定已整合表达构建体的宿主细胞的选择标记和将构建体导入所述植物所必需的DNA序列(后者取决于所用的DNA导入方法)。
[0178]调节序列，如启动子和终止子序列以及可选地信号或转运序列的选择，基于例如预期酶表达的时间、地点及方式来确定。例如，编码本发明酶的基因的表达可为组成型或诱导型，或者表达可以是发育、阶段或组织特异性的，并且基因产物可靶向特定细胞区室、组织或植物部分，例如种子或叶。调节序列，例如由Tague等，Plant, Phys.，86，506, 1988描述。
[0179]就35S_CaMV组成型表达而言，可使用玉米泛素I和水稻肌动蛋白I启动子(Franck 等，1980.Cell21:285-294，Christensen AH, Sharrock RA 和 Quaill992.Maize polyubiquitin genes: structure, thermal perturbation of expression andtranscript splicing, and promoter activity following transfer to protoplastsby electroporation.Plant M0.Biol.18，675-689.;Zhang Wj McElroy D.和 WuR1991, Analysis of rice Actl5’ region activity in transgenic rice plants.Plant Cell3，1155-1165)。器官特异性启动子可以是例如，来自贮存汇集组织(storagesink tissue)如种子、马铃薯块莖、和果实的启动子(Edwards&Coruzzi, 1990.Annu.Rev.Genet.24:275-303)，或来自代谢汇集组织如分生组织的启动子(Ito等，1994.PlantMol.Biol.24:863-878)，种子特异性启动子，如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu 等，Plant and Cell Physiology Vol.39，N0.8ρρ.885-889 (1998)),来自豆球蛋白B4的香豆(Vicia fab a)启动子和来自Conrad U.等，Journal of PlantPhysiology Vol.152，N0.6pp.708-711 (1998)所述的蚕豆的未知种子蛋白基因，来自油籽体蛋白的启动子(Chen 等，Plant and cell physiology vol.39, N0.9pp.935-941 (1998),来自欧洲油菜(Brassica napus)的忙存蛋白napA启动子，或者本领域已知的任何其它种子特异性启动子，例如在W091/14772中所描述的。此外，启动子也可以是叶特异性启动子，例如来自水稻或番爺的rbcs启动子(Kyozuka等，Plant PhysiologyVol.102, N0.3pp.991-1000 (1993)，小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra, A.和 Higgins, DW, Plant Molecular Biology Vol.26, N0.1pp.85-93 (1994),或来自水稻的 aldP 基因启动子(Kagaya 等，Molecular and General GeneticsVol.248，N0.6pp.668-674(1995)，或伤口诱导启动子如马铃薯pin2启动子(Xu等，PlantMolecular Biology Vol.22, N0.4pp.573-588(1993)。类似地，启动子可通过非生物处理例如温度、干旱或盐度改变来诱导，或者由激活启动子的外源施加的物质，例如乙醇，雌激素，植物激素如乙烯、脱落酸和赤霉酸以及重金属所诱导。
[0180]启动子增强元件在植物中可用于取得酶的较高表达。例如，启动子增强元件可为位于启动子与编码酶的核苷酸序列之间的内含子。例如，Xu等(前文已引用)公开了利用水稻肌动蛋白I基因的第一内含子来增强表达。
[0181]选择标记基因和表达构建体的任何其它部分可由本领域可用的那些来选择。
[0182]用本领域已知的常规技术将DNA构建体整合至植物基因组，所述常规技术包括农杆菌(Agrobacterium)-介导的转化,病毒-介导的转化,微注射(micro injection),粒子轰击，生物射弹转化，以及电穿孔(Gasser等,Science, 244, 1293;Potrykus, Bio/Techn.8, 535, 1990;Shimamoto 等,Nature, 338, 274, 1989)。
[0183]目前，根癌农杆菌(Agrobacterium tumefaciens)介导的基因转移是用于产生转基因双子叶植物的优选方法(参见综述Hooykas&Schilperoort, 1992.Plant Mol.Biol.19:15-38)，并且其也能用于转化单子叶植物，尽管对单子叶植物通常使用其它转化方法。目前，用于产生转基因单子叶植物的优选方法除了农杆菌(Agrobacterium)法以外，还有胚愈伤组织或发育胚的粒子轰击(用转化DNA涂覆的精细金(microscopicgold)或鹤颗粒)(Christou, 1992.Plant J.2:275-281;Shimamoto, 1994.Curr.0pin.Biotechnol.5:158-162;VasiI 等，1992.Bio/Technology10:667-674)。转化单子叶植物的可选方法，基于如Omirulleh S等，Plant Molecular biologyVol.21，N0.3pp.415-428(1993)所述的原生质体转化来进行。
[0184]转化后，根据本领域熟知方法选择整合有表达构建体的转化体并将其再生成全植株。通常，将转化方法设计成通过利用例如两种独立T-DNA构建体的共转化或利用特异性重组酶位点特异性切除选择基因在再生期间或在后代中选择性地消除选择基因。[0185]阿拉伯糖呋喃糖苷酶的用途
[0186]本发明也涉及本发明多肽即阿拉伯糖呋喃糖苷酶，在各种工业应用中的用途，例如在生物质转化，例如从含纤维素生物质生产燃料乙醇、从淀粉生产燃料和/或饮用乙醇中、在糖化用于啤酒生产中、在用于面包制备的生面团中或在动物饲料产品制备中的用途。
[0187]本发明进一步提供将含阿拉伯糖木聚糖的底物和/或生物质与能够从双取代木糖中释放阿拉伯糖的阿拉伯糖呋喃糖苷酶进行接触的方法。优选地，a-L-阿拉伯糖呋喃糖苷酶是GH43阿拉伯糖呋喃糖苷酶。GH43 a -L-阿拉伯糖呋喃糖苷酶优选源自细菌、真菌或植物来源。优选地，含阿拉伯糖木聚糖的底物和/或生物质选自下列材料:草本和/或木本能量作物，农业食品和饲料作物，动物饲料产品，块茎，根，茎，豆类，木薯外皮(cassavapeel),可可豆荚(cocoa pod),稻皮和/或稻壳,来自米糠的稻麸(rice bran),穗轴,稻草，谷粒种皮和/或种壳，压榨甘蔗杆，甜菜渣，刺槐豆柏(locust bean pulp)，蔬菜或水果S (pomace),谷物或整粒农作物废弃物,麦杆(straw),稻杆，叶，玉米麸皮，壳，穗轴，外皮(rind),壳(shell),豆荚(pod)，木材废弃物，树皮，刨花(shavings),锯屑(sawdust),木浆，纸浆液，废纸，纸板，建筑和废墟(demolition)木头废弃物，工业或城市废水固体物或游泥，肥料，酿造和/或发酵工艺副产品，湿蒸懼酒糟(wet distillers grain),干蒸懼酒糟(dried distillers grain),酒糟(spent grain),酒糟(vinasse)和甘鹿禮:(bagasse)。
[0188]本发明也涉及包含本发明的多肽即阿拉伯糖呋喃糖苷酶的组合物，以及该组合物的用途。 [0189]材料与方法
[0190]阿拉伯糖和木糖从Merck (Darmstadt, Germany)购买。水溶性和水不溶性小麦阿拉伯糖木聚糖获自 Megazyme (Bray, County Wicklow, Ireland)。
[0191]酶
[0192]将a -L-阿拉伯糖呋喃糖苷酶用基本分子技术克隆(Sambrook等，1989，Molecular Cloning, A Laboratory Manual,第 2 版，Cold Spring Harbor, NewYork, Christgau 等，1995，Curr.Genet.27, 135-141，Ausubel 等，2003，Curr.Prot.Mol.Biol., John ffiley&Sons, Cambridge, USA,)。
[0193]Van Laere 等(1997)和 Van den Broek 等(2005)中的青春双歧杆菌 a-L-阿拉伯糖呋喃糖苷酶获自Megazyme(Ireland)。
[0194]棘孢曲霉和疏棉状嗜热丝孢菌(Thermomyces Ianuginosus)分别产生的单组分内-1，4_ β -木聚糖酶制剂 Shearzyme (GHlO)和 Pentopan Mono (GHll),从 Novozymes A/S( Bagsvaerd, Denmark)商业获得。
[0195]制备特异的(specific)阿拉伯糖木聚糖聚合物和寡糖
[0196]通过如下方法制备双取代阿拉伯糖木聚糖:将pH6.00.1M醋酸缓冲液(IOOmL)中的可溶性小麦阿拉伯糖木聚糖(Ig)与每千克水溶性小麦阿拉伯糖木聚糖中0.167g来自巨多孔菌(GH51)的a-L-阿拉伯糖呋喃糖苷酶在30°C温育48小时。通过如下方法制备单取代阿拉伯糖木聚糖:将PH6.00.1M醋酸缓冲液(42mL)中的水溶性小麦阿拉伯糖木聚糖(Ig)与每千克水溶性小麦阿拉伯糖木聚糖中0.147g来自特异腐质霉(GH43)的a-L-阿拉伯糖呋喃糖苷酶在30°C温育48小时。为了终止酶反应，将混合物加热至100°C lOmin。通过添加乙醇(126ml)来沉淀阿拉伯糖木聚糖聚合物。将所述沉淀过滤(Miracloth)并且真空干燥。
[0197]通过如下方法制备含有连接于末端(I — 3)的阿拉伯糖基的寡糖:将pH6.00.1M醋酸缓冲液(IOOmL)中的水不溶性小麦阿拉伯糖木聚糖(Ig)与每千克水不溶性小麦阿拉伯糖木聚糖中6.67g Shearzyme (木聚糖酶GH10)在30°C温育2小时。通过如下方法制备含有连接于内部(1 — 3)的阿拉伯糖基的寡糖:将pH6.00.1M醋酸缓冲液(IOOmL)中的水不溶性小麦阿拉伯糖木聚糖(Ig)与每公斤水不溶性小麦阿拉伯糖木聚糖中0.03g PentopanMono (木聚糖酶GHlI)在30°C温育2小时。通过如下方法制备含有连接于内部(I — 2)的阿拉伯糖基的寡糖:将pH6.0，0.1M醋酸缓冲液(IOOmL)中的水不溶性小麦阿拉伯糖木聚糖(Ig)与每公斤水不溶性小麦阿拉伯糖木聚糖中0.03g Pentopan Mono (木聚糖酶GHlI)和每公斤水溶性小麦阿拉伯糖木聚糖中来自特异腐质霉的a-L-阿拉伯糖呋喃糖苷酶(GH43)在30°C温育2小时。为了终止酶反应，将混合物加热至100°C IOmin0将阿拉伯糖木糖寡糖在旋转蒸发器上浓缩并且用IH-NMR评价。
[0198]对a-L-阿拉伯糖呋喃糖苷酶活性的活性分析
[0199]可使用5mM p-硝基苯基a -L-阿拉伯糖呋喃糖苷作为底物，如Poutanen等(App1.Microbiol.Biotechnol.1988, 28, 425-432)所述，评估 a -L-阿拉伯糖呋喃糖苷酶活性。反应可在50mM柠檬酸缓冲液中、于pH6.040°C进行，整个反应时间为30min。通过加入0.5mlIM碳酸钠来终止反应，并在405nm检测所释放的对-硝基苯酚。活性以U/ml表示。
[0200]对C2-和C3-双取代木聚糖的活性分析
[0201]将中粘度水溶性小麦阿拉伯糖木聚糖(Megazyme, Bray, Ireland)用来自巨多孔菌的GH51a-阿拉伯糖呋喃糖苷酶(SEQ ID NO:2)处理，以除去连接于阿拉伯糖木聚糖的C(0)_3阿拉伯糖的单个a-阿拉伯糖呋喃糖基取代基，从而产生具有连接于木糖残基的C(O)-2，3的阿拉伯糖呋喃糖基取代基的双取代阿拉伯糖木聚糖底物。将该底物透析并且冷冻干燥。
[0202]制备双取代阿拉伯糖木聚糖0.1%溶液，并通过在eppendorf管中混合0.1ml酶，0.9ml缓冲液(0.12M琥珀酸，pH6.0)和1.0ml底物溶液来检测a -阿拉伯糖呋喃糖苷酶活性。将印pendorf管在60°C振荡温育I小时。释放的阿拉伯糖的量可通过HPAEC(高效阴离子交换层析)测量。
[0203]HPAEC
[0204]将水解物(10μ I)施加至装有 Dionex CarboPac?PAl 保护柱(4x250mm) (DionexCorporation, Sunnyvale, CA, USA)与 CarboPac?PAl 预柱(4x50mm)组合的 Dionex BioLC系统。用IOmM KOH将单糖等度(isocratically)分离15min,流速ilmL.mirT1。可在脉冲安培检测模式中用脉冲电化学检测仪检测单糖。电极电压设计为+0.lV(t=0-0.4秒)至-2.0V(t=0.41-0.42 秒)至 0.6V(t=0.43 秒)并且最终-0.lV(t=0.44-0.50 秒)，同时整合t=0.2-0.4秒所获信号。将阿拉伯糖和木糖混合物(各成分浓度:0.0025-0.1g.1)用作标准。
[0205]1H-NMR 分析
[0206]将所有降解产物从99.9%D20冻干两次并再溶解于99.9%D20中。将某些水解物透析(光谱/Por膜分子量截止1000)以在光谱分析之前除去游离阿拉伯糖。在以400MHz操作并装备有4-核自动切换探针的Varian Mercury-VX检测仪中在30°C记录1H-NMR光谱。收集128-512扫描数据，并且将HDO信号用作参照信号(4.67ppm)。
实施例
[0207]实施例1
[0208]小麦阿拉伯糖木聚糖分别包含作为连接于内部木糖3-位(A)的单取代基的阿拉伯糖呋喃糖苷，和连接在双取代木糖的3-位(B)和2-位(C)的阿拉伯糖呋喃糖苷。产生每种仅含所述三种类型阿拉伯糖呋喃糖苷连接之一的底物。阿拉伯糖呋喃糖苷酶对这些底物的活性用IH NMR研究。
[0209]表1.a -L-阿拉伯糖呋喃糖苷酶活性的来源、家族及分子量
[0210]
【权利要求】
1.一种阿拉伯糖呋喃糖苷酶,其为: a)具有SEQID N0:4所示成熟肽氨基酸序列的多肽，或者能够从其通过取代、缺失和/或插入一个或多个氨基酸而获得的多肽； b)(i)或(ii)中定义的多肽类似物，其 i)与所述多肽有至少80%同源性， ?)为所述多肽的等位基因变体，或 c)由核酸序列编码的多肽，所述核酸序列与编码成熟多肽的SEQID NO:3的核酸序列的互补链或其至少100个核苷酸的亚序列在高严紧条件下杂交。
2.权利要求1的阿拉伯糖呋喃糖苷酶，其为: a)具有SEQID N0:4所示成熟肽氨基酸序列的多肽，或者能够从其通过取代、缺失和/或插入一个、两个、三个、四个或五个氨基酸而获得的多肽； b)与SEQID NO: 4的氨基酸1-643所示氨基酸序列有至少85%，至少90%，至少95%，至少96%，至少97%，至少98%，或至少99%同一性的多I太，或 c)由核酸序列编码的多肽，所述核酸序列与编码成熟多肽的SEQID NO:3的核酸序列的互补链在高严紧条件下杂交。
3.权利要求1或2所述的阿拉伯糖呋喃糖苷酶，其对于多孔菌属菌株，优选巨多孔菌是天然的。
4.核酸序列,其包含编码权利要求1-3任一项所述的阿拉伯糖呋喃糖苷酶的核酸序列。
5.核酸序列，其与SEQID NO: 3所示DNA序列具有至少80%同源性，或者 a)与所述DNA序列的互补链或其具有至少100个核苷酸的亚序列在高严紧条件下杂交， b)为其等位基因变体，或 c)a)或b)的互补链。
6.权利要求5的核酸序列，其与SEQID NO: 3的核苷酸46-1974所示核酸序列有至少85%,至少90%，至少95%，至少96%，至少97%，至少98%，或至少99%同一性。
7.权利要求4-6任一项所述的核酸序列，其中多肽为含下列氨基酸序列的人工变体，所述氨基酸序列相对SEQ ID N0:4的氨基酸1-643，有一处或多处截短，和/或氨基酸的至少一个取代、缺失和/或插入。
8.—种核酸构建体,其包含权利要求4-7任一的核酸序列,所述核酸序列与在合适表达宿主中能指导阿拉伯糖呋喃糖苷酶表达的一种或多种调控序列可操作地连接。
9.包含权利要求8的核酸构建体的重组表达载体。
10.包含权利要求9的表达载体的重组宿主细胞。
11.产生阿拉伯糖呋喃糖苷酶的方法，其包括在利于产生阿拉伯糖呋喃糖苷酶的条件下培养权利要求10的宿主细胞,和回收阿拉伯糖呋喃糖苷酶。
12.包含根据权利要求1-3中任一项的阿拉伯糖呋喃糖苷酶的组合物。
13.根据权利要求1-3中任一项的阿拉伯糖呋喃糖苷酶在生面团中的用途。
14.根据权利要求1-3中任一项的阿拉伯糖呋喃糖苷酶在乙醇工艺中的用途。
15.根据权利要求1-3中任一项的阿拉伯糖呋喃糖苷酶在糖化工艺中的用途。
16.根据权利要求1-3中任一项的阿拉伯糖呋喃糖苷酶在生产饲料产品的工艺中的用途。
【文档编号】A21D8/04GK103789284SQ201410083212
【公开日】2014年5月14日申请日期:2006年4月25日优先权日:2005年4月26日
【发明者】汉尼.R.索伦森, 克里斯特尔.T.乔尔根森, 拉斯.H.克里斯坦森, 克里斯琴.I.乔尔根森, 卡斯滕.H.汉森, 莱尼.V.科福德申请人:诺维信公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汉尼.R.索伦森;克里斯特尔.T.乔尔根森;拉斯.H.克里斯坦森;克里斯琴.I.乔尔根森;卡斯滕.H.汉森;莱尼.V.科福德
技术所有人：诺维信公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。