具有膨胀因子活性的多肽及其用途的制作方法

文档序号:3586855阅读:978来源:国知局
专利名称:具有膨胀因子活性的多肽及其用途的制作方法
技术领域
本发明涉及包含下述基因的序列,所述基因编码具有降解碳水化合物材料活性的多肽的序列或帮助降解碳水化合物材料活性的多肽的序列。本发明涉及该新颖基因的全长编码序列以及该全长功能性蛋白的氨基酸序列,以及所述基因或氨基酸序列的变体和片段。本发明还涉及在工业方法中使用这些蛋白的方法。本发明还包括用根据本发明的多核苷酸转化的适用于生产这些蛋白质的细胞。本发明还涉及编码下述多肽的基因在宿主中的成功表达,所述多肽具有降解碳水化合物材料的活性。宿主可以是任何合适的宿主,例如Aspergillus (例如 Aspergillus niger)或 Talaromyces (例如 Talaromyces emersonii)。_4]
背景技术
碳水化合物组成地球上最丰量的有机化合物。然而,许多这类碳水化合物隐蔽在复杂聚合物中,包括淀粉(种子和谷物中的主要储存碳水化合物)和被称为木质纤维素的碳水化合物与木质素的集合体。木质纤维素的主要碳水化合物组分是纤维素、半纤维素和果胶。这些复杂的聚合物通常被统称为木质纤维素。

从由于OPEC减少石油输出而导致石油危机爆发的70年代开始,可再生的木质纤维素生物质转化为可发酵的糖的生物转化吸引了研究人员强烈的注意力,所述可发酵的糖随后被发酵产生醇(例如乙醇),作为液体燃料的替代品。在过去二十年间,乙醇已被广泛使用,在美国作为与汽油的10%的掺合物,或在巴西作为车辆的纯燃料。最近实现了E85(85%乙醇掺合物)的使用,特别是用于清洁城市应用。燃料生物乙醇的重要性将会随着油价的提高及其来源的逐渐耗尽而提高。另外,可发酵的糖被用于生产塑料、聚合物和其他基于生物的制品,并且预期这一工业将大幅增长,从而提高了对大量的低成本可发酵糖的需求,所述可发酵糖可以被用作原料来代替基于石油的原料。大量碳水化合物在植物生物质中的隐蔽以糖(五碳糖以及六碳糖)的形式提供了大量潜在的能量来源,所述糖能够被用于大量工业和农业过程。然而,这些碳水化合物的巨大能源潜力目前利用不足,因为糖封闭在复杂聚合物中并因此不容易进行发酵。由植物生物质生产糖的方法会提供大量的、经济上有竞争性的原料,用于发酵成化学品、塑料,例如琥珀酸和(生物)燃料,包括乙醇、甲醇、丁醇合成液体燃料和沼气。与纤维素原料的种类无关,酶的成本和水解效率是限制生物质生物转化方法商业化的主要因素。由微生物生产的酶的生产成本与产酶菌株的生产力和发酵液中最终的活性产率密切相关。尽管过去几十年为了理解酶促木质纤维素生物质降解和纤维素酶生产而进行了持续的研究,但是仍然期望发现或者改造新的有高度活性的纤维素酶和半纤维素酶。还高度期望构建能够进行迅速和高效的木质纤维素材料生物降解的高效酶组合物,尤其是具有提高的热稳定性的此类纤维素酶和半纤维素酶。此类酶可被用于生产糖,用于发酵成化学品,塑料,例如琥珀酸和(生物)燃料,包括乙醇、甲醇、丁醇、合成液体燃料和沼气,用于青贮,还在其他工业方法中(例如在食品或饲料、纺织品、制浆或造纸或洗涤剂工业和其他工业中)用作酶。

发明内容
本发明提供了编码能够降解(即帮助降解)碳水化合物(例如多糖)、特别是木质纤维素的多肽的多核苷酸。本发明的多核苷酸典型地编码具有膨胀因子活性的多肽。本发明还提供了具有此类活性的天然和重组生产的多肽,以及生产此类酶的重组细胞系。还提供了制造和使用本发明多核苷酸和多肽的方法。根据本发明,提供了包含SEQ ID NO:2中示出的氨基酸序列或SEQID NO:1的核苷酸序列编码的氨基酸序列,或其变体多肽或变体多核苷酸,其中所述变体多肽与SEQ IDNO:2中示出的序列具有至少73%的序列同一性,或所述变体多核苷酸编码与SEQ ID NO:2中示出的序列具有至少73%序列同一性的多肽。根据本发明的多肽具有良好的特性,尤其是降解纤维素的活性。在一种实施方式中,根据本发明的多肽具有膨胀因子活性。本发明的多肽具有膨胀因子活性(见Salheimo et al., Eur.J.Biohem.269,4202-4211,2002)。膨胀因子已被提议来打断纤维素和其他细胞壁多糖之间的氢键而不具有水解活性。以这种方式,膨胀因子被认为允许纤维素纤维滑动(sliding)和以及细胞壁伸展。膨胀因子,一种膨胀素样(expansin-like)蛋白,其含有N-端碳水化合物结合模块家族I结构域(CBD)和C-端膨胀样结构域。就本发明目的而言,膨胀素样蛋白或膨胀因子样蛋白可包含此类结构域的一种或两种和/或可打断细胞壁结构(比如打断纤维素结构),任选地不产生可检测量的还原糖。另外,多肽可具有高的热稳定性。根据本发明的多肽以孵育时间(h)的函数保持高的相对活性(初始活性的% ),例如2小时、3小时、4小时、5小时、6小时、8小时、9小时、10小时或更多、20小时或更多、30小时或更多,尤其是在高温下,例如在60°C或更高温度下、在65°C或更高温度下、在70°C或更高温度下,例如在65°C下8小时或在60°C下72小时。本发明还提供了包含以下的多核苷酸:(a) SEQ ID NO:1中示出的核苷酸序列;或(b)与是SEQ ID NO:1的反向互补体对多核苷酸选择性杂交的核苷酸序列;或(c)与SEQ ID NO:1的核苷酸序列具有至少约78%序列同一性的核苷酸序列;或(d)如(a)、(b)或(C)中定义的核苷酸序列的片段,其长度至少约100个核苷酸;或(e)序列,其是作为遗传编码的结果的(a)、(b)、(c)或(d)任一中定义的序列简并体;或(f)核苷酸序列,其为(a)、(b)、(c)、(d)或(e)中定义的核苷酸序列的反向互补体。根据本发明还提供了并入了本发明多核苷酸序列的载体(例如表达载体)和包含本发明多肽、多核苷酸或载体的细胞。
本发明还提供了:用于制备具有膨胀因子活性的多肽的方法,所述方法包括在允许所述多肽表达的条件下培养本发明的细胞,并任选地回收所表达的多肽;可通过此类方法获得的多肽;和组合物,其包含:(i)本发明的多肽;和(ii)纤维素酶和/或半纤维素酶和/或果胶酶。具有膨胀因子活性的本发明多肽可被用于工业方法中。因此,本发明提供了用于处理包含碳水化合物材料的底物的方法,所述方法包括使底物与本发明的多肽或组合物接触。本发明尤其提供了用于从木质纤维素材料生产一种或多种糖的方法,所述方法包括使木质纤维素材料与本发明的多肽或组合物接触。通过这种方式生产的糖可在发酵方法中使用。因此,本发明提供了用于生产发酵产物的方法,所述方法包括:使用上述方法生产可发酵的糖;对得到的可发酵的糖进行发酵,从而生产发酵产物。本发明的多肽或组合物也可以在例如食物制品的制备、洗涤剂的制备、动物饲料的制备、浆体的处理或造纸或织物或纺织品的制备或其清洁中使用。本发明还提供了:可通过使植物材料或木质纤维素材料与本发明的多肽或组合物接触获得的经加工的材料;包含本发明的 多肽或组合物的食物或饲料;和包含根据本发明的多核苷酸、多肽、载体或细胞的植物或其部分。附图简述

图1:用于在A.niger中表达基因的pGBTOP的图谱。描绘了从葡糖淀粉酶启动子(PglaA)开始表达的感兴趣的基因(GOI)。另外,描绘了表达盒的葡糖淀粉酶侧翼(3’ glaA)。在本申请中,感兴趣的基因是TEMER08806的编码序列,如下文所定义。序列表简沭SEQ ID NO:1 展示了 TEMER08806 的编码序列;SEQ ID NO:2 展示了 TEMER08806 的氨基酸序列;SEQ ID NO:3 展示了 TEMER08806 的信号序列;发明详述在本说明书和所附权利要求书的通篇中,词语“包含”("comprise")和“包括,,(" include")及其不同词性的变体(如"comprises" , " comprising" ," includes"和"including")应被解释为开放性的。也就是说,在上下文允许时,这些词语旨在表达可能包括未明确指出的其他要素或成分。冠词“一”(“a”和“an”)在本文中被用于表示一个或多于一个(即一个或至少一个)所述冠词的语法客体。例如,“一要素”可表示一个要素或多于一个要素。本发明提供了编码多肽的多核苷酸,所述多肽例如是能够改性(例如降解)碳水化合物材料的酶。碳水化合物材料是包含一种或多种碳水化合物或由其组成或基本由其组成的材料。酶在本文中是多肽的亚类。
在本文中,底物(也称作原料)被用于表示包含碳水化合物材料的物质,其可用根据本发明的酶处理,使得其中的碳水化合物材料被改性。除了碳水化合物材料以外,底物还可含有任何其他组分,包括但不限于非碳水化合物材料和淀粉。本发明提供了编码多肽的多核苷酸,所述多肽例如是能够改性(例如降解)碳水化合物材料的酶。碳水化合物材料是包含一种或多种碳水化合物或由其组成或基本由其组成的材料。酶在本文中是多肽的亚类。典型地,本发明的多核苷酸编码具有至少膨胀因子活性、暂时称作TEMER08806、具有根据SEQ ID NO:2的氨基酸序列的多肽,或编码其变体的序列,或编码所述多肽或其变体的片段的序列,所述变体典型地为具有SEQ ID NO:2的序列的多肽的功能性等同物。在一种实施方式中,本发明的多肽可具有一种或多种除上述提到的膨胀因子活性之外的替代性和/或额外的活性,例如本文中提到的其他降解碳水化合物和/或水解碳水化合物活性之一。碳水化合物在本文上下文中包括所有糖类,例如多糖、寡糖、二糖或单糖。根据本发明的多肽可通过化学降解或物理降解此类材料或水解碳水化合物来改性和/或降解碳水化合物材料。物理降解包括例如打断纤维素微纤维之间的相互作用和/或打开纤维素纤维结构。碳水化合物材料的化学改性可例如通过水解、氧化或其他化学改性,例如通过裂合酶的作用导致此类材料的降解。物理改性可伴随或不伴随化学改性。合适的碳水化合物材料
适合被本发明的多肽改性的非淀粉碳水化合物是木质纤维素。可以被认为是潜在的可再生原料的、包含不同木质纤维素残基的主要的多糖是纤维素(葡聚糖)、半纤维素(木聚糖、杂木聚糖(heteroxylans)和木葡聚糖(xyloglucans))。另外,一些半纤维素可以作为葡甘露聚糖(glucomannans)存在于例如木材衍生的原料中。这些多糖变成为可溶糖(例如葡萄糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、D-半乳糖醛酸和其他己糖和戊糖)的酶促水解发生于共同作用的不同酶的作用下。另外,果胶和其他果胶物质如阿拉伯聚糖(arabinans)可占来自非木本植物组织典型的细胞壁干物质的可观的比例(约四分之一到一半的干物质可以是果胶)。纤维素是由通过β_1,4键连接的葡萄糖残基组成的线性多糖。纤维素纤维的线性本质以及化学计量的β_连接的葡萄糖(相对于α)比淀粉的高度枝化的α-连接的结构更倾向于产生链间(interstrand)氢键合的结构。因此,纤维素聚合物与淀粉中存在的纤维相比通常溶解度更小,并且形成更紧密结合的纤维。半纤维素是复合聚合物,并且其组成常常在生物之间、组织类型之间大幅变化。通常,半纤维素的主要成分是β_1,4-连接的木糖(一种五碳糖)。然而,所述木糖通常在木糖的0-3和/或0-2处被枝化,并且可以被与阿拉伯糖、半乳糖、甘露糖、葡糖醛酸、半乳糖醛酸形成的键取代,或者被对乙酸的酯化(和阿魏酸对阿拉伯糖的酯化)取代。半纤维素也可含有葡聚糖,所述葡聚糖是连接的六碳糖(如先前提到的β_(1,3)(1,4)葡聚糖和杂葡聚糖)和额外的葡甘露聚糖(其中葡萄糖和甘露糖均存在于线性主链中,彼此通过β_键连接)的总称。与单子叶植物(monocots,即具有单个子叶或种子叶的植物,如玉米、小麦、水稻、草、大麦)相比,双子叶植物(dicot,即其种子具有两片子叶或种子叶的植物,如利马豆(lima beans)、花生、杏仁、豌豆、四季豆)中半纤维素的组成、取代性质和枝化程度差异很大。在双子叶植物中,半纤维素主要由下述木葡聚糖组成,所述木葡聚糖是具有I,6- β -连接的木糖基侧链的1,4-β-连接的葡萄糖链。在单子叶植物(包括大部分谷类作物)中,半纤维素的主要组分是杂木聚糖。这些主要由下述1,4-β-连接的木糖主链聚合物组成,所述木糖主链聚合物与阿拉伯糖、半乳糖、甘露糖和葡糖醛酸或4-0-甲基-葡糖醛酸具有1,3_α连接以及与由酯连接的乙酸改性的木糖具有1,3_α连接。还存在由1,3_和1,
4-β-连接的葡糖基链组成的β葡聚糖。在单子叶植物中,纤维素、杂木聚糖和葡聚糖可以大致等量地存在,各自包含约15-25%的细胞壁干物质。另外,不同的植物可包含不同量和不同组成的果胶物质。例如,甜菜含有以干重为基础约19%的果胶和约21%的阿拉伯聚糖。因此,本发明的组合物可根据要使用的具体原料(也称作底物)来定制。也就是说,本发明组合物中的活性谱可根据考虑的原料来变化。酶组合或物理处理可以并发或先后地施用。酶可以在微生物、酵母、真菌、细菌或植物中外源产生,然后分离并加入木质纤维素原料中。或者,酶可以被生产但不分离,并且将粗制细胞群发酵液或植物材料(如玉米杆)等等加入原料中。或者,可以处理粗制细胞群或酶生产培养基或植物材料,以预防进一步的微生物生长(例如通过加热或添加抗微生物剂),然后添加至原料。这些粗制酶混合物可包含生产酶的生物。或者,酶可以在下述发酵中生产,所述发酵施用原料(例如玉米杆)对生产酶的生物提供营养。通过这种方式,生产酶的植物可以发挥木质纤维素原料的作用,并且被添加进木质纤维素原料中。酶活性内切-1,4- β -葡聚糖酶(EG)和外切-纤维二糖水解酶(CBH)催化不溶性纤维素水解成为纤维寡糖(纤维二糖作为主要产物),而β_葡糖苷酶(BGL)将寡糖(主要是纤维二糖和纤维三糖)转化为葡萄糖。

木聚糖酶与其他附属酶例如a-L-阿拉伯呋喃糖酶、阿魏酸酯酶和乙酰木聚糖酯酶、葡糖醛酸糖苷酶和β -木糖苷酶一起,催化半纤维素的部分水解。果胶物质包括果胶、阿拉伯聚糖、半乳聚糖和阿拉伯半乳聚糖。果胶是植物细胞壁中最复杂的多糖。它们沿着一定程度上散布有L-鼠李糖的α (1,4)_连接的D-半乳糖醛酸单元核心链周围构建。在任何细胞壁中都存在符合该描述的大量结构单元,并且通常认为在单个果胶分子中,不同结构单元的核心链彼此连续。果胶酶包括例如内切多聚半乳糖醛酸酶,果胶甲基酯酶,内切-半乳聚糖酶,β -半乳糖苷酶,果胶乙酰基酯酶,内切-果胶裂合酶,果胶酸裂合酶,α -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶,α-阿拉伯呋喃糖苷酶。结构单元的主要类型是:聚半乳糖醛酸(同聚半乳糖醛酸),其可被甲醇在羧基上取代,被乙酸酯在0-2和0-3上取代;鼠李半乳糖醛酸聚糖I (RGI),其中半乳糖醛酸单元与带有(1,4)_连接的半乳聚糖和(1,5)_连接的阿拉伯聚糖侧链的鼠李糖交替存在。阿拉伯聚糖侧链可直接与鼠李糖结合,或者通过半乳聚糖链间接结合;木半乳糖醛酸聚糖,在半乳糖醛酸的0-3上具有单个木糖基单元(与RGI紧密结合);和鼠李半乳糖醛酸聚糖II (RGII),含有罕见糖例如芹菜糖的特别复杂的小型单元。RGII单元可含有两个芹菜糖残基,所述芹菜糖残基在合适的离子条件下能够与硼酸盐可逆地形成酯。如上文所述,本发明的多肽典型地具有膨胀因子活性。然而,除了所述活性之外或替代所述活性,本发明的多肽可具有一种或多种上文公开的活性。除了具有膨胀因子活性的本发明多肽所提供的活性以外,本文所述的本发明的组合物还可具有一种或多种上文所述的活性。多核苷酸序列本发明提供了包含编码TEMER08806的基因的基因组多核苷酸序列及其编码序列。因此,本发明涉及包含根据SEQ ID NO:1的编码核苷酸序列的基因组核苷酸序列的经分离的多核苷酸,及其任一的变体,例如功能性等同物。本发明尤其涉及述经分离的多核苷酸,所述多核苷酸能够(例如在严格条件下、优选地在高度严格条件下)选择性地与包含SEQ ID NO:1中示出的序列的多核苷酸的反向互补体杂交。更特定地,本发明涉及包含根据SEQ ID NO:1的核苷酸序列或基本由其组成的多核苷酸。本发明还涉及包含下述序列或基本由其组成的经分离的多核苷酸或其任一的变体(例如功能性等同物)或片段,所述序列编码根据SEQ ID NO:2的多肽或其变体的至少一个功能性结构域。在本文中使用时, 术语“基因”和“重组基因”是指可从染色体DNA中分离的核酸分子,其包含编码蛋白质(例如根据本发明的膨胀因子蛋白)的开放读码框。基因可包括编码序列、非编码序列、内含子和/或调节序列。另外,术语“基因”可表示如本文定义的经分离的核酸分子。可使用本文提供的序列信息和标准分子生物学技术,分离本发明的核酸分子,例如具有SEQ ID NO:1的核苷酸序列的核酸分子或其变体(例如功能等同物)。例如,使用SEQ ID NO:1的全部或部分核酸序列作为杂交探针,可以使用标准杂交和克隆技术分离根据本发明的核酸分子(例如,如Sambrook, J., Fritsh, E.F., and Maniatis,T.Molecular Cloning:ALaboratory Manual.2nd, ed., Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press, Cold Spring Harbor, NY, 1989 中所述)。另外,可使用以SEQ ID NO:1中含有的序列信息为基础设计的合成寡核苷酸引物,通过聚合酶链式反应(PCR)分离包含SEQ ID NO:1全部或部分的核酸分子。可以使用cDNA、mRNA或者基因组DNA作为模板和适当的寡核苷酸引物,根据标准PCR扩增技术扩增本发明的核酸。可以将藉此扩增的核酸克隆进适当的载体中,并通过DNA序列分析来表征。另外,可以通过标准合成技术,例如使用自动化DNA合成仪,制备对应于本发明核苷酸序列或可与本发明核苷酸序列杂交的寡核苷酸。在一个优选的实施方式中,本发明的经分离的核酸分子包含SEQ IDNO:1中所示的核苷酸序列。在另一个优选的实施方式中,本发明的经分离的核酸分子包含下述核酸分子,所述核酸分子是SEQ ID NO:1中所示核苷酸序列的反向互补体,或此类核苷酸序列任一的变体,例如功能性等同物。与另一核苷酸序列互补的核酸分子是与另一核苷酸序列充分互补、使得其能够与另一核苷酸序列杂交从而形成稳定双链体的核酸分子。本发明的一个方面涉及编码本发明多肽或其变体(例如功能性等同物,例如生物活性片段或结构域)的经分离的核酸分子,以及足以用作鉴定编码本发明多肽的核酸分子的杂交探针的核酸分子,和适合用作用于扩增或突变核酸分子的PCR引物的、此类核酸分子的片段。根据本发明的多核苷酸可以是“经分离的”。在本发明上下文中,“经分离的多核苷酸”或“经分离的核酸”是下述DNA或RNA,所述DNA或RNA与其来源生物天然存在的基因组中与之紧邻的一条或两条编码序列(一条在5’端,一条在3’端)不再紧邻。因此,在一个实施方式中,经分离的核酸包括与编码序列紧邻的部分或所有5’非编码(例如启动子)区。该术语因此包括例如被整合进载体中、自助复制的质粒或病毒中、或原核生物或真核生物的基因组DNA中的,或者作为独立于其他序列的单独的分子(例如通过PCR或限制性内切核酸酶处理生产的cDNA或基因组DNA片段)存在的重组DNA。其还包括基本不含细胞材料、病毒材料、或培养基(通过重组DNA技术生产时)或化学前体或其他化学品(化学合成时)的重组DNA,所述重组DNA是编码其他多肽的杂种基因的部分。另外,“经分离的核酸片段”是不作为片段天然存在并且在天然状态下不会被找到的核酸片段。在本文中使用时,术语“多核苷酸”或“核酸分子”旨在包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)和使用核苷酸类似物生产的DNA或RNA的类似物。核酸分子可以是单链或双链的,但是优选地是双链DNA。可以使用寡核苷酸类似物或衍生物(例如肌苷或硫代磷酸核苷酸(phosphorothioate nucleotides))合成核酸。此类寡核苷酸可被用于例如制备具有改变的碱基配对能力或提高的核酸酶抗性的核酸。本发明的另一实施方式提供了与TEMER08806核酸分子反义的经分离的核酸分子,例如TEMER08806核酸分子的编码链。还包括在本发明范围内的是本文所述核酸分子的互补链。除非另有说明,本文通过测序DNA分子所测定的所有核苷酸序列均使用自动化DNA测序仪测定,本文测定的DNA分子编码的多肽的所有氨基酸序列均通过上文测定的DNA序列的翻译来预测。因此,如本领域针对通过所述自动化途径测定的任何DNA序列所已知的,本文测定的任何核苷酸序列可含有一些错误。通过自动化测定的核苷酸序列典型地与被测序的DNA分子的实际核苷酸序列至少约90%相同,更典型地至少约95%到至少约99.9%相同。可以通过其他途径(包括本领域公知的手动DNA测序法)来更加精确地测定实际序列。也如本领域所已知的,与实际序列相比被测定的核苷酸序列中的单个插入或缺失会在核苷酸序列的翻译中引起移码,使得预测的由所测定的核苷酸序列编码的氨基酸序列从此类插入或缺失点处开始,与被测定的DNA分子实际编码的氨基酸序列完全不同。本领域技术人员能够鉴定此类被错误鉴定的碱基,并且已知如何校正此类错误。根据本发明的核酸分子可仅包含SEQ ID NO:1中所示核酸序列(或其任一的变体)的部分或片段, 例如可用作探针或引物的片段,或编码TEMER08806多肽的一部分的片段。
通过克隆TEMER08806基因和cDNA测定的核苷酸序列允许生产被设计用于鉴定和/或克隆其他TEMER08806家族成员以及来自其他物种的TEMER08806同源物的探针和引物。探针/引物典型地包含基本纯化的寡核苷酸,所述寡核苷酸典型地包含下述核苷酸序列区域,所述区域优选地在高度严格条件下与SEQ ID NO:1所示核苷酸序列或其任一的变体(例如功能性等同物)的至少从约12个到约15个、优选地从约18个到约20个、优选地从约22个到约25个、更优选地约30个、约35个、约40个、约45个、约50个、约55个、约60个、约65个、或曰75个或更多个连续的核苷酸杂交。基于TEMER08806核苷酸序列的探针可被用于检测例如其他生物中编码相同或同源多肽的转录本或基因组TEMER08806序列。在优选的实施方式中,探针还包含与之结合的标签基团,例如所述标签基团可以是放射性同位素、荧光化合物、酶或酶辅因子。此类探针也可以被用作用于鉴定表达TEMER08806多肽的细胞的诊断测试试剂盒的部分。本文的多核苷酸可以是合成的多核苷酸。合成的多核苷酸可以按照密码子使用被优化,优选地根据W02006/077258和/或PCT/EP2007/055943中所述的方法被优化,所述参考文献通过引用并入本文。PCT/EP2007/055943介绍了密码子对优化。密码子对优化是这样一种方法:其中编码多肽的核苷酸序列根据其密码子使用、尤其是使用的密码子对而被修饰,以获得编码多肽的核苷酸序列经改进的表达和/或所编码的多肽的经改进的生产。密码子对被定义为编码序列中一组两个连续的三联体(密码子)。本发明还涉及包含前文所述多核苷酸的核酸构建体。“核酸构建体”在本文中被定义为单链或双链的核酸分子,其与天然存在的基因分离,或者已被修饰为含有下述核酸区段,所述核酸区段以天然不会存在的方式组合和并置。当核酸构建体含有表达编码序列所需的所有控制序列时,术语核酸构建体与术语“表达盒”同义。本文定义的术语“编码序列”在本文中被定义为下述序列,所述序列被转录成mRNA并翻译成本发明的蛋白酶启动子的转录活化子。编码序列的界限通常由mRNA 5’-端的ATG起始密码子和mRNA 3'-端终止开放读码框的翻译终止密码子序列决定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。优选地,核酸具有高GC含量。本文的GC含量是指构建体中G和C核苷酸的数量除以核苷酸的总数,以%表示。GC含量优选地为56%或更多、57%或更多、58%或更多、59%或更多、60%或更多,或者在56-70%的范围内或58-65%的范围内。优选地,DNA构建体包含启动子DNA序列、与所述启动子DNA序列可操作地连接的编码序列,和控制序列例如:-一个选自以下序列列表的由5’朝向3’方向的翻译终止序列:TAAG、TAGA和TAAA,优选地TAAA,和/或-一个选自以下序列列表的由5’朝向3’方向的翻译起始子编码序列:GCTACCCCC ;GCTACCTCC ;GCTACCCTC ;GCTACCTTC ;GCTCCCCCC ;GCTCCCTCC ;GCTCCCCTC ;GCTCCCTTC ;GCTGCCCCC ;GCTGCCTCC ;GCTGCCCTC ;GCTGCCTTC ;GCTTCCCCC ;GCTTCCTCC ;GCTTCCCTC ;和GCTTCCTTC,优选地 GCT TCC TTC,和 / 或-选自以下序列列表的翻译起始子序列:5’-mwChkyCAAA_3’;5’-mwChkyCACA_3’或5’-mwChkyCAAG-3’,其中使用核苷酸的模糊编码:m(A/C) ;w(A/T) ;y(C/T) ;k(G/T) ;h(A/C/T),优选地 5’ -CACCGTCAAA-3’ 或 5’ -CGCAGTCAAG-3 ’。

在本发明的上下文中,术语“翻译起始子编码序列”被定义为DNA编码序列开放读码框起始子或起始密码子紧下游的9个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。在本发明的上下文中,术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端的翻译终止密码子开始并按5’到3’方向的四个核苷酸。在本发明的上下文中,术语“翻译起始子序列”被定义为编码多肽的DNA序列开放读码框的起始子或起始密码子紧上游的十个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。本领域公知在RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶T。同源性和同一性当氨基酸序列或核苷酸序列展示某些相似性水平时,其被称为是同源的。同源的两个序列表示共同的进化来源。不论两个同源序列是密切相关的还是更远相关的,其分别由或高或低的“百分比同一性”或“百分比相似性”表示。虽然是有争论的,但为了表示“百分比同一性”或“百分比相似性”,“同源性水平”或“百分比同源性”通常互换使用。术语“同源性”、“百分比同源性”、“百分比同一性”或“百分比相似性”在本文可互换使用。就本发明的目 的而言,在本文中定义为了测定两条氨基酸序列或两条核酸序列的百分比同一性,就最佳比较目的而言比对全序列。为了优化两个序列之间的比对,可在被比较的两条序列的任一条中引入缺口。这类比对可以在被比较的序列的全长上进行。或者,比对可在更短的比较长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。同一性是在报告的比对区域上的两条序列之间的同一性匹配的百分比。可以使用数学算法完成两个序列之间的序列比较和同一性百分比测定。技术人员应当明白下述事实:可获得比对两条序列的若干种不同的计算机程序并测定两条序列之间的同源性(Kruskal, J.B.(1983)An overview ofsequence comparison In D.Sankoffand J.B.Kruskal, (ed.), Time warps, stringedits and macromolecules:the theoryand practice of sequence comparison, pp.1-44 Addison Wesley)。可使用用于I:匕对两条序列的Needleman和Wunsch算法测定两条氨基酸序列之间的百分比同一性(Needleman,
S.B.andffunsch, C.D.(1970) J.Mol.Biol.48,443-453)。算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已在计算机程序NEEDLE中实施。就本发明目的而言,使用了来自 EMBOSS包的NEEDLE程序(版本2.8.0 或更高,EMBOSS:The European Molecular BiologyOpen Software Suite(2000)Rice,P.Longden,1.and Bleasby,A.Trends in Genetics 16,
(6)pp276~277, http: //emboss, bioinformatics, nl/)。就多妝序列而言,BL0SUM62 用于替换矩阵,就核苷酸序列而言,使用了 EDNAFULL。可指定其他矩阵。用于比对氨基酸序列的任选的参数是缺口开放惩罚为10和缺口延伸惩罚为0.5。技术人员会意识到所有这些不同的参数会产生些微不同的结果,但是当使用不同的算法时两条序列的总百分比同一性不显著改变。总体同源性定义同源性或同一性是在包括任何缺口或延伸的总比对区域上的两条全序列之间的同一性匹配的百分比。两条比对序列之间的同源性或同一性如下计算:在两个序列中都显示相同氨基酸的比对中的对应位置的数目除以包括缺口的比对的仝长。本文中定义的同一性可从NEEDLE中获得并在程序输出中被标记为“同一性”。
最长的同一'丨生定义在两个比对序列之间的同源性或同一性如下计算:在两个序列中都显示相同氨基酸的比对中的对应位置的数目除以减去比对中的总缺口数目后的比对的仝长。可通过使用N0BRIEF选择从NEEDLE中获得本文中定义的同一性并且所述同一性在程序输出中被标记为“最长同一性”。就本发明目的而言,根据“最长同一性”的定义计算两条序列(氨基酸或核苷酸)之间的同一性(同源性)水平,如可通过使用程序NEEDLE进行计算。本方面的多肽序列还可用作“查询序列”以针对序列数据库进行搜索,例如来鉴定其他家族成员或相关序列。可使用BLAST程序进行此类搜索。进行BLAST分析的软件通过National Center for BiotechnologyInformation (http: //www.ncb1.nlm.nih.gov)是公众可得到的。BLASTP用于氨基酸序列,BLASTN用于核苷酸序列。BLAST程序使用下述缺省:-开放缺口的开销:缺省=5用于核苷酸/II用于多肽-延伸缺口的开销:缺省=2用于核苷酸/I用于多肽-核苷酸错配惩罚:缺省=-3-核苷酸匹配奖励:缺省=I-期望值:缺省=10-字长:缺省=11用于核苷酸/28用于megablast/3用于多肽此外,通过BLAST程序,测定查询氨基酸序列或查询核酸序列与检索的同源序列之间的局部同一性(同源性)程度。但是,仅仅比较在某一阈值上给出匹配的那些序列段。从而,程序仅针对这些匹配段计算同一性。因此,以这种方式计算的同一性被称为局部同一性。杂交在本文中使用时,术语“选择性杂交”("selectively hybridizing "和“hybridizes selectively”)和类似的术语旨在描述用于杂交和洗漆的下述条件,在所述条件下彼此至少约50 %、至少约55 %、至少约60 %、至少约65 %、至少约70 %、至少约75%、至少约80%、更优选地至少约85%、进一步更优选地至少约90%、最优选地至少95%、更优选地至少约98%或更优选地至少约99%彼此同源的核苷酸序列典型地保持为彼此杂交。也就是说,这类杂交序列可共享至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、更优选地至少约85%、进一步更优选地至少约98%或更优选地至少约99%的序列同一性。这类杂交条件的一个优选的非限制性例子是:于约45°C下在6X氯化钠/柠檬酸钠(SSC)中杂交,然后于约50°C、优选约55°C、优选约60°C和进一步更优选约65°C下,在I X SSC,0.1% SDS中洗涤一次或多次。高度严格条件包括例如于约68°C下在5XSSC/5XDenhardf s溶液/1.0% SDS中杂交并于室温下在0.2XSSC/0.1% SDS中洗涤。或者,洗涤可以在42°C进行。技术人员应当知道对于严格和高度严格的杂交条件而言应用何种条件。涉及这类条件的其它指示在该领域能够容易 地获得,例如在Sambrooket al., 1989, MolecularCloning, A Laboratory Manual, Cold Spring HarborPress, N.Y.;和 Ausubel etal.(eds.),1995, Current Protocols in MolecularBiology, (John Wiley & Sons,N.Y.)中。
当然,仅与多聚A序列(例如mRNA的3’末端多聚(A))或互补的T (或U)残基段杂交的多核苷酸不应被包括于与本发明的核酸部分特异杂交的本发明多核苷酸中,因为这类多核苷酸会与含有多聚(A)段或其互补体的任何核酸分子(例如尤其是任何双链cDNA克隆)杂交。可以以一种典型的途径,来筛选从其它生物(例如丝状真菌,尤其是来自Trichomaceae 科、例如来自 Aspergillus 或 Penicillium 属的微生物例如 Penicilliumdecumbens)构建的cDNA文库。例如,可以通过Northern印迹针对同源的TEMER08806多核苷酸筛选Penicillium菌株。检测到与根据本发明的多核苷酸同源的转录物后,可以利用本领域技术人员公知的标准技术从分离自适当菌株的RNA构建cDNA文库。或者,可以使用能够与根据本发明的TEMER08806多核苷酸杂交的探 针来筛选总基因组DNA文库。可以例如通过进行PCR分离同源的基因序列,所述PCR使用以本文所述核苷酸序列为基础设计的两个简并寡核苷酸引物池。用于反应的模板可以是通过反转录mRNA获得的cDNA,所述mRNA从已知或怀疑表达本发明多核苷酸的菌株中制备。可以对PCR产物进行亚克隆和测序,以确保被扩增的序列代表了新TEMER08806核酸序列的序列或其功能等同物。然后可以通过多种已知方法,使用PCR片段来分离仝长cDNA克隆。例如,被扩增的片段可以被标记,并用于筛选噬菌体或粘粒cDNA文库。或者,被标记的片段可以被用于筛选基因组文库。也可以用PCR技术来从其它生物中分离全长cDNA序列。例如,可以根据标准步骤从合适的细胞或组织来源中分离RNA。可以使用特异于被扩增片段最5’端的寡核苷酸引物,引导第一链合成,针对RNA进行反转录反应。然后可以使用标准的末端转移酶反应将得到的RNA/DNA杂交体“加尾”(例如用鸟嘌呤),可以用RNase H消化所述杂交体,然后(例如用多聚-C引物)引物起始第二链合成。因此,被扩增片段上游的cDNA序列可以容易地被分离。有用的克隆策略的综述,参阅例如上文 Sambrook etal.;和上文的 Ausubel et al.。载体本发明的另一方面涉及包含编码TEMER08806多肽或其功能性等同物的本发明多核苷酸的载体,包括克隆和表达载体,还涉及在例如本发明多肽发生表达的条件下,在合适的宿主细胞中培养、转化或转染这类载体的方法。本文使用的术语“载体”指能够转运与之连接的另一核酸的核酸分子。本发明的多核苷酸可以被掺入重组的可复制载体中,例如克隆或表达载体中。载体可被用于在相容的宿主细胞中复制核酸。因此在另一实施方式中,本发明提供了如下制造本发明多核苷酸的方法:将本发明的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在使得所述载体复制的条件下培养所述宿主细胞。载体可以从宿主细胞中被回收。合适的宿主细胞在下文讨论。其中插入本发明表达盒或多核苷酸的载体可以是能够便利地进行重组DNA操作的任何载体,并且所述载体的选择通常应取决于要引入它的宿主细胞。根据本发明的载体可以是自主复制载体,即显示为染色体外实体的载体,其复制不依赖于染色体复制,例如质粒。或者载体可以是被引入宿主细胞中后被整合进宿主细胞基因组中,并与整合了它的染色体一起复制的载体。一种类型的载体是“质粒”,质粒是指其中可以连接其它DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中其它DNA区段可以被连接进病毒基因组中。某些载体在它们被引入的宿主细胞中能够自主复制(例如具有细菌复制起点的细菌载体和附加体哺乳动物载体)。其它载体(例如非附加体哺乳动物载体)在引入宿主细胞时被整合进宿主细胞的基因组中,从而随宿主细胞的基因组一起被复制。另外,某些载体能够指导与它们可操作地连接的基因的表达。这类载体在本文中被称作“表达载体”。一般而言,重组DNA技术中使用的表达载体通常是以质粒的形式存在的。术语“质粒”和“载体”在本文中可互换使用,因为质粒是最常用的载体形式。然而,本发明旨在包括这类表达载体的起等同作用的其它形式,如粘粒、病毒载体(例如复制缺陷反转录病毒、腺病毒和腺伴随病毒)和噬菌体载体。对大部分丝状真菌和酵母而言,载体或表达构建体优选地被整合进宿主细胞的基因组中,从而获得稳定的转化体。然而,对某些酵母而言还可获得合适的附加体载体,可以向其中并入表达构建体进行稳定和高水平的表达,其例子包括分别衍生自Saccharomyces和Kluyveromyces的2 μ和pKDl质粒的载体,或含有AMA序列(例如来自Aspergillus的AMA1)的载体。将表达构建体整合进宿主细胞基因组中的情况下,所述构建体被整合进基因组中随机基因座处,或者使用同源重组整合进预定的目标基因座处,在这种情况下目标基因座优选地包含高度表达的基因。因此,可用于本发明的表达载体包括来自染色体、附加体和病毒的载体,例如来自细菌质粒、噬菌体、酵母 附加体、酵母染色体元件、病毒(如杆状病毒、乳多空病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反转录病毒)的载体和来自其组合的病毒,如来自质粒和噬菌体遗传元件的病毒(如粘粒和噬菌粒)。根据本发明的载体可以体外使用,例如用于生产RNA或用于转染或转化宿主细胞。可以例如使用T7启动子调节序列和T7聚合酶体外转录和翻译重组表达载体。本发明的载体可包含两种或更多,例如三种、四种或五种本发明的多核苷酸,例如用于过表达。本发明的重组表达载体以适合核酸在宿主细胞中表达的形式包含本发明的核酸,这意味着重组表达载体含有一个或多个与待表达的核酸序列可操作地连接的调节序列,以要用于表达的宿主细胞为基础选择所述调节序列。在载体例如表达载体中,“可操作地连接”旨在表示感兴趣的核苷酸序列与调节序列以允许该核苷酸序列表达(例如在体外转录/翻译体系中或当载体被引入宿主细胞中时在宿主细胞中)的方式连接,即术语“可操作地连接”是指一种连接,其中所述组分处于允许它们以其预期方式发挥功能的关系中。与编码序列“可操作地连接”的调节序列如启动子、增强子或其它表达调节信号以下述方式放置:在与所述控制序列相容的条件下实现所述编码序列的表达;或者所述调节序列被布置为使得它们与其预期目的一致地发挥功能,例如转录在启动子处开始并通过编码多肽的DNA序列继续。针对指定宿主细胞的载体或表达构建体因此可包含以下元件,所述元件以相对于编码第一发明的多肽的序列的编码链从5’ -端到3’ -端的连续顺序彼此可操作地连接:(i)能够在给定的宿主细胞中指导编码多肽的核苷酸序列转录的启动子序列;(2)任选地,能够指导多肽从给定的宿主细胞分泌进培养基中的信号序列;(3)本发明的DNA序列,其编码成熟和优选地活性形式的、具有膨胀因子活性的多肽;和优选地还有(4)能够终止编码多肽的核苷酸序列下游转录的转录终止区(终止子)。根据本发明的核苷酸序列的下游可以是含有一个或多个转录终止位点(例如终止子)的3’非翻译区。终止子的起点较不关键。终止子可以例如对编码多肽的DNA序列而言是天然的。然而,优选地在酵母宿主细胞中使用酵母终止子并在丝状真菌宿主细胞中使用丝状真菌终止子。更优选地,终止子对宿主细胞(其中要表达编码多肽的核苷酸序列)而言是内源的。在被转录的区域中,可存在用于翻译的核糖体结合位点。构建体所表达的成熟转录本的编码部分应当包括位于要翻译的多肽起点处的翻译起始AUG和适当地位于结尾处的终止密码子。本发明多核苷酸的增强的表达也可以通过对异源调节区(例如启动子、分泌前导肽和/或终止子区)的选择来实现,所述异源调节区可发挥以下作用:提高表达宿主对感兴趣的多肽的表达水平和需要时的分泌水平,和/或提供本发明多肽表达的诱导型控制。本领域技术人员应当知道:对表达载体的设计可以以下述因素为基础,如待转化的宿主细胞的选择、期望的多肽表达水平等。本发明的载体(例如表达载体)可以被引入宿主细胞中,从而生产由本文所述的核酸编码的蛋白质或肽(例如TEMER08806多肽、TEMER08806多肽的突变体形式,其片段、变体或功能等同物)。本发明的载体(例如重组表达载体)可以被设计用于在原核细胞和真核细胞中表达TEMER08806多肽。例如,TEMER08806多肽可以在细菌细胞如E.col1、昆虫细胞(使用杆状病毒表达载体)、丝状真菌、酵母细胞、真菌细胞或哺乳动物细胞中表达。合适的宿主细胞在GoeddeliGene Expression Technology !Methods inEnzymology 185,Academic Press,SanDiego, CA(1990)中进一步讨论。适当宿主的代表性例子在下文中描述。用于上述 宿主细胞的适当培养基和条件是本领域已知的。术语“控制序列”或“调节序列”在本文中被定义为至少包括对多肽表达而言必需和/或有利地任何组件。任何控制序列对于编码多肽的本发明核酸序列而言可以是天然的或外源的。此类控制序列可包括但不限于启动子、前导序列、最适翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870中所述)、分泌信号序列、原-肽序列、多聚腺苷酸化序列、转录终止子。控制序列至少典型地包括启动子、转录和翻译终止信号。如上文所述,“可操作地连接”在本文中被定义为一种连接,其中控制序列相对于DNA序列的编码序列被适当地置于一定位置上,使得控制序列指导多肽的生产。可以为了引入特定的限制性位点而对控制序列提供连接子,所述特定的限制性位点有助于将控制序列与编码多肽的核酸序列的编码区连接。术语“可操作地连接”在本文中被定义为一种连接,其中控制序列相对于DNA序列的编码序列被适当地置于一定位置上,使得控制序列指导多肽的生产。控制序列可以是合适的启动子序列,启动子序列是被宿主细胞识别用于表达核酸序列的核酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子可以是在细胞中显示转录活性的任何核酸序列,包括突变、截短和杂种的启动子,并且可得自编码对细胞而言同源或异源的细胞外或细胞内多肽的基因。
控制序列也可以是合适的转录终止子序列,这是被丝状真菌细胞识别为终止转录的序列。终止子序列与编码多肽的核酸序列的3'-端可操作地连接。本发明中可以使用在细胞中发挥功能的任何终止子。控制序列也可以是终止子。对丝状真菌细胞而言优选的终止子得自编码以下的基因:A.0ryzae TAKA淀粉酶、A.niger葡糖淀粉酶(glaA)、A.nidulans邻氨基苯甲酸合酶、A.niger α -葡糖苷酶、trpC基因和Fusariumoxysporum膜蛋白酶样蛋白酶。控制序列也可以是合适的前导序列、对丝状真菌细胞翻译而言重要的mRNA非翻译区。前导序列与编码多肽的核酸序列的5'端可操作地连接。在细胞中发挥功能的任何前导序列可用于本发明中。对丝状真菌细胞而言优选的前导序列得自编码以下的基因:A.0ryzae淀粉酶和A.nidulans憐酸丙糖异构酶和A.niger glaA。其他控制序列可分离自Penicillium IPNS基因,或pcbC基因,β微管蛋白基因。WO 01/21779中引用的所有控制序列通过引用并入本文。控制序列也可以是多聚腺苷酸化序列,这是与核酸序列3'-端可操作地连接的序列,其转录后被丝状真菌细胞识别为对所转录的mRNA添加多聚腺苷残基的信号。本发明中可以使用在细胞中有功能的任何多聚腺苷酸化序列。对丝状真菌细胞而言优选的多聚腺苷酸化序列得自编码以下的基因:A.0ryzae TAKA淀粉酶、A.niger葡糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、Fusarium oxysporum膜蛋白酶样蛋白酶和A.niger α-葡糖苷酶。当根据本发明的多肽要从宿主细胞分泌进培养基时,可以对多肽添加适当的信号序列,从而将从新合成的多肽导向宿主细胞的分泌途径。本领域技术人员已知针对特定的宿主细胞选择适当的信号序列。信号序列对宿主细胞可以是天然的,或者对宿主细胞可以是外源的。例如,可以使用来自对宿主细胞而言天然的多肽的信号序列。优选地,所述天然的多肽是高度分泌的多肽,即以高于被分泌的多肽总量10%的量被分泌的多肽。根据本发明优选地使用的信号序列 是例如pmeA。作为信号序列的替代方式,本发明的多肽可与分泌载体多肽(carrierpolypeptide)或其部分融合。此类嵌合构建体借助于载体多肽或其部分的信号序列而被导向分泌途径。另外,载体多肽会对根据本发明的多肽提供稳定化效应,和/或可以增强溶解度。此类载体多肽可以是任何多肽。优选地,使用高度分泌的多肽作为载体多肽。载体多肽对根据本发明的多肽而言可以是天然的或外源的。载体多肽对宿主细胞而言可以是天然的或可以是外源的。此类载体多肽的例子是葡糖淀粉酶,α-交配因子的前原序列,Clostridium cellulovorans纤维素结合蛋白A的纤维素结合结构域,谷胱甘肽-S-转移酶,Bacillus circulans几丁质酶Al的几丁质结合结构域,E.coliK12的malE基因编码的麦芽糖结合结构域,β -半乳糖苷酶,和碱性磷酸酶。用于在Aspergillus细胞中表达此类嵌合构建体的一种优选的载体多肽是葡糖淀粉酶。载体蛋白和多肽可含有特定的氨基酸基序,以便于多肽的分离;根据本发明的多肽可通过专用的释放剂被释放。释放剂可以是蛋白水解酶或化学试剂。此类氨基酸基序的一个例子是KEX蛋白酶切割位点,其是本领域技术人员公知的。可以使用信号序列来协助本发明蛋白质或多肽的分泌和分离。信号序列的典型特征是疏水氨基酸核,其通常在分泌期间的一个或多个切割事件中从成熟蛋白质上被切割。这类信号肽含有加工位点,所述加工位点允许在经过分泌通路时从成熟蛋白质上切下信号序列。信号序列指导蛋白质如从转化了表达载体的真核宿主中分泌,并且随后或同时切割信号序列。然后可以通过已知方法,从细胞外介质中容易地纯化蛋白质。或者,可以使用简化纯化的序列(如具有GST结构域),将信号序列与感兴趣的蛋白质连接。因此,例如编码多肽的序列可以与简化融合多肽纯化的标记序列(如编码肽的序列)融合。在本发明这一方面的某些优选的实施方式中,标记序列是六-组氨酸肽,如PQE载体(Qiagen,Inc.)中提供的标签,以及其它,其中许多可商业获得。例如如Gentz et al,Proc.Natl.Acad.Sc1.USA86 =821-824(1989)中所述,六-组氨酸提供了融合蛋白的便利纯化。HA标签是可用于纯化的另一种肽,其对应于衍生自流感血凝素蛋白的表位,由例如Wilson et al., Cell 37:767(1984)描述。优选地,通过标准重组DNA技术生产本发明的TEMER08806融合蛋白。例如,根据常规技术将编码不同多肽序列的DNA片段以符合读码框的方式连接在一起,所述常规技术例如通过使用平末端或交错末端(stagger-ended termini)用于连接、使用限制性酶消化来提供适当的末端、适当时填平粘末端、使用碱性磷酸酶处理来避免不想要的接合,和酶促连接。在另一实施方式中,可以通过常规技术(包括自动化DNA合成仪)合成融合基因。或者,可以使用锚定引物进行基因片段的PCR扩增,所述锚定引物在两条相邻的基因片段之间产生互补性悬突,所述相邻基因片段可随后退火并被再扩增产生嵌合基因序列(参阅例如 CurrentProtoco ls in Molecular Biology, eds.Ausubel et al.John Wiley &Sons:1992)。另外,可以商业获得已经编码融合片段(例如GST多肽)的许多表达载体。TEMER08806-编码核酸可以被克隆进这样的表达载体中,从而使融合片段与TEMER08806蛋白以符合读码框的方式连接。优选地,通过宿主细胞增强的同源重组能力提高了定向整合进宿主细胞基因组中(即在预定的靶基因座中整合)的效率。细胞的此类表型优选地涉及如W02005/095624中所述的缺陷型hdfA或hdfB基因。W02005/095624公开了获得包含提高的定向整合效率的丝状真菌细胞的一种优选的方法。任选地,宿主细胞包含与野生型细胞相比提高的解折叠蛋白应答(UPR),以增强感兴趣的多肽的生产能力。可以通过US2004/0186070A1和/或US2001/0034045A1和/或W001/72783A2和/或W02005/123763中描述的技术提高UPR。更特定地,为了获得具有提高的UPR的宿主细胞,调控了 HACl和/或IREl和/或PTC2的蛋白质水平,和/或改造了SEC61蛋白质。或者,或与提高的UPR组合,对宿主细胞进行遗传修饰,以获得与野生型细胞相比展示更低蛋白酶表达和/或蛋白酶分泌的表型,从而增强感兴趣的多肽的生产能力。此类表型可以通过蛋白酶表达的转录调节子的缺失和/或修饰和/或失活来获得。此类转录调节子可以是例如prtT。通过调控prtT来降低蛋白酶的表达可以通过US2004/0191864A1中描述的技术进行。或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌的表型组合,宿主细胞展示了草酸盐缺陷型表型,从而增强感兴趣的多肽的生产产量。草酸盐缺陷型表型可以通过W02004/070022A2中描述的技术获得。或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型组合,宿主细胞展示了与野生型相比的表型差异的组合,以增强感兴趣的多肽的生产产率。这些差异可包括但不限于,降低的葡糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B蛋白酶和草酸水解酶的表达。宿主细胞展示的所述表型差异可以通过根据US2004/0191864A1中所述技术的遗传修饰获得。
或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型和雨野生型相比为了增强感兴趣的多肽生产产率的表型差异的组合相组合,宿主细胞展示毒素基因的缺陷,使得丝状真菌宿主细胞失去表达毒素的能力。此类毒素包括但不限于,赭曲毒素,烟曲霉毒素,环并偶氮酸(cyclapiazonic acid),3-硝基丙酸,布洛芬,畸形素,黄曲霉毒素和黑麦酸。此类缺陷优选地例如描述于W02000/039322中。(过)表达在一个优选的实施方式中,与其中本文所述的本发明的多核苷酸未被过表达的亲本微生物菌株相比,所述基因可以在本发明的微生物菌株中被过表达。多核苷酸序列的过表达在本文中被定义为所述序列基因的表达,所述表达导致微生物菌株中所述序列编码的酶活性是亲本微生物中酶活性的至少约1.5倍;优选地所述酶活性是亲本微生物中酶活性的至少约2倍,更优选地至少约3倍,更优选地至少约4倍,更优选地至少约5倍,进一步更优选地至少约10倍,最优选地至少约20倍。载体可还包括产生RNA的多核苷酸侧翼的序列,所述侧翼的序列包含与真核基因组序列或病毒基因组序列同源的序列。这会允许将本发明的多核苷酸引入宿主细胞的基因组中。整合型克隆载体可在整合了它的宿主细胞染色体中随机整合或在预定的靶基因座处整合。在本发明的一个优选的实施方式中,整合型克隆载体可包含与宿主细胞基因组中预定的靶基因座中的DNA序列同源的DNA片段,用于将克隆载体的整合靶向所述预定的基因座。为了促进定向整合,在转化宿主细胞之前优选地将克隆载体线性化。优选地以下述方式进行线性化,所述方式使得克隆载体的至少一端,优选地任一端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选地至少约0.lkb,例如至少约0.2kb,更优选地至少约0.5kb,进一步更优选地至少约Ikb,最优选地至少约2kb。优选地,可如W005/095624和/或W02007/115886中所述,为了经改进的定向DNA整合频率修饰亲本宿主菌株。本发明中提供的缺失例子使用基因的启动子作为5’-侧翼,使用基因作为3’-侧翼,从而在启动子和基因之间插入选择标记物,进而破坏(即功能性失活)基因转录。上文给出的基因序列可被用于制造类似地功能失活的基因。基因可以被一分为二,得到5’ -侧翼和3’ -侧翼,但是基因也可以被用于克隆含有基因启动子和终止子区的基因组DNA的大片段,所述启动子和终止子区随后可发挥5’ -侧翼和3’ -侧翼的功能。载体系统可以是单个载体例如单个质粒,或两个或更多个载体,例如两个或更多个质粒,它们一起含有要被引入宿主细胞基因组中的总DNA。载体可以反义方向含有本发明的多核苷酸,以提供反义RNA的生产。可以通过常规的转化或转染技术将载体DNA引入原核或真核细胞中。本文使用的术语“转化”和“转染”旨在表示用于向宿主细胞中引入外源核酸(例如DNA)的多种本领域公认的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖-介导的转染、转导、感染、月旨质转染、阳离子脂质介导的转染或电穿孔。用于转化或转染宿主细胞的合适方法可见于Sambrook,et al.(Molecular Cloning:A Laboratory Manual,2nd,ed.ColdSpring HarborLaboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY,1989),Davis et al., Basic Methods in Molecular Biology (1986)和其它实验室手册中。对于哺乳动物细胞的稳定转染而言,已知取决于使用的表达载体和转染技术,只有非常小的细胞级分可以将外源DNA整合进它们的基因组中。为了鉴定并选择这些整合体,通常将编码可选择标记(例如抗性或抗生素)的基因与感兴趣的基因一起引入宿主细胞中。优选的可选择标记包括但不限于赋予药物抗性或补足宿主细胞缺陷的可选择标记。它们包括例如可用于转化大部分丝状真菌和酵母的通用标记基因,如乙酰胺酶基因或cDNA (来自 A.nidulans、A.0ryzae 或 A.niger 的 amdS、niaD、facA基因或 cDNA),或提供抗生素抗性如G418、潮霉素、博来霉素、卡那霉素、甲氨喋呤、腐草霉素或苯菌灵抗性(benA)的基因。或者,可以使用特异性选择标记,如需要相应突变体宿主菌株的营养缺陷型标记,例如URA3(来自S.cerevisiae或来自其它酵母的类似基因)、pyrG或pyrA (来自A.nidulans或A.niger)、argB (来自A.nidulans或A.niger)或trpC。在一个优选的实施方式中,在引入表达构建体后从经转化的宿主细胞中缺失选择标记,从而获得能够生产下述多肽的经转化的宿主细胞,所述多肽不含选择标记基因。其它标记包括ATP合成酶、亚基9(oliC)、乳清苷-5'-磷酸脱羧酶(pvrA)、细菌G418抗性基因(这也可在酵母中使用,但是不能在真菌中使用)、氨苄西林抗性基因(E.coli)、新霉素抗性基因(Bacillus)、来自Streptomyces nursei的诺尔丝菌素抗性基因natl、Aspergillus oryzae的卩比唳硫胺抗性基因ptrA以及编码β -葡糖醒酸糖苷酶(GUS)的Ε.coli UidA基因。载体可以体外使用,例如用于生产RNA或用于转染或转化宿主细胞。蛋白质在原核生物中的表达常在Ε.coli中用下述载体完成,所述载体含有指导融合蛋白或非融合蛋白表达的组成型或诱导型启动子。融合载体对其中编码的蛋白质、例如对重组蛋白的氨基端添加大量氨基酸。这类融合载体典型地具有三个目的:1)提高重组蛋白的表达;2)提高重组蛋白的溶解度;3)通过在亲和层析中发挥配体作用来帮助纯化重组蛋白。通常在融合表达载体中,在融合片段和重组蛋白的接合处引入蛋白水解切割位点,使得能够在融合蛋白的纯化后将重组蛋白与融合片段分开。如所指出的,表达载体优选地含有可选择标记。这类标记包括用于真核细胞培养的二氢叶酸还原酶或新霉素抗性,和用于在Ε.coli和其它细菌中培养的四环素或氨苄西林抗性。优选用于细菌的载体例如公开于W0-A1-2004/074468中,所述文献通过引用并入本文。其它合适的载体应是技术人员容易知道的。为了将翻译的蛋白质分泌进入内质网腔中、进入壁膜间隙中或进入细胞外环境中,可以向被表达的多肽中整合进适当的分泌信号。所述信号对多肽可以是同源的或它们可以是异源信号。TEMER08806多肽可以以经修饰的方式(例如作为融合蛋白)被生产,并可不仅含有分泌信号而且含有额外的异源功能区。因此,例如额外氨基酸区(尤其是带电荷的氨基酸)可被添加至多肽的 N端,以促进纯化期间或随后的操作和储存期间在宿主细胞中的稳定性和持久性。还可向多肽添加肽基元,以便于纯化。
本发明提供了经分离的多肽,所述多肽具有根据SEQ ID NO:2的氨基酸序列,和能够通过在合适的宿主中表达SEQ ID NO:1的多核苷酸获得的氨基酸序列。包含上述多肽的变体(例如功能等同物)的肽或多肽也包括在本发明内。上述多肽集体包含在术语“本发明的多肽”中。术语“变体肽”或“变体多肽”在本文中被定义为分别在肽或多肽的一个或多个特定位置上包含一个或多个改变(例如一个或多个特定氨基酸残基的取代、插入、缺失和/或截短)的肽或多肽。相应地,变体信号肽是在信号肽的一个或多个特定位置上包含一个或多个改变(例如一个或多个特定氨基酸残基的取代、插入、缺失和/或截短)的信号肽。术语“多核苷酸”与术语“核酸分子”相同,并且在本文中可互换理解。该术语是指多核苷酸分子,其为单链或双链的核糖核酸(RNA)或脱氧核糖核酸(DNA)分子。多核苷酸可以分离形式存在,或者可包含在重组核酸分子或载体中,或包含在宿主细胞中。术语“变体多核苷酸”在本文中被定义为在多核苷酸中一个或多个特定位置上包含一个或多个改变(例如一个或多个核苷酸的取代、插入、缺失和/或截短)的多核苷酸。术语“肽”和“寡肽”被认为是同义的(如其通常被认为的那样),且当上下文需要表示通过肽键偶合的至少两个氨基酸链时,每个术语可以互换使用。词语“多肽”在本文中使用表示含有多于七个氨基酸残基的链。所有的寡肽和多肽式或序列在本文中从左到右和从氨基端到羧基端的方向书写。本文使用的单字母氨基酸代码是本领域普遍已知的,并可见于 Sambrook, et al.(Molecular Cloning:A Laboratory Manual, 2nd, ed.ColdSpringHarbor Laboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY,1989)o“分离的”多肽或蛋白质表示被从其天然环境中取出的多肽或蛋白质。例如,就本发明的目的而言,在宿主细胞中表达的重组产生的多肽和蛋白质被认为是分离的,与通过任何合适的技术已基本纯化 的天然或重组多肽一样,所述合适的技术例如Smith andJohnson, Gene 67:31-40 (1988)中公开的单步骤纯化方法。根据本发明的TEMER08806膨胀因子多肽可以通过本领域已知的方法从重组细胞培养物中回收和纯化。最优选地,使用高效液相色谱(“HPLC”)进行纯化。本发明的多肽包括天然纯化的产物、化学合成步骤的产物,和通过重组技术从原核或真核宿主生产的产物,所述宿主包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞。取决于重组生产步骤中使用的宿主,可以将本发明的多肽糖基化或不糖基化。另外,本发明的多肽也可以包含最初被修饰的残基(在一些情况下由宿主介导的过程产生)。本发明还包括根据本发明的多肽的生物活性片段。本发明的多肽的生物活性片段包括包含下述氨基酸序列的多肽,所述氨基酸序列与TEMER08806多肽的氨基酸序列(例如SEQ ID NO:2的氨基酸序列)足够相同或来自后者,所述片段包含比全长多肽更少的氨基酸但是显示相应的全长多肽的至少一种生物活性。典型地,生物活性片段包含具有TEMER08806多肽的至少一种活性的结构域或基序。本发明的多肽的生物活性片段可以是长度为例如约10、约25、约50、约100或更多个氨基酸,或长度至少约100个氨基酸、至少约150、200、250、300、350、400个氨基酸,或长度多达本发明多肽氨基酸总数的多肽。另外,其它生物活性部分(其中多肽的其它区域被缺失)可以通过重组技术被制备,并针对本发明多肽的天然形式的一种或多种生物活性做出评价。本发明还包括编码TEMER08806多肽的上述生物活性片段的核酸片段。多肽在本发明的另一方面中,提供了经改进的TEMER08806多肽。经改进的TEMER08806多肽是其中至少一种生物活性被改进的多肽。这类多肽可以如下获得:沿全部或部分TEMER08806编码序列随机地引入突变(例如通过饱和诱变),重组表达得到的突变体并针对生物活性进行筛选。导致经改进的膨胀因子功能的本发明氨基酸序列经改进的变体可通过本发明的相应基因获得。此类修饰包括:1.易错PCR以引入随机突变,之后筛选获得的变体并分离具有经改进的动力学特性的变体2.编码膨胀因子酶的基因相关变体的家族改组,之后筛选获得的变体并分离具有经改进的动力学特性的变体导致提高的mRNA和/或多肽水平、导致更多膨胀因子活性的本发明的基因变体可通过所述基因的多核苷酸序列获得。此类修饰包括:1.以下述方式改进密码子使用,所述方式使得密码子(最适地)适合亲本微生物宿主。2.以下述方式改进密码子对使用,所述方式使得密码子(最适地)适合亲本微生物宿主 3.对编码膨胀因子多肽的基因组信息添加稳定化序列,导致具有提高的半哀期的mRNA分子分离具有经改进的催化特性或提高的mRNA或蛋白质水平的变体的优选方法描述于TO03/010183和W003/01311中。优化亲本微生物菌株中密码子使用的优选方法描述于PCT/EP2007/05594中。对编码本发明的膨胀因子多肽的基因添加稳定化元件的优选方法描述于 W02005/059149 中。在一个优选的实施方式中,TEMER08806多肽具有根据SEQ ID NO:2的氨基酸序列。在另一实施方式中,TEMER08806多肽与根据SEQ ID NO:2的氨基酸序列基本同源,并保留根据SEQ ID NO:2的多肽的至少一种生物活性,但是由于所述的天然变异或诱变而在
氨基酸序列上有差异。在又一个优选的实施方式中,TEMER08806多肽具有由下述经分离的核酸片段编码的氨基酸序列,所述经分离的核酸片段能够与根据SEQ IDNO:1的核酸优选地在高度严格的杂交条件下杂交。因此,TEMER08806多肽优选地是包含下述氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2所示氨基酸序列至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %或更多同源,典型地,保留根据SEQ ID NO:2的多肽的至少一种功能活性。也可以如下文所述来鉴定根据本发明的多肽的功能等同物:例如,针对膨胀因子活性,筛选本发明多肽的突变体(例如截短突变体)的组合文库。在一个实施方式中,通过核酸水平上的组合诱变产生有斑文库(variegated library)。可以通过例如将合成的寡核苷酸混合物酶连接为基因序列来产生变体的有斑文库,从而可能的多肽序列的简并集合(degenerateset)可作为个体多肽表达,或者作为一组更大的融合蛋白表达(例如用于噬菌体展示)。存在可用于从简并寡核苷酸生产本发明多肽的可能变体文库的多种方法。用于合成简并寡核苷酸的方法是本领域已知的(见例如Narang(1983) Tetrahedron 39:3;ltakura et al.(1984)Annu.Rev.Biochem.53:323 ;ltakura et al.(1984)Science 198:1056 ;Ike et al.(1983)Nucleic AcidRes.11:477)。另外,本发明多肽的编码序列的片段文库可以被用于产生有斑的多肽群,用于筛选随后的变体选择。例如,可以如下产生编码序列片段的文库:在每个分子仅发生约一次切割的条件下用核酸酶处理感兴趣的编码序列的双链PCR片段,变性双链DNA,将DNA复性形成双链DNA (其可包含来自被不同切割的产物的有义/反义对),通过用SI核酸酶处理从再形成的双链体上去除单链部分,并将得到的片段文库连接进表达载体中。通过该方法,可以得到下述表达文库,所述表达文库编码感兴趣的蛋白质的不同大小的N-末端和内部片段。本领域已知有若干种技术可用于筛选组合文库(其通过截短的点突变制造)的基因产物,和用于筛选cDNA文库以获得具有选定特性的基因产物。用于筛选大基因文库的、适用于高通量分析的、最广泛使用的技术典型地包括:将基因文库克隆进可复制的表达载体中,用得到的载体文库转化合适的细胞,和在下述条件下表达组合基因,所述条件下想要的活性的检测简化编码基因(其产物被检测)的载体的分离。循环总体诱变(Recursiveensemble mutagenesis, REM),—种增强文库中功能突变体频率的技术,可以与筛选实验组合使用以鉴定本发 明多妝的变体(Arkin andYourvan (1992)Proc.Natl.Acad.Sc1.USA 89:7811-7815 ;Delgrave et al.(1993)Protein Engineering 6(3):327-331)。除了 SEQ ID NO:1中所示的TEMER08806基因序列外,本领域技术人员应当知道给定的种群中可存在DNA序列多态,所述多态导致TEMER08806多肽氨基酸序列中的改变。这类遗传多态性可存在于来自不同种群的细胞中或由于天然等位基因变异而存在于一个种群中。等位基因变体也可包括功能等同物。根据本发明的多核苷酸的片段也可包括不编码功能多肽的多核苷酸。这类多核苷酸可作为PCR反应的探针或引物作用。根据本发明的核酸无论是编码功能多肽还是无功能的多肽,均可被用作杂交探针或聚合酶链式反应(PCR)引物。不编码具有TEMER08806活性的多肽的本发明核酸分子的用途尤其包括:(I)从cDNA文库分离编码TEMER08806多肽的基因或其等位基因变体,所述cDNA文库例如来自合适的微生物;(2)与中期染色体涂片原位杂交(例如FISH)以提供 TEMER08806 基因的精确染色体定位,如 Verma et al.,HumanChromosomes:a Manual ofBasic Techniques, Pergamon Press, New York(1988)所述;(3)Northern 印迹分析,用于检测TEMER08806 mRNA在特定组织中的表达;和4)能够被用作诊断工具来分析给定的生物(例如组织)样品中核酸存在的探针和引物,所述核酸能与TEMER08806探针杂交。本发明还包括获得TEMER08806基因功能等同物的方法。这类方法需要获得被标记的含有被分离的核酸的探针,所述被分离的核酸编码根据SEQ ID NO:2的多肽序列或其任何变体的全部或部分;在允许探针与文库中的核酸片段杂交从而形成核酸双链体的条件下,用被标记的探针筛选核酸片段文库,和从任何被标记的双链体中的核酸片段制备全长的基因序列,以获得与TEMER08806基因相关的基因。在一个实施方式中,本发明的TEMER08806核酸与SEQ ID NO:1中所示的核酸序列或其互补体至少78 %、至少79 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更加同源。本发明进一步提供了包含本发明多核苷酸或载体的宿主细胞。所述多核苷酸对宿主细胞的基因组可以是异源的。通常涉及宿主细胞的术语“异源的”表示多核苷酸不天然存在于宿主细胞的基因组中,或者多肽不由所述细胞天然地生产。在另一实施方式中,本发明包括细胞,例如含有本发明所包括的核酸的经转化的宿主细胞或重组的宿主细胞。“经转化的细胞”或“重组细胞”是其中(或其祖先中)已经借助于重组DNA技术引入了本发明核酸的细胞。原核和真核细胞均包括在内,例如细菌、真菌、酵母等等,特别优选的是来自丝状真菌(例如Aspergillus niger或Talaromycesemersonii)的细胞。可选用调控插入序列表达并以特异的、期望的方式加工基因产物的宿主细胞。蛋白质产物的这类修饰(例如糖基化)和加工(例如切割)可促进蛋白质发挥最佳功能。多种宿主细胞具有用于翻译前加工和修饰蛋白质和基因产物的特性和特异机制。可选用分子生物学和/或 微生物学领域技术人员熟悉的适当细胞系或宿主系统,以确保对所表达的外源蛋白质的想要的和正确的修饰与加工。为此,可以使用具有下述细胞机制的真核宿主细胞,所述细胞机制用于适当地加工原始转录本、糖基化和磷酸化基因产物。这类宿主细胞是本领域公知的。 如果需要的话,可以在根据本发明的多肽的制备中使用上述细胞。这样的方法典型地包含在提供编码多肽的编码序列(的载体)表达的条件下培养宿主细胞(例如用上述表达载体转化或转染的),并任选地回收被表达的多肽。可以将本发明的多核苷酸并入重组可复制载体例如表达载体中。可以使用载体在相容的宿主细胞中复制核酸。因此在又一个实施方式中,本发明提供了如下制造本发明多核苷酸的方法:将本发明的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在使得所述载体复制的条件下培养所述宿主细胞。可以从所述宿主细胞中回收载体。优选地,多肽作为分泌型蛋白质被生产,在这种情况下,表达构建体中编码多肽成熟形式的核苷酸序列与编码信号序列的核苷酸序列可操作地连接。优选地,信号序列对编码多肽的核苷酸序列而言是天然的(同源的)。或者,信号序列对编码多肽的核苷酸序列而言是外来的(异源的),在这种情况下信号序列优选地对其中表达本发明核苷酸序列的宿主细胞而言是内源的。对酵母宿主细胞而言合适的信号序列的例子是衍生自酵母a-因子基因的信号序列。类似地,对丝状真菌宿主细胞而言合适的信号序列是例如衍生自丝状真菌淀粉葡萄糖苷酶(AG)基因例如A.niger glaA基因的信号序列。这可与淀粉糖苷酶(也称作(葡糖)淀粉酶)启动子自身组合使用,以及与其它启动子组合使用。在本发明上下文中也可以使用杂种信号序列。优选的异源分泌前导序列是来自于真菌淀粉葡萄糖苷酶(AG)基因(glaA-例如来自Aspergillus的18和24个氨基酸版本)、a -因子基因(酵母,例如Saccharomyces和Kluyveromyces)或α -淀粉酶基因(Bacillus)的分泌前导序列。可如上文所述将载体转化或转染进合适的宿主细胞中,以提供本发明多肽的表达。该方法可包括在提供编码本发明多肽的编码序列的载体表达的条件下培养宿主细胞,所述宿主细胞用如上所述的表达载体转化。宿主细胞本发明因此提供了用本发明多核苷酸或载体转化或转染的或包含本发明多核苷酸或载体的宿主细胞。优选地,所述多核苷酸被包含在用于复制和表达多核苷酸的载体中。应选择与所述载体相容的细胞,并且其可以是原核(例如细菌)、真菌、酵母或植物细胞。可以选择异源宿主,其中本发明的多肽以基本不含其它纤维素降解酶或半纤维素降解酶的形式被生产。这可以通过选择正常情况下不生产此类酶的宿主来实现。本发明包括通过编码多肽的DNA序列的重组表达来生产本发明多肽的方法。就这一目的而言,本发明的DNA序列可用于基因扩增和/或改变表达信号如启动子、分泌信号序列,从而允许合适同源或异源宿主细胞中多肽的经济生产。同源宿主细胞是下述宿主细胞,其与DNA序列衍生自的物种是相同物种或是相同物种内的变体。合适的宿主细胞优选地是原核微生物如细菌,或更优选地是真核生物,例如真菌,如酵母或丝状真菌,或植物细胞。通常,酵母细胞是超过真菌细胞优选的,因为它们更易于操作。然而,一些蛋白质在酵母中分泌较差,或者在一些情况下不被正确加工(例如酵母中的超糖基化)。在这些情况下,应当选择真菌宿主生物。宿主细胞可过表达多肽,并且用于进行过表达的技术是公知的。宿主细胞因此可具有两个或更多拷 贝的编码多核苷酸(因此载体可相应地具有两个或更多拷贝)。来自Bacillus属的细菌非常适合作为异源宿主,因为它们能够将蛋白质分泌进培养基中。适合作为宿主的其它细菌是来自Streptomyces和Pseudomonas属的细菌。用于表达编码多肽的DNA序列的一种优选的酵母宿主细胞是Saccharomyces、Kluyveromyces、Hansenula、Pichia、Yarrowia 和 Schizosaccharomyces 的属。更优选地,酵母宿主细胞选自由Saccharomyces cerevisiae、Kluyveromyceslactis (也已知为 Kluyveromycesmarxianus var.lactis)、Hansenulapolymorpha、Pichiapastoris、Yarrowia lipolytica 和 Schizosaccharomyces pombe 物种组成的组。然而,最优选的是(例如丝状)真菌宿主细胞。优选的丝状真菌宿主细胞选自由 Aspergillus、Trichoderma/Hypocrea、Fusarium、Disporotrichum、Penicillium、Acremonium、Neurospora、Thermoascus、Myceliophtora、Sporotrichum、Thielavia、Chryosporium、Fusarium、Humicola、Neurospora 和 Talaromyces 属组成的组。更优选地,丝状真菌宿主细胞是下属种。所述种包括但不限于Aspergillusniger、Aspergillu sawamori> Aspergillus tubingensis、AspergiIlusacuIeatus>Aspergillus foetidus、Aspergillus nidulans、Aspergillusjaponicus> Aspergillusoryzae 和 Aspergillus ficuum、Trichodermareesei/Hypocrea jecorina、Fusariumgraminearum>Talaromyces emersoni1、Penicillium decumbens、Acremonium alabamense、Neurospora crassa、Myceliophtora thernaophilurr1、Sporotrichum cellulophilum、Disporotrichumdimorphosporum、Talaromyces emersoni1、Talaromyces stipitatus 和Thielavia terrestris。
根据本发明的宿主细胞包括植物细胞,因此本发明扩展至含有一个或多个本发明细胞的转基因生物,如植物及其部分。所述细胞可异源表达本发明的多肽,或可异源地含有一个或多个本发明的多核苷酸。转基因(或经遗传修饰的)植物可因此在其基因组中(例如稳定地)插入了编码一个或多个本发明多肽的序列。可以使用已知技术,例如使用来自Agrobacterium tumefaciens的Ti或Ri质粒,进行植物细胞的转化。质粒(或载体)可因此含有感染植物必需的序列,并且可以使用Ti和/或Ri质粒的衍生物。或者,可进行植物部分例如叶、根或茎的直接感染。在该技术中,例如如下对要被感染的植物造成创伤:用刀片切割植物、或用针穿刺植物或用磨蚀剂摩擦植物。然后用Agrobacterium接种伤口。然后可在合适的培养基上培养植物或植物部分,并允许其发育成为成熟的植物。可通过已知技术实现经转化的细胞成为经遗传修饰的植物的再生,例如通过使用抗生素选择经转化的枝条,并将枝条接种在含有适当营养素、植物激素等等的培养基上来实现。本发明因此还包括被修饰为表达本发明的膨胀因子多肽或其变体的细胞。这类细胞包括经瞬时修饰的,或优选地经稳定修饰的高级真核细胞系,例如哺乳动物细胞或昆虫细胞,低级真核细胞,例如酵母和丝状真菌细胞,或原核细胞例如细菌细胞。还可能本发明的多肽在细胞系中或膜上(例如在杆状病毒表达系统中)被瞬时表达。适合表达根据本发明的多 肽的此类系统也包括在本发明的范围内。根据本发明,本发明多肽的生产可以通过在便利的营养发酵培养基中培养微生物表达宿主来实现,所述微生物表达宿主已用一种或多种本发明的多核苷酸转化。多肽/酶生产可使用本领域已知的步骤培养根据本发明的重组宿主细胞。对启动子和宿主细胞的每种组合而言,可以获得有助于编码多肽的DNA序列表达的培养条件。达到期望的细胞密度或多肽滴度后,停止培养并使用已知的步骤回收多肽。发酵培养基可含有已知的培养基,所述培养基含有碳源(例如葡萄糖、麦芽糖、糖蜜、淀粉、纤维素、木聚糖、果胶、木质纤维素生物质水解产物等等)、氮源(例如硫酸铵、硝酸铵、氯化铵等等)、有机氮源(例如酵母提取物、麦芽提取物、蛋白胨等等)和无机氮源(例如磷酸镁、磷酸钾、磷酸锌、磷酸铁等等)。任选地可以包括诱导剂(例如纤维素、果胶、木聚糖、麦芽糖、麦芽糖糊精或聚木糖半乳糖醒酸(xylogalacturonan))。对合适培养基的选择可基于表达宿主的选择和/或基于表达构建体的调节需求来进行。这类培养基是本领域技术人员已知的。需要时,培养基可含有额外的组分,所述额外的组分对经转化的表达宿主的偏好优于其它可能的污染微生物。可根据任何已知的程序进行通过转化的宿主(发酵)的多肽生产。生产时间可在从约0.5到约30天的周期上进行。发酵可以是分批、连续或补料分批的过程,在0-100°C或0-80°C范围内,例如从约0°C到约60°C的合适温度下,和/或例如在从约2到约10或从约3到约9的pH下。优选的发酵条件是从约20°C到约55°C之间范围内的温度和/或从约3到约5之间的pH。适当的条件通常基于表达宿主的选择和要表达的多肽来选择。发酵后,如果必须的话,可通过离心或过滤从发酵液中去除细胞。发酵停止或去除细胞后,可随后回收本发明的多肽,并且需要时通过常规手段纯化和分离。多肽/酶组合物
本发明提供了包含本发明的多肽和纤维素酶和/或半纤维素酶和/或果胶酶的组合物。当本发明的多肽是纤维素酶时,除了本发明的多肽以外,本发明的组合物会典型地包含半纤维素酶和/或果胶酶。当本发明的多肽是半纤维素酶时,除了本发明的多肽以外,本发明的组合物会典型地包含纤维素酶和/或果胶酶。当本发明的多肽是果胶酶时,除了本发明的多肽以外,本发明的组合物会典型地包含纤维素酶和/或半纤维素酶。本发明的组合物可包含一类、两类或三类或更多类的纤维素酶,例如内切-1,4-β-葡聚糖酶(EG)、外切-纤维二糖水解酶(CBH)和β-葡糖苷酶(BG)中的一种、两种或所有。本发明的组合物可包含具有相同酶活性的多肽,例如与本发明多肽提供的活性相同类型的纤维素酶、半纤维素酶和/或果胶酶活性。本发明的组合物可包含与本发明的多肽提供的活性不同类型的纤维素酶活性和/或半纤维素酶活性和/或果胶酶活性。例如,本发明的组合物可包含本发明多肽提供的一种类型的纤维素酶和/或半纤维素酶活性和/或果胶酶活性和其他半纤维素酶/果胶酶提供的另一种类型的纤维素酶和/或半纤维素酶活性和/或果胶酶活性。在本文中,纤维素酶是能够降解纤维素的任何多肽。能够降解纤维素的多肽是能够催化下述过程的多肽:将纤维素降解成更小的单元,例如部分地降解成纤维素糊精,或者完全降解成葡萄糖单体。与纤维素酶接触时,根据本发明的纤维素酶可得到纤维素糊精与葡萄糖单体的混合种群。此类降解将典型地通过水解反应而发生。

本文中,半纤维素是能够降解半纤维素的任何多肽。也就是说,半纤维素酶可以能够降解木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖之一种或多种。能够降解半纤维素的多肽是能够催化下述过程的多肽:将半纤维素降解成更小的多糖,例如部分地降解成寡糖,或者完全降解成糖单体,例如己糖或戊糖单体。与半纤维素酶接触时,根据本发明的半纤维素酶可得到寡糖与糖单体的混合种群。此类降解将典型地通过水解反应而发生。本文中,果胶酶是能够降解果胶的任何多肽。能够降解果胶的多肽是能够催化下述过程的多肽:将果胶降解成更小的单元,例如部分地降解成寡糖,或者完仝降解成糖单体。与果胶酶接触时,根据本发明的果胶酶可得到寡糖与糖单体的混合种群。此类降解将典型地通过水解反应而发生。因此,本发明的组合物可包含任何纤维素酶,例如纤维二糖水解酶,内切-1,4-葡聚糖酶,β-葡糖苷酶或β_(1,3) (1,4)_葡聚糖酶。本文中,纤维二糖水解酶是能够催化纤维素或纤维四糖中I,4_β-D-葡糖苷键水解、从链的末端释放纤维二糖的任何多肽。所述酶也可以被称作纤维素酶1,4-β-纤维二糖苷酶(1,4_β -cellobiosidase),1,4_β -纤维二糖水解酶,1,4-β -D-葡聚糖纤维二糖水解酶,微晶纤维素酶(avicelase),外切_1,4_ β-D-葡聚糖酶,外切-葡聚糖酶或外切葡聚糖酶。其可具有EC编码EC3.2.1.91。纤维二糖水解酶可细分为纤维二糖水解酶I (CBHI)和纤维二糖水解酶II (CBH II)。CBH I被定义为主要从还原端水解纤维素、分裂出纤维二糖的纤维二糖水解酶。CBH II被定义为主要从非还原端水解纤维素、分裂出纤维二糖的纤维二糖水解酶。本文中,内切-β_1,4-葡聚糖酶(EC 3.2.1.4)是能够催化纤维素、地衣淀粉或谷类β-D-葡聚糖中1,4-β-D-葡糖苷键内切水解的任何多肽。此类多肽也可以能够水解还含有1,3_键的β-D-葡聚糖中的1,4_键。所述酶也可以被称作纤维素酶、微晶纤维素酶、β_1,4-内切葡聚糖水解酶、β-1,4-葡聚糖酶、羧甲基纤维素酶、纤维糊精酶、内切-1,4- β -D-葡聚糖酶、内切-1,4- β -D-葡聚糖水解酶、内切-1,4- β -葡聚糖酶或内切葡聚糖酶。本文中,CEA是基于其3D结构被归类在糖基水解酶家族5 (GH5)下的内切葡聚糖酶EC3.2.1.4。GH5家族成员的已知活性包括壳聚糖酶(EC 3.2.1.132)、β -甘露糖苷酶(EC 3.2.1.25)、纤维素酶(EC 3.2.1.4)、葡聚糖 1,3-β-葡糖苷酶(EC3.2.1.58)、地衣淀粉酶(Iicheninase) (EC 3.2.1.73)、葡聚糖内切 _1,6_β -葡糖苷酶(EC 3.2.1.75)、甘露聚糖内切-β-1,4-甘露糖苷酶(EC 3.2.1.78)、内切-β-1,4-木聚糖酶(EC 3.2.1.8)、纤维素β-1,4-纤维二糖苷酶(EC 3.2.1.91)、内切-β-1,6-半乳聚糖酶(EC 3.2.1.-)、β-1,3-甘露聚糖酶(EC 3.2.1.-)、木糖葡聚糖-特异性内切-β_1,4-葡聚糖酶(EC
3.2.1.151)、甘露聚糖转糖基酶(EC 2.4.1.-)活性。本文中CEB是基于其3D结构被归类在糖基水解酶家族7 (GH7)下的内切葡聚糖酶EC 3.2.1.4。GH7家族成员的已知活性包括内切-β -1,4-葡聚糖酶( EC 3.2.1.4),[对还原末端起作用的]纤维二糖水解酶(EC3.2.1.-)、壳聚糖酶(EC 3.2.1.132)、内切-β-1,3-1,4-葡聚糖酶(EC 3.2.1.73)活性。本文中,β-葡糖苷酶(缩写为BG) (EC 3.2.1.21)是能够催化末端、非还原性β-D-葡萄糖残基水解并释放β-D-葡萄糖的任何多肽。这样的多肽可具有针对β-D-葡糖苷的广泛特异性,并且也可以水解以下一种或多种:β -D-半乳糖苷、a -L-阿拉伯糖苷、β-D-木糖苷或β-D-岩藻糖苷。所述酶也可以被称作苦杏仁苷酶、β-D-葡糖苷葡糖水解酶、纤维二糖酶或龙胆二糖酶。本文中,β_(1,3) (1,4)_葡聚糖酶(EC 3.2.1.73)是能够催化含有1,3_和1,4-键的β-D-葡聚糖中I,4-β-D-葡糖苷键水解的任何多肽。此类多肽可作用于地衣淀粉和谷类β-D-葡聚糖,但不作用于仅含1,3-或1,4-键的β-D-葡聚糖。所述酶也可以被称作地衣淀粉酶(licheninaSe),l,3-l,4-13-D-葡聚糖4-葡聚糖水解酶,β -葡聚糖酶,内切-β-1,3-1,4葡聚糖酶,地衣多糖酶(Iichenase)或混合键β -葡聚糖酶。这类酶的替代方案是被描述为内切-1,3 (4)-β-葡聚糖酶的EC 3.2.1.6。当下述葡萄糖残基在C-3处被自身取代时,这类酶水解β -D-葡聚糖酶中的I,3-键或I,4-键,所述葡萄糖残基的还原基团涉及要水解的键。替代性的名称包括内切_1,3-β-葡聚糖酶,昆布多糖酶,1,3-(1,3 ;l,4)-13-D-葡聚糖3(4)葡聚糖水解酶,底物包括昆布多糖,地衣淀粉和谷类β-D-葡聚糖。根据本发明的组合物可包含GH61家族酶或具有增强纤维素酶的活性的任何其他酶。本文中增强纤维素酶的活性被定义为增强至少一种纤维素酶的活性。当本发明的膨胀因子蛋白在具有一种或多种纤维素酶的混合物中,例如在具有纤维二糖水解酶(CBH)和β_葡糖苷酶(BG)的混合物中存在时,其会增强这些纤维素酶的活性,这会导致降解纤维素的混合物的活性更高。基于家族成员(内切葡聚糖酶(EC 3.2.1.4))中的非常弱的内切-l,4-b-D-葡聚糖酶活性的测量,GH61家族中的酶最初被归类为糖苷水解酶家族。当然这些酶的结构和作用模式不是典型的并且它们不能被认作真正的糖苷酶。但是,当与纤维素酶或纤维素酶的混合物连起来使用时,基于其增强木质纤维素分解的能力,它们被保留在 CAZy 种类中。在 Harris,PV et al,Biochemistry 2010,49,3305-3316 的图 5 中给出了GH61家族的已知成员的综述。本发明的组合物可以包含任何半纤维素酶,例如内切木聚糖酶、木糖苷酶、a -L-阿拉伯呋喃糖苷酶、a -D-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、α -半乳糖苷酶、β -半乳糖苷酶、β -甘露聚糖酶或β -甘露糖苷酶。本文中,内切木聚糖酶(EC 3.2.1.8)是能够催化木聚糖中1,4_β -D-木糖苷键内切水解的任何多肽。所述酶也可以被称作内切_1,4-β-木聚糖酶或1,4-β- -木聚糖木聚糖水解酶。一种替代是EC 3.2.1.136,葡糖醛酸阿拉伯木聚糖内切木聚糖酶,一种能够水解葡糖醛酸阿拉伯木聚糖中1,4木糖苷键的酶。本文中,β -木糖苷酶(EC 3.2.1.37)是能够催化1,4_β -D-木聚糖的水解、从非还原性末端去除相继的D-木糖残基的任何多肽。这类酶也可以水解木二糖。所述酶也可以被称作木聚糖1,4-β -木糖苷酶、1,4-β -D-木聚糖木糖水解酶、外切-1,4-β -木糖苷酶或木二糖酶。本文中,a -L-阿拉伯呋喃糖苷酶(EC 3.2.1.55)是能够作用于a -L-阿拉伯呋喃糖苷、含(1,2)和/或(1,3)_和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被称作α-N-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶或阿拉伯糖苷酶。本文中,a -D-葡糖醛酸糖苷酶(EC 3.2.1.139)是能够催化以下形式反应的任何多肽:a -D-葡糖醛酸苷+H2O =醇+D-葡糖醛酸酯。所述酶也被称作α -葡糖醛酸糖苷酶或α-葡糖苷酸酶。这些酶也可水解可作为木聚糖中取代基存在的4-0-甲基化的葡糖醛酸。替代方式是EC 3.2.1 .131:木聚糖α-1,2-葡糖醛酸糖苷酶,其催化α-1,2-(4_0-甲基)葡糖醛酰基连接的水解。本文中,乙酰基木聚糖酯酶(EC 3.1.1.72)是能够催化木聚糖和木寡糖脱乙酰化的任何多肽。此类多肽可催化来自多聚木聚糖、乙酰化木糖、乙酰化葡萄糖、α -萘基乙酸酯或对硝基苯基乙酸酯的乙酰基水解,但是一般不催化来自于三酰甘油的乙酰基水解。此类多肽一般不作用于乙酰化的甘露聚糖或果胶。本文中,阿魏酸酯酶(EC 3.1.1.73)是能够催化以下形式反应的任何多肽:阿魏酸基-糖+H2O=阿魏酸酯+糖。糖可以是例如寡糖或多糖。其典型地可以催化来自酯化的糖的4-羟基-3-甲氧基肉桂酰(阿魏酰)基的水解,所述糖通常是“天然”底物中的阿拉伯糖,对硝基苯酚乙酸酯和阿魏酸甲基酯是典型地更弱的底物。所述酶也可以被称作肉桂酰基酯水解酶,阿魏酸酯酶或羟基肉桂酰基酯酶。也可以被称作半纤维素附属酶,因为其可帮助木聚糖酶和果胶酶分解植物细胞壁半纤维素和果胶。本文中,香豆酰基酯酶(EC 3.1.1.73)是能够催化以下形式反应的任何多肽:香豆酰基-糖+H2O=香豆酸酯+糖。糖可以是例如寡糖或多糖。所述酶也可以被称作反式-4-香豆酰基酯酶、反式-对香豆酰基酯酶、对香豆酰基酯酶或对香豆酸酯酶。所述酶也落入EC 3.1.1.73中,从而也可以被称作阿魏酸酯酶。
本文中,α -半乳糖苷酶(EC 3.2.1.22)是能够催化a -D-半乳糖苷(包括半乳糖寡糖、半乳甘露聚糖、半乳聚糖和阿拉伯半乳聚糖)中末端、非还原性a-D-半乳糖残基水解的任何多肽。此类多肽也可以能够水解a-D-岩藻糖苷。所述酶也可以被称作蜜二糖酶。本文中,β -半乳糖苷酶(EC 3.2.1.23)是能够催化β -D-半乳糖苷中末端非还原性β-D-半乳糖残基水解的任何多肽。这样的多肽也可以能够水解a-L-阿拉伯糖苷。所述酶也可以被称作外切- (1- > 4)-β -D-半乳聚糖酶或乳糖酶。本文中,β -甘露聚糖酶(EC 3.2.1.78)是能够催化甘露聚糖、半乳甘露聚糖和葡甘露聚糖中I,4-β-D-甘露糖苷键随机水解的任何多肽。所述酶也可以被称作甘露聚糖内切-1,4- β -甘露糖苷酶或内切-1,4-甘露聚糖酶。本文中,β -甘露糖苷酶(EC 3.2.1.25)是能够催化β -D-甘露糖苷中末端非还原性β-D-甘露糖残基水解的任何多肽。所述酶也可以被称作甘露聚糖酶或甘露糖酶。本发明的组合物可包含任何果胶酶,例如内切多聚半乳糖醛酸酶,果胶甲基酯酶,内切-半乳聚糖酶,β -半乳糖苷酶,果胶乙酰基酯酶,内切-果胶裂合酶,果胶酸裂合酶,α -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶。本文中,内切-多聚半乳糖醛酸酶(EC 3.2.1.15)是能够催化果胶酸酯和其他半乳糖醛酸聚糖中1,4-α-D-半乳糖醛酸键的随机水解的任何多肽。所述酶也可以被称作多聚半乳糖醒酸酶果胶解聚酶,果胶酶,内切多聚半乳糖醒酸酶,果胶酶(pectolase),果胶水解酶,果胶多聚半乳糖醛酸酶,多聚-α-1,4_半乳糖醛酸苷聚糖水解酶,内切半乳糖醛酸酶;内切-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)聚糖水解酶。在本文中,果胶甲基酯酶(EC 3.1.1.11)是能够催化下述反应的任何酶:果胶+ηH2O = η甲醇+果胶酸酯。所述酶也已知为果胶酯酶(pectinesterase),果胶脱甲氧基酶,果胶甲氧基酶,果胶甲基酯酶,果胶酶,果胶酯酶(pectinoesterase)或果胶果酰基水解酶(pectinpectylhydroIase)。在本文中,内切-半乳聚糖酶(EC 3.2.1.89)是能够催化阿拉伯半乳聚糖中1,4-13_D-半乳糖苷键的内切水解的任何酶。所述酶也已知为阿拉伯半乳聚糖内切-1,4- β -半乳糖苷键,内切-1,4- β -半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4- β -D-半乳聚糖水解酶。本文中,果胶乙酰基酯酶在本文中被定义为下述任何酶,所述酶具有催化果胶GaIUA残基羟基处乙酰基的脱乙酰基作用的乙酰基酯酶活性。
本文中,内切-果胶裂合酶(EC 4.2.2.10)是能够催化(1 — 4)-a-D-半乳糖醛酸聚糖甲基酯的清除性切割,得到在其非还原末端具有4_脱氧-6-0-甲基-a -D-半乳-4-糖醒酰基的寡糖。所述酶也可已知为果胶裂合酶,果胶反式消除酶(trans-eliminase),内切果胶裂合酶,多聚甲基半乳糖醛酸反式消除酶,果胶甲基反式消除酶,果胶酶(pectolyase),PL, PNL或PMGL或(I — 4) -6-0-甲基-a -D-半乳糖醛酸聚糖裂合酶。本文中,果胶酸裂合酶(EC 4.2.2.2)是能够催化(I — 4) - a -D-半乳糖醛酸聚糖的消除性切割,得到在其非还原性末端具有4-脱氧- a -D-半乳-4-糖醛酰基的任何酶。该酶也可以已知为多聚半乳糖醛酸反式消除酶,果胶酸反式消除酶,多聚半乳糖醛酸酯裂合酶,内切果胶甲基反式消除酶,果胶酸反式消除酶,内切半乳糖醛酸酯反式消除酶,果胶酸裂合酶,果胶裂合酶,a-l,4-D-内切多聚半乳糖醛酸裂合酶,PGA裂合酶,PPase-N,内切-α -1,4-多聚半乳糖醛酸裂合酶,多聚半乳糖醛酸裂合酶,果胶反式消除酶,多聚半乳糖醛酸反式消除酶或(I — 4)-α-D-半乳糖醛酸聚糖裂合酶。本文中,α -鼠李糖苷酶(EC 3.2.1.40)是能够催化a -L-鼠李糖苷或鼠李半乳糖醛酸聚糖中末端非还原性a-L-鼠李糖残基水解的任何多肽。所述酶也可以已知为a -L-鼠李糖苷酶Τ,a -L-鼠李糖苷酶N或a -L-鼠李糖苷鼠李糖水解酶。本文中,外切-半乳糖醛酸酶(EC 3.2.1.82)是能够从非还原性末端水解果胶酸、释放二半乳糖醛酸的任何多肽。酶也可以已知为外切-多聚- α-半乳糖醒酸昔酶(exo-poly-a-galacturonosidase)、外切多聚半乳糖醒酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醒酸苷酶(exopolygalacturanosidase)。本文中,外切-半乳糖醛酸酶(EC 3.2.1.67)是能够催化以下的任何多肽:(1,
4-(1-0-半乳糖醛酸苷)11+!120= (l,4-a-D-半乳糖醛酸苷)n_i+D-半乳糖醛酸酯。所述酶也可以已知为半乳糖醒1,4_ α -半乳糖醒酸苷酶(galacturanl, 4_ a -galacturonidase),外切多聚半乳糖醛酸酶,多聚(半乳糖醛酸酯)水解酶,外切-D-半乳糖醛酸酶,外切-D-半乳糖醛酸聚糖酶,外切多聚-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)半乳糖醛酸水解酶。本文中,外切多聚半乳糖醛酸酯裂合酶(EC 4.2.2.9)是能够催化从果胶酸(即脱脂化的果胶)的还原末端消除性切割4- (4-脱氧-a -D-半乳-4-糖醛酰基)-D-半乳糖醛酸酯的任何多肽。所述酶可已知为果胶酸二糖裂合酶,果胶酸外切裂合酶,外切果胶酸反式消除酶,外切果胶酸裂合酶,外切多聚半乳糖醛酸-反式-消除酶,ΡΑΤΕ,外切-PATEjF切-PGL或(I — 4) - a -D-半乳糖醛酸聚糖还原末端二糖裂合酶。本文中,鼠李半乳糖醛酸聚糖水解酶是能够在严格交替出现的鼠李半乳糖醛酸聚糖结构中以内切方式水解半乳基糖醛酸酸和吡喃鼠李糖基之间键的任何多肽,所述鼠李半乳糖醛酸聚糖结构由二糖[(l,2-a-L-鼠李糖基_(1,4)-α-半乳糖醛酸]组成。本文中,鼠李半乳糖醛酸聚糖裂合酶是能够以内切方式在鼠李半乳糖醛酸聚糖中通过β -消除切割a -L-Rhap-(I — 4) - a -D-GalpA键的任何多肽。本文中,鼠李半乳糖醛酸聚糖乙酰基酯酶是能够催化鼠李半乳糖醛酸聚糖中交替出现的鼠李糖和半乳糖醛酸残基主链的脱乙酰化的任何多肽。本文中,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能够以外切方式、从严格交替出现的鼠李半乳糖醛酸聚糖结构的非还原性末端水解半乳糖醛酸的任何多肽。本文中,木半乳糖醛酸酶是通过以内切方式切割木糖取代的半乳糖醛酸主链而作用于木半乳糖醛酸聚糖的任何多肽。所述酶也可以已知为木半乳糖醛酸聚糖水解酶。本文中, a -L-阿拉伯糖呋喃糖苷酶(EC 3.2.1.55)是能够作用于a -L-阿拉伯呋喃糖苷、含有(1,2)和/或(1,3)_和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被称作α-N-阿拉伯糖呋喃糖苷酶,阿拉伯糖呋喃糖苷酶或阿拉伯糖苷酶。
本文中,内切阿拉伯聚糖酶(EC 3.2.1.99)是能够催化1,5-阿拉伯聚糖中1,
5-α -阿拉伯呋喃糖苷键内切水解的任何多肽。所述酶也已知为内切阿拉伯糖酶,阿拉伯聚糖内切-1,5- a -L-阿拉伯糖苷酶,内切-1,5- a -L-阿拉伯聚糖酶,内切-α -1,5_阿拉伯聚糖酶;内切-阿拉伯聚糖酶或1,5- a -L-阿拉伯聚糖1,5- a -L-阿拉伯聚糖水解酶。本发明的组合物将一般包含至少一种纤维素酶和/或至少一种半纤维素酶和/或至少一种果胶酶(所述酶之一是根据本发明的多肽)。本发明的组合物可包含纤维二糖水解酶,内切葡聚糖酶和/或葡糖苷酶。此类组合物也可以包含一种或多种半纤维素酶和/或一种或多种果胶酶。本发明的组合物中可以存在淀粉酶、蛋白酶、脂肪酶、木质酶、己糖基转移酶葡糖醛酸糖苷酶中的一种或多种(例如两种、三种、四种或所有)。“蛋白酶”包括水解肽键的酶(肽酶),以及水解肽和其它部分如糖之间键的酶(糖肽酶)。许多肽酶根据EC 3.4表征,适合在本发明中使用并且通过引用并入本文。一些特定类型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和丝氨酸蛋白酶(包括糜蛋白酶,羧肽酶和金属内切蛋白酶)。“脂肪酶”包括水解脂质、脂肪酸和酰基甘油酯(包括磷酸甘油酯)、脂蛋白、二酰基甘油等等的酶。在植物中,脂质被用作结构组分,来限制水损失和病原体感染。这些脂质包括来自脂肪酸的蜡质,以及角质和木栓素(suberin)。“木质酶”包括能够水解或分解木质素聚合物结构的酶。能够分解木质素的酶包括木质素过氧化物酶、锰过氧化物酶、漆酶和阿魏酸酯酶,和在本领域中已知解聚或以其他方式分解木质素聚合物的描述的其他酶。还包括在内的是能够水解在半纤维素糖(主要是阿拉伯糖)和木质素之间形成的键的酶。木质酶包括但不限于以下组的酶:木质素过氧化物酶(EC1.11.14)、锰过氧化物酶(EC 1.11.1.13)、漆酶(EC 1.10.3.2)和阿魏酸酯酶(EC3.1.1.73)。 “己糖基转移酶”(2.4.1-)包括能够转移糖基、更特定地转移几糖基的酶。除了将糖基从含糖基的供体转移至另一含糖基的化合物受体以外,所述酶还能够将糖基转移至作为受体的水。所述反应也已知为水解反应而不是转移反应。可以在本发明中使用的己糖基转移酶的例子是β_葡聚糖基转移酶。此类酶可以能够催化(1,3) (1,4)葡聚糖和/或纤维素和/或纤维素降解产物的降解。“葡糖醛酸糖苷酶”包括催化葡糖醛酸苷(例如β -葡糖醛酸苷)水解得到醇的酶。许多葡糖醛酸糖苷酶已被表征,并可适合在本发明中使用,例如葡糖醛酸糖苷酶(EC 3.2.1.31),透明质酸酶葡糖醛酸糖苷酶(EC3.2.1.36),葡糖醛酰基-二硫葡糖胺葡糖醛酸糖苷酶(3.2.1.56),甘草酸β -葡糖醛酸糖苷酶(3.2.1.128)或a -D-葡糖醛酸糖苷酶(EC 3.2.1.139)。本发明的组合物可包含扩展蛋白多肽或扩展蛋白样多肽,如膨胀因子(swollenin)(见 Salheimo et al., Eur.J.Biohem.269,4202-4211, 2002)或膨胀因子样多肽。扩展蛋白涉及植物细胞生长期间细胞壁结构的松弛。已经提出扩展蛋白破坏纤维素和其他细胞壁多糖之间的氢键,但不具有水解活性。认为它们通过这种方式允许纤维素纤维的滑动和细胞壁的扩大。一种扩展蛋白样蛋白——膨胀因子,含有N端碳水化合物结合模块家族I结构域(CBD)和C端扩展蛋白样结构域。就本发明的目的而言,扩展蛋白样蛋白或膨胀因子样蛋白可包含此类结构域中的一种或两种和/或可破坏细胞壁的结构(如破坏纤维素结构),任选地不生产可检测量的还原糖。本发明的组合物可包含纤维素整合蛋白、支架蛋白或支架样蛋白的多肽产物,例如分别来自 Clostridium thermocellum 或 Clostridiumcellulolyticum 的 CipA 或 CipC0支架蛋白和纤维素整合蛋白是多功能整合亚基,其可将分解纤维素的亚基组合进多酶复合物中。这通过两类互补的结构域(即支架蛋白上的内聚结构域(cohesiondomain)和每个酶单元上的锚定结构域(dockerindomain))的相互作用完成。支架蛋白亚基还带有介导纤维体与其底物结合的纤维素结合模块(CBM)。就本发明的目的而言,支架蛋白或纤维素整合蛋白可包含此类结构域中的一种或两种。本发明的组合物可包含纤维素诱导的蛋白或调节蛋白,例如由来自Trichodermareesei/Hypocrea jacorina的cipl或cip2基因或类似基因所编码的蛋白(见Foreman etal.,J.Biol.Chem.278 (34).31988-31997,2003)。这些基因的多肽产物是双模块蛋白,其含有纤维素结合模块和其功能或活性不与已知的糖基水解酶家族相关的结构域。而纤维素结合模块的存在和这些基因的表达与纤维素酶元件的共同调节表明在生物质降解中具有潜在作用的先前未被认识的活性。本发明的组合物可包含上文提到的多肽种类的任一成员、一个多肽种类的若干成员、或这些多肽种类的任何组合。在本发明的组合物可以由来自以下的多肽(例如酶)组成:(1)供应商;(2)克隆基因表达的多肽,例如酶;(3)复合发酵液(例如由培养基中微生物菌株的生长得到的,其中所述菌株向培养基中分泌蛋白和酶);(4)如(3)中生长的菌株的细胞裂解物;和/或(5)植物材料表达的多肽,例如酶。本发明组合物中不同的多肽,例如酶可得自不同的来源。多肽的用途根据本发明的多肽和多肽组合物可用于许多不同的应用中。例如,它们可被用于生产可发酵的糖。可发酵的糖随后可(作为生物燃料方法的部分)被转化成沼气或乙醇、丁醇、异丁醇、2 丁醇或其他合适的物质。或者,多肽及其组合物可(例如在食物制品的生产中,在洗涤剂组合物中,在造纸工业和制浆工业中,和在抗菌配制物中,在药物制品例如润喉片、牙膏和漱口水中)用作酶。这些用途中的一些将在下文中更详细地阐述。在下文所述地用途和方法中,上述组合物的组分可共同(即本身作为单一组合物)或单独或先后提供。本发明还涉及根据本发明的膨胀因子多肽和包含此类酶的组合物在工业方法中的用途。
尽管用这些方法获得了长期的经验,但是根据本发明的膨胀因子多肽可具有优于目前所使用的酶的大量显著优点。根据具体的应用,这些优点可包括下述方面,例如更低的生产成本,更高的底物特异性,降低的抗原性,更少的不想要的副活性,在合适的微生物、更合适的pH和温度范围中生产时更高的产量,不受疏水的、来自木质素的产物抑制,或更少的产物抑制,或在食品工业情况下最终产物更好的口味或质地,以及食品级别和犹太教戒律方面。原则上,膨胀因子多肽或本发明的组合物可以在任何下述方法中使用,所述方法需要处理包含多糖的材料。因此,本发明的多肽或组合物可以在多糖材料的处理中使用。本文中,多糖材料是下述材料,所述材料包含一种或更典型地包含多于一种多糖或者基本由所述多糖组成。典型地,植物和源自它们的材料包含大量非淀粉的多糖材料。因此,本发明的多肽可以用于植物或真菌材料或源自它们的材料的处理。木质纤维素植物非淀粉多糖材料的一个重要的组分是木质纤维素(在本文中也称作木质纤维素生物质)。木质纤维素是包含纤维素和半纤维素和木质素的植物材料。碳水化合物聚合物(纤维素和半纤维素)与木质素通过氢键和共价键紧密结合。因此,本发明的多肽可以用于木质纤维素材料的处理。本文中,木质纤维素材料是包含木质纤维素或基本由木质纤维素组成的材料。因此,在用于处理非淀粉的多糖的本发明方法中,非淀粉的多糖可以是木质纤维素材料/生物质。因此,本发明提供了用于 处理包含非淀粉多糖的底物的方法,其中所述处理包括纤维素和/或半纤维素和/或果胶物质的降解和/或水解和/或改性。降解在本文上下文中表示导致产生纤维素和/或半纤维素和/或果胶物质的水解产物(即与类似的未经处理的非淀粉多糖中存在的相比,由于处理而存在更短链的糖)的处理。因此,降解在本文上下文中可以导致寡糖和/或糖单体的释放。所有植物都含有非淀粉的多糖,同样,基本上所有来自植物的多糖材料也含有非淀粉的多糖。因此,在本发明的用于处理包含非淀粉多糖的底物的方法中,所述底物可以以植物或源自植物的材料或包含植物或源自植物的材料的形式提供,例如以植物浆体、植物提取物、食品或其成分、织物、纺织品或衣物。适合在本发明的方法中使用的木质纤维素生物质包括生物质,并可包括原生生物质(virgin biomass)和/或非原生生物质如农业生物质,商业有机物,建筑和拆除碎片,市政固体废弃物,废纸和庭院废弃物。常见的生物质形式包括树木,灌木丛(shrubs)和草,小麦,小麦秸,甘蔗渣,玉米,玉米壳,玉米芯(corn cobs),玉米粒(包括来自玉米粒的纤维),来自谷物如玉米、小麦和大麦研磨(包括湿磨和干磨)的通常称作麸或纤维的产物和副产物,以及市政固体废弃物,废纸和庭院废弃物。生物质也可以是,但不限于草本材料,农业残余物,林业残余物,市政固体废弃物,废纸,和纸浆和造纸厂残余物。“农业生物质”包括树枝,灌木(bushes),藤蔓(canes),玉米和玉米壳,能量作物,森林,水果,鲜花,谷物,草,草本作物,树叶,树皮,针叶,原木,根,树苗,短期轮种木本作物(short-rotationwoody crops),灌木丛,柳枝稷,树木,蔬菜,水果皮,蔓藤(vines),甜菜衆,小麦麸皮(wheatmidlings),燕麦壳,和硬木材或软木材(不包括带有有害材料的木材)。另外,农业生物质包括由农业加工产生的有机废弃物材料,所述农业加工包括农业和林业活动,特定地包括林业木材废弃物。农业生物质可以是前述任一或其任何组合或混合物。合适的生物质的其他例子是果园底料,树丛,磨坊废弃物,城市木材废弃物,市政废弃物,伐木废弃物,森林疏伐废弃物,短期轮种木本作物,工业废弃物,小麦秸,燕麦秸,水稻秸,大麦秸,黑麦秸,亚麻秸,大豆壳,稻壳,水稻秸,玉米谷蛋白饲料,燕麦壳,甘蔗,玉米秸杆,玉米杆,玉米芯,玉米壳,牧场草,磨擦禾,狐尾草;甜菜浆,柑橘果实浆,种子壳,纤维素动物粪便,草坪修剪废弃物,棉花,海藻,树木,灌木丛,草,小麦,小麦秸,甘蔗渣,玉米,玉米壳,玉米棒,玉米粒,来自玉米粒的纤维,来自谷物湿磨或干磨的产物和副产物,市政固体废弃物,废纸,庭院废弃物,草本材料,农业残余物,林业残余物,市政固体废弃物,废纸,纸浆,造纸厂残余物,树枝,灌木,甘蔗,玉米,玉米壳,能源作物,森林,水果,鲜花,谷物,草,草本作物,树叶,树皮,针叶,原木,根,树苗,灌木丛,柳枝稷,树木,蔬菜,水果皮,藤蔓,甜菜衆,小麦麸皮,燕麦壳,硬木材或软木材,由农业加工产生的有机废弃物材料,林业木材废弃物,或其中任意两种或更多的组合。除了已经在食物和饲料或造纸和制浆工业中加工的原生生物质或原料以外,生物质/原料可额外地用热、机械和/或化学改性或此类方法的任何组合预处理,从而增强酶降解。预处理为了以任何本领域已知的方式增强底物对酶水解的可接近性和/或水解半纤维素和/或溶解半纤维素和/或纤维素和/或木质素,在酶处理之前,任选地可用热、机械、和/或化学改性或此类方法的任何组合对原料预处理。预处理可包括将木质纤维素材料暴露于(热)水、蒸汽(蒸汽爆破)酸、碱、溶剂、热、过氧化物、臭氧、机械击打、粉碎、研磨或快速降压,或其中任何两种或更多的组合。所述化学预处理通常与热预处理(例如150-220°C之间I到30分钟)组合。预糖化预处理步骤后,可以使用涉及用酶或酶混合物孵育的液化/水解或预糖化步骤。预糖化步骤可以在许多不同的温度下进行,但是优选预糖化在最适合要应用的酶混合物的温度下,或针对要应用的酶预测的酶最适度下进行。预糖化步骤的温度范围可以是从约10°C到约 95°C,约 20°C到约 85°C,约 30°C到约 70°C,约 40°C到约 60°C,约 37°C到约 50°C,优选地约37°C到约80°C,更优选地约60-70°C,进一步更优选地在65°C左右。预糖化混合物的pH可以在从约2.0到 约10.0,但是优选地约3.0到约7.0,更优选地约4.0到约6.0,进一步更优选地约4.0到约5.0。另外,pH可以被调节以最大化酶活性,并且可以通过添加酶来调节。液化/水解或预糖化步骤反应可以进行数分钟到数小时,例如从约I小时到约120小时,优选地从约2小时到约48小时,更优选地从约2小时到约24小时,最优选地从约2小时到约6小时。纤维素酶处理可进行数分钟到数小时,例如从约6小时到约120小时,优选地约12小时到约72小时,更优选地约24小时到48小时。糖化本发明提供了由木质纤维素材料生产糖的方法,所述方法包括将本发明的多肽与木质纤维素材料接触。此类方法允许由木质纤维素生物质生产游离的糖(单体)和/或寡糖。这些方法涉及用本发明的多肽或组合物将木质纤维素生物质转化成游离糖和小寡糖。将复合碳水化合物如木质纤维素转化为糖的方法优选地允许转化成可发酵的糖。此类方法可以被称作“糖化”。因此,本发明的方法可导致一种或多种己糖和/或戊糖(如葡萄糖、木糖、阿拉伯糖、半乳糖、半乳糖醛酸、葡糖醛酸、甘露糖、鼠李糖、核糖和果糖中的一种或多种)的释放。因此,本发明的另一方面包括下述方法,所述方法与其它酶或物理处理(例如温度和pH) —起利用上文所述本发明的组合物的多肽,将木质纤维素植物生物质转化成糖和寡糖。尽管组合物已作为单一混合物被讨论,但是认为酶可以先后添加,其中温度、pH和其他条件可以被改变,以提高每种个体酶的活性。或者,可以针对酶混合物测定最适PH和温度。酶在任何适当的条件下与底物反应。例如,酶可以在约25°C,约30°C,约35°C,约 37°C,约 40°C,约 45°C,约 50°C,约 55°C,约 60°C,约 65°C,约 70°C,约 75°C,约 80°C,约85 °C,约90 V或更高下孵育。也就是说,它们可以在从约20 V到约95 °C下,例如在低到中等离子强度的缓冲液中和/或从低到中性PH下孵育。“中等离子强度”表示对任何单个离子组分而言,缓冲液具有约200毫摩尔(mM)或更少的离子浓度。pH可在从约pH 2.5,约pH3.0,约 pH 3.5,约 pH 4.0,约 pH 4.5,约 pH 5,约 pH 5.5,约 pH 6,约 pH 6.5,约 pH 7,约 pH7.5,约pH 8.0,到约pH 8.5的范围内。通常,pH范围会从约pH 3.0到约pH 7。为了生产乙醇,优选酸性介质,例如PH = 4,而为了生产沼气,期望中性pH例如pH = 7。在这些条件下孵育酶组合导致大量糖从木质纤维素释放或解离。大量表示可利用的糖的至少20%、30%、40%、50%、60%、70%、80%、90%、95% 或更多。多肽(例如酶)可以在微生物、酵母、真菌、细菌或植物中外源产生,然后分离并加入例如木质纤维素原料中。或者,酶可以被生产但不分离,并且将粗制细胞群发酵液或植物材料(如玉米杆)等等 可被加入例如原料中。或者,可以处理粗制细胞群或酶生产培养基或植物材料,以预防进一步的微生物生长(例如通过加热或添加抗微生物剂),然后添加至例如原料中。这些粗制酶混合物可包含生产酶的生物。或者,酶可以在下述发酵中生产,所述发酵施用原料(例如玉米杆)对生产酶的生物提供营养。通过这种方式,生产酶的植物自身可以发挥木质纤维素原料的作用,并且被添加进木质纤维素原料中。糖的发酵可发酵的糖可以被转化成有用的增值的(value-added)发酵产物,其非限制性例子包括氨基酸、维生素、药物、动物饲料补充剂、特种化学品(specialty chemicals)、化学品原料、塑料、溶剂、燃料或其他有机聚合物、乳酸和乙醇,包括燃料乙醇。糖尤其可被用作用于原料,用于发酵成化学品、塑料、例如琥珀酸和(生物燃料),包括乙醇、甲醇、丁醇合成液体燃料和沼气。例如,在本发明的方法中,酶或酶的组合作用于发挥原料作用的木质纤维素底物或植物生物质上,从而将所述复合底物转化成简单的糖和寡糖,用于生产乙醇或其它有用的发酵产物。从生物量释放的糖可被转化成有用的发酵产物,例如包括但不限于,氨基酸、维生素、药物、动物饲料补充剂、特种化学品,化学品原料,塑料,和乙醇,包括燃料乙醇。因此,本发明提供了用于制备发酵产物的方法,所述方法包括:a.使用本文所述的方法降解木质纤维素;以及b.对得到的材料进行发酵;由此制备发酵产物。发酵可在需氧或厌氧条件下进行。优选地,所述方法在微需氧或氧受限的条件下进行。
厌氧发酵方法在本文中被定义为在不存在氧时运行的,或者其中基本不消耗氧,优选地消耗约5或更少、约2.5或更少、或约lmmol/L/h或更少氧,并且其中有机分子既作为电子供体又作为电子受体的发酵方法。氧受限的发酵方法是其中氧消耗受到从气体到液体的氧转移限制的方法。氧限制程度由进入气流的量和组成以及使用的发酵设备的实际混合/物料转移性质决定。优选地,在氧受限条件下进行的方法中,氧消耗速率至少约5.5,更优选地至少约6,进一步更优选地至少约7mmol/L/h。用于制备发酵产物的方法可任选地包括发酵产物的回收。SSF发酵和糖化也可以按照同时糖化和发酵(SSF)的模式进行。这种模式的优点之一是减少对酶促水解的糖抑制(对纤维素酶的糖抑制由Caminal B&B Vol XXVII Pp1282-1290 描述)。发酵产物可以根据本发明生产的发酵产物包括氨基酸、维生素、药物、动物饲料补充剂、特种化学品、化学原料、塑料、溶剂、燃料或其他有机聚合物、乳酸和乙醇,包括燃料乙醇(术语“乙醇”被理解为包括乙醇或乙醇和水的混合物)。可以通过本发明的方法生产的特定的增值产物包括但不限于生物燃料(包括乙醇和丁醇和沼气);乳酸;塑料;特种化学品;有机酸,包括柠檬酸、琥珀酸、延胡索酸、衣康酸和顺丁烯二酸;3_羟基-丙酸,丙烯酸;乙酸;1,3-丙烷-二醇;乙烯;丙三醇;溶剂;动物饲料补充剂;药物,如内酰胺抗生素或头孢菌素;维生素;氨基酸,如赖氨酸,甲硫氨酸,色氨酸,苏氨酸和天冬氨酸;工业酶,如蛋白酶,纤维素酶,淀粉酶,葡聚糖酶,乳糖酶,脂肪酶,裂合酶,氧化还原酶,转移酶或木聚糖酶;和化学原料。

沼气本发明还提供了本文所述的多肽或组合物在用于制备沼气的方法中的用途。沼气典型地表示由有机物质(例如含有非淀粉碳水化合物的材料)在不存在氧时生物降解而生产的气体。沼气源自生物源材料,并且是一种生物燃料。一种沼气由可生物降解的材料(例如生物质、粪便或污水、市政废弃物和能源作物)的厌氧消化或发酵生产。这种沼气主要由甲烷和二氧化碳组成。气体甲烷可以用氧燃烧或氧化。空气含有21%的氧。该能量释放允许沼气被用作燃料。在许多国家中沼气可被用作低成本燃料,用于任何加热目的,例如烹饪。其也可以被用在现代废弃物管理设备中,在那里其可以被用于运行任何类型的热引擎,从而产生机械力或电力。微生物沼气生产的第一步由聚合物和复合底物(例如非淀粉碳水化合物)的酶促降解组成。因此,本发明提供了用于制备沼气的方法,其中包含非淀粉碳水化合物的底物与本发明的多肽或组合物接触,从而产生可发酵的材料,所述可发酵的材料可由生物(例如微生物)转化成沼气。在此类方法中,本发明的多肽可由生物提供,所述生物例如是表达此类多肽的微生物。酶在食物制品中的用途本发明的多肽和组合物可在下述方法中使用,所述方法加工植物材料,从而降解或改性植物或真菌材料细胞壁的纤维素或半纤维素或果胶物质组分。此类方法可用于制备食物制品。因此,本发明提供了制备食物制品的方法,所述方法包括在食物制品的制备期间掺入本发明的多肽或组合物。本发明还提供了加工植物材料的方法,所述方法包括将植物材料与本发明的多肽或组合物接触,从而降解或改性(植物)材料中的纤维素。优选地,植物材料是植物浆体或植物提取物,例如汁液。植物和含有纤维素/半纤维素/果胶物质的材料包括植物浆体、植物部分和植物提取物。在本发明的上下文中,来自植物材料的提取物是可通过提取(机械和/或化学)、加工或其他分离技术源自植物材料的任何物质。提取物可以是汁液、花蜜、碱或由其制成的浓缩物。植物材料可包含或源自蔬菜,例如胡萝卜、芹菜、洋葱、豆类或豆科植物(大豆、黄豆、豌豆)或水果,例如梨果或带种子的水果(seed fruit)(苹果、梨、柑橘等)、葡萄、西红柿、柑橘(橙、柠檬、枸橼、蜜桔)、甜瓜、洋李、樱桃、黑醋栗、红醋栗、覆盆子、草莓、蔓越莓、菠萝和其他热带水果,树及其部分(例如花粉,来自松树),或谷物(燕麦、大麦、小麦、玉米、水稻)。(要被水解的)材料也可以是农业残余物,例如甜菜浆、玉米芯(com cobs)、小麦秸、(粉碎的)坚果壳,或可再生材料,例如(废)纸。本发明的多肽因此可被用于处理植物材料,包括植物浆体和植物提取物。它们也可以被用于处理液体或固体食品或可食用的食品成分,或在植物油、淀粉的提取中使用,或被用作食物中的增稠剂。典型地,本发明的多肽被用作上文所述的组合物/酶制剂。所述组合物通常会被添加至可通过例如机械加工(如挤压或研磨)植物材料获得的植物浆体中。组合物与植物的孵育会典型地进行从 10分钟到5小时、例如30分钟到2小时、优选地约I小时的时间。加工温度优选地从约10°C到约55°C,例如从约15°C到约25°C,任选地约20°C,每吨要处理的材料可以使用从约IOg到约300g,优选地从约30g到约70g,任选地约50g的酶。使用的所有酶或它们的组合物可以被先后或同时添加至植物浆体中。根据酶制剂的组成,植物材料可首先被浸溃(例如至纯净)或液化。使用本发明的多肽,可以改进加工参数,例如提取产率、提取物粘度和/或提取物品质。或者,或除上文以外,本发明的多肽可以被添加至通过压榨或液化植物浆体而获得的粗制汁液中。在剂量、温度和持续时间方面,粗制汁液的处理应与植物浆体以类似的方式进行。另外,可以包括其他酶,例如先前讨论的酶。典型的孵育条件如前一段中所述。一旦用本发明的多肽孵育了粗制汁液,则随后可以离心或过滤(超滤)汁液以生
产最终产物。用本发明的多肽处理后,可以对(终)产物进行热处理,例如在约100°C下进行约I分钟到约I小时,在使本发明多肽部分或完全失活的条件下进行。含有本发明多肽的组合物也可以在水果泥或蔬菜泥的制备期间使用。在烘焙中,多肽可改善面团结构,修饰其粘性或柔韧性,改进面包体积和/或碎屑结构,或赋予更好的质地特征,例如断裂品质、成条品质或碎屑品质。本发明因此涉及用于制备面团或基于谷物的食物制品的方法,所述方法包括向面团中掺入本发明的多肽或组合物。相对于其中未掺入多肽的面团或基于谷物的食物制品而言,这可以改进面团或得自面团的基于谷物的食物制品的一种或多种特性。根据本发明的基于谷物的食物制品的制备可包括本领域中已知的步骤,例如煮沸、干燥、油炸、蒸或烘焙获得的面团。由煮过的面团制成的制品是例如煮过的面条、饺子,由炸过的面团制成的制品是例如面包圈、beignets、油炸面条,由蒸过的面团制成的制品是例如蒸慢头和蒸面,由干燥的面团制成的制品是意大利面和干面条,由烘焙的面团制成的制品是面包、曲奇、蛋糕。术语“经改进的特性”在本文中被定义为相对于其中未掺入根据本发明的多肽的面团或制品而言,被根据本发明的多肽作用改进的面团和/或由面团获得的制品、尤其是基于谷物的食物制品的任何特性。经改进的特性可包括但不限于,提高的面团强度,提高的面团弹性,提高的面团稳定性,经改进的面团可加工性,经改进的面团醒发抗性,降低的面团粘度,经改进的面团延伸性,提高的基于谷物的食物制品体积,降低的基于谷物的食物制品发泡性,经改进的烘焙制品碎屑结构,经改进的基于谷物的食物制品的柔软性,经改进的基于谷物的食物制品的风味,经改进的基于谷物的食物制品的抗老化性(ant1-staling)。与意大利面和面条类型的基于谷物的制品相关的经改进的特性是例如经改进的硬度,降低的粘度,经改进的凝聚性和降低的烹调损失。经改进的特性可通过添加或不添加本发明的多肽而制备的面团和/或基于谷物的食物制品的比较来确定。感官品质可以使用烘焙工业中公认的程序来评价,并且可包括使用例如受过训练的口味测试者小组。术语“面团”在本文中被定义为足够坚硬到揉捏或滚动的谷物粉和其他成分的混合物。谷物的例子是小麦、黑麦、玉米、玉蜀黍、大麦、水稻、米粒(groats)、荞麦和燕麦。小麦在此处和下文中旨在包括Triticum属的所有种,例如aestivum、durum和/或spelta。合适的其他成分的例子是:根据本发明的膨胀因子多肽,额外的酶,化学添加剂和/或加工助剂。面团可以是新鲜的、冷冻的、预制备的或预烘焙的。来自上述成分的面团的制备是本领域公知的,并且包括将所述成分与加工助剂混合,和一个或多个塑型(moulding)和任选的发酵步骤。冻面团的制备由 Kulp andLorenz 在 Frozen and Refrigerated Doughs andBatters中描述。

术语“基于谷物的食物制品”在本文中被定义为由面团制备的任何制品,无论具有软的特征还是具有易碎的特征。可有利地通过本发明生产的基于谷物的食物制品的例子(无论是白色、浅色或深色类型)是面包(尤其是白面包、全麦面包或黑麦面包),典型地是面包片或面包卷的形式,法棍型面包,意大利面,面条,面包圈,百吉饼,蛋糕,皮塔饼(pitabread),玉米饼(tortillas),墨西哥卷饼(tacos),蛋糕,煎饼,饼干,曲奇,派皮(piecrusts),蒸面包(steamed bread)和脆面包(crispbread)等等。术语“烘焙制品”在本文中被定义为通过烘焙面团制备的任何基于谷物的食物制
品O非淀粉多糖(NSP)能够提高食糜(digesta)的粘度,这可进而降低营养可用度和动物表现。本发明的膨胀因子多肽的使用能够提高磷利用,以及动物食糜期间的阳离子矿物质和多肽。对饲料添加特定的养分会改进动物消化并从而降低饲料成本。目前正在使用大量饲料添加剂,并且持续开发出新的概念。使用特定的酶(例如非淀粉碳水化合物降解酶)能够分解纤维,释放能量,以及提高蛋白质可消化性,因为纤维分解时有更好的蛋白质可达性。藉此,饲料成本能够降低,并且饲料中的蛋白质水平也能降低。
非淀粉多糖(NSP)事实上也存在于植物来源的所有饲料成分中。NSP利用较差,并且在溶解时能够显示对消化的不良影响。外源酶能够有助于更好地利用这些NSP,并因此降低任何抗营养效应。本发明的非淀粉碳水化合物降解酶可在基于谷物的家禽膳食中被用于该目的,或者在更小的程度上用于猪和其他物种。本发明的非淀粉碳水化合物降解多肽/酶(包含本发明多肽/酶的组合物)可在洗涤剂工业中使用,例如用于从洗衣房中去除基于碳水化合物的污点。洗涤剂组合物可包含本发明的多肽/酶,另外包含一种或多种纤维素,半纤维素酶,果胶酶,蛋白酶,脂肪酶,角质酶,淀粉酶或碳水化合物酶。酶在洗涤剂组合物中的用途包含本发明多肽或组合物的洗涤剂组合物可以是任何便利的形式,例如糊剂、凝胶、粉末或液体。液体洗涤剂可以是水性的,典型地含有最多约70%的水和从约O到约30%的有机溶剂或非水性材料。此类洗涤剂组合物可例如被配制为手洗洗涤剂组合物或机洗洗涤剂组合物,包括适用于预处理脏污织物的洗衣添加组合物和漂洗添加的织物柔软剂组合物,或被配制成用于一般居家硬表面清洁操作的洗涤剂组合物,或被配制用于于洗或机洗的洗碗操作。通常,酶的特性应当与所选择的洗涤剂相容(例如pH-最适度,与其他酶和/或非酶成分的相容性等等),并且酶应当以有效量存在。洗涤剂组合物可包含表面活性剂,例如阴离子或非离子型表面活性剂,洗涤剂增量组分或复合剂,一种或多种聚合物,漂白系统(例如H2O2源)或酶稳定剂。洗涤剂组合物也可包含任何其他常规的洗涤剂成分,例如护理剂包括粘土,泡沫加强剂,sud抑制剂,抗腐蚀剂,土壤悬浮剂,土壤再沉淀剂,染料,杀菌剂,光学增亮剂,助水溶物,晦暗抑制剂(tarnish inhibitor)或香料。酶在造纸和浆体加工中的用途本发明的多肽可用于造纸和制浆工业,尤其是漂白过程中,以增强被漂白的浆体的亮度,从而可以降低漂白阶段中使用的氯,并且提高浆体在再循环造纸方法中的自由度(Eriksson, K.E.L., Wood Science andTechnology 24(1990):79-101 ;Paice, et al.,Biotechnol.and Bioeng.32(1988):235_239and Pommier et al.,Tappi Journal(1989):187-191)。另外,本发明的多肽或组合物可被用于处理木质纤维素浆体,从而改进其可漂白性。因此可以降低获得令人满意的浆体漂白所需要的氯量。本发明的多肽或组合物可被用于下述方法中,所述方法降低含纤维素的织物变得粗糙的速率,或降低含纤维素的织物的粗糙度,所述方法包括用上文所述的多肽或组合物处理含纤维素的织物。本发明还涉及为有色的含纤维素的织物提供色彩澄清的方法,所述方法包括用上文所述的多肽或组合物处理有色的含有纤维素的织物,和在有色的含纤维素的织物中提供局部变化的方法,所述方法包括用上文所述的多肽或组合物处理有色的含纤维素的织物。本发明的方法可以通过在洗涤期间处理含纤维素的织物来进行。然而,需要时织物的处理也可以在浸泡或漂洗期间进行,或简单地通过将上文所述的多肽或组合物添加至浸溃或要浸溃织物的水中来进行。

其他酶用途另外,本发明的多肽或组合物也可以被用于抗菌配制物中以及药物制品例如润喉糖、牙膏和漱口水中。以下实施例阐述本发明:
实施例材料和方法DNA 程序除非另有说明,如别处所述进行标准DNA程序(Sambrook et al., 1989,Molecularcloning:a laboratory manual,2nd Ed., Cold Spring HarborLaboratory Press,ColdSpring Harbor,New York)。使用校正读码酶 Physion 聚合酶(Finnzymes)扩增 DNA。限制性酶来自 Invitrogen 或 NewEngland Biolabs0
纤维素酶样品的制备源自Talaromyces emersonii 的纤维素酶在 Aspergillus niger 中表达。如W02004/030468所述产生酶的浓缩滤液。在对含有合适的表达质粒的Aspergillus niger培养后,在4°C下在5000xg下通过对发酵液离心30分钟,制备无细胞的上清液。任选的可用4N KOH将上清液调至pH = 5并且在2 μ m(瓶顶)过滤器上用抽吸无菌过滤以去除任何真菌材料。而且,上清液可进一步在GF/A Whatmann Glass微纤维过滤器(150mm 0)上过滤以去除任何固体。将上清液超滤、浓缩并在4°C下存储直至使用或在_20°C下冷冻。用于总蛋白测定的方法该方法是使用三氯乙酸(TCA)沉淀蛋白的组合,以去除干扰物质并允许用双缩脲比色反应对蛋白浓度进行测定。在双缩脲反应中,铜(II)离子被还原为铜(I),所述铜离子⑴在碱性溶液中与肽键的氮和碳形成复合物。紫色颜色表示存在蛋白。根据比尔-兰伯特定律,颜色的强度与蛋白浓度成正比例,因而在546nm下的吸收与蛋白浓度成正比例。使用BSA(牛血清蛋白)进行标准化并且蛋白含量被表示为g蛋白(BSA当量)/L或被表示为mg蛋白(BSA当量)/ml。使用本领域中已知的标准计算方案计算蛋白含量,其通过绘制OD546对具有已知浓度的样品的浓度的图,随后使用从校准线产生的方程计算未知浓度样品来实现。洗涤的预处理的小麦秸底物的制备可如Linde, M.et al, Biomass and Bioenergy 32 (2008), 326-332 中所述并且可使用如 Schell,D.J.,Applied Biochemistry and Biotechnology(2003) ,vol.105-108,pp69-85中所述的装置,获得稀酸预处理的小麦秸。用水洗涤预处理的小麦秸直到具有小麦秸的溶液的PH为6.0或更高。滤出洗涤水。纤维素的水解以IOmL规模进行酶组合物对在pH 4.5的50mM乙酸钠缓冲液中的2%洗涤的酸预处理的小麦秸(PWS)干物质(dm)底物溶液的孵育。以相对于每克底物干物质固定的蛋白剂量添加酶组合物。按时取样,直到在65°C下孵育24小时。在给定的时间处终止反应,随后旋转残留物,吸取上清液并冷冻样品直到分析。使用流动-NMR,进行释放的葡萄糖量的分析。在质子频率500MHz和探头温度27°C下操作的fcuker AVANCE II BEST NMR系统上记录1HNMR光谱。实施例1
1.1.表汰质粒的构律使用EcoRI和SnaBI位点将SEQ ID NO:1的序列克隆到pGBTOP载体中(图1),其包含葡萄糖淀粉酶启动子和终止子序列。在转化A.nigerCBS 513.88之前通过NotI消化除去大肠杆菌(E.coli)部分。L 2.L niger 的转化A.niger WT-1:该A.niger菌株是CBS 513.88,其包含编码葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶之基因的缺失。如EP O 635 574B1所述用“MARKER-GENE FREE”法构建 A.niger WT-1。根据Tilburn,J.et al.(1983) Gene 26,205-221 和 Kelly,J.& Hynes, Μ.(1985)EMBO J.,4,475-479所述方法,用表达载体共转染A.niger WT-1菌株,其中进行以下修改:-使孢子萌发并在30°C下在Aspergillus基本培养基(IOOml)中在300rpm旋转摇床中的摇瓶中培养16小时。Aspergillus基本培养基每升中含有:6g NaNO3,0.52g KCl, 1.52g KH2PO4,1.12ml 4M KOH,0.52gMgS04.7H20,IOg 葡萄糖,Ig 酪蛋白氨基酸,22mg ZnSO4.7H20,1 ImgH3BO3, 5mg FeSO4.7H20,1.7mg CoCl2.6H20,1.6mg CuSO4.5H20,5mgMnCl2.2H20,1.5mg Na2MoO4.2H20, 50mg EDTA, 2mg 核黄素,2mg 硫胺-HC1, 2mg 烟酰胺,Img批哆醇-HCL,0.2mg泛酸,4g生物素,IOml青霉素(5000IU/ml)链霉素(5000UG/ml)溶液(Gibco)。-用Novozym234 (Novo Industries)代替螺旋酶来制备原生质体;-形成原生质体(60-90分钟)后,加入KC缓冲液(0.8M KCl, 9.5mM柠檬酸,pH
6.2)至终体积为45ml,将原生质体悬液在吊桶式转头中在4°C下以3000rpm离心10分钟。将原生质体重悬于20ml KC缓冲液中,随后加入25ml STC缓冲液(1.2M山梨醇,IOmMTris-HCl pH 7.5,50mM CaCl2)。将原生质体悬液在吊桶式转头中在4°C下以3000rpm离心10分钟,用STC缓冲液洗涤并以10E8原生质体/ml的浓度重悬于STC缓冲液中;-向200毫升原生质体悬液中,加入溶于IOmlTE缓冲液(IOmMTris-HCl pH 7.5,0.1mM EDTA)和 IOOml PEG 溶液(20% PEG 4000 (Merck), 0.8M 山梨醇,IOmM Tris-HCl pH
7.5,50mM CaCl2)中的 DNA 片段;-将DNA-原生质体悬液在室温下孵育10分钟后,缓慢加入1.5ml PEG溶液(60%PEG 4000 (Merck), IOmM Tris-HCl pH 7.5,50mMCaCl2),并将管反复混合。室温孵育 20 分钟后,用5ml 1.2M山梨醇稀释悬液,颠倒混合并在室温下以4000rpm离心10分钟。将原生质体轻柔地重悬于Iml 1.2M山梨醇中,并涂板到固体选择再生培养基上,该培养基由不含核黄素、硫胺HCL、烟酰胺、吡哆醇、泛酸、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus基本培养基组成。对于乙酰胺选择的情况,培养基含有IOmM乙酰胺作为唯一氮源和IM蔗糖作为渗压剂和碳源。或者,将原生质体涂极到PDA(Potato Dextrose Agar, Oxoid)上,其中补充有1-50μ g/ml腐草霉素和IM蔗糖作为渗压剂。用2%琼脂(琼脂N0.l,0xoid Lll)使再生平板固化。在30°C孵育6-10天后,将转化体的分生孢子转移至含有2%葡萄糖和1.5%琼脂糖(Invitrogen)到Aspergillus选择培养基(对于乙酰胺选择的情况为含有乙酰胺作为唯一氮源的基本培养基,或者对于腐草霉素选择的情况为补充1-50 μ g/ml腐草霉素到PDA)并在30°C下孵育5-10天。 分离单个转化体,将这种选择纯化步骤重复一次,之后保存纯化的转化体。
转化后,在含有乙酰胺作为唯一氮源的培养基上选择转化体并纯化集落。通过定量PCR估计拷贝数,并选择低和高拷贝数的转化体。如EP635574所述,使用500ml带挡板的摇瓶,在培养箱摇床中以34°C、170rpm将高拷贝数转化体在摇瓶中培养在100ml CSM-MES培养基中。发酵3天和4天后,收获上清液样品以通过SDS-PAGE测定表达。1.3蛋白含量对表达膨胀因子活性(TEMER08806)的转化体的摇瓶发酵的超滤且浓缩的上清液,分析蛋白含量。蛋白含量被测定为7mg (作为BSA当量)/ml。实施例22.1纤维素酶样品的制备如针对TEMER08806的实施例1中所述的,分别制备都来自Talaromycesemersonii的纤维素酶增强蛋白——TEMER07589 (如在与本申请同日提交的共同待决专利申请DSM案号27666中所述的)和两种外切葡聚糖酶——CBHII (如在与本申请同日提交的共同待决专利申请DSM案号27829中描述的)和在专利中请EP09158739.4中描述的CBHI,以及从Murray et al.,Protein expression and Purification, 2004, 38, 248-257 中已知的β_葡糖苷酶。测定这些样品的蛋白含量,测得含量范围从20mg至60mg蛋白(作为BSA当量)/ml。2.2具有胺彡子补充的纤维素酶混合物的纤维素水解将4种水解纤维素的蛋白——β -葡糖苷酶(BG)、CBH1、CBHII和纤维素酶增强蛋白TEMER07589以相对于混合物中总蛋白的9% BG,37% TEMER07589,30% CBHI和24%CBHII的相对量混合。以每克预处理的小麦秸干物质2.5或5mg蛋白(作为BSA当量)的蛋白剂量,在PH4.5和65°C下,将该混合物在有2% DM预处理小麦秸的IOmL规模的延长的水解中应用。所述混合物还以这些相同蛋白剂量在另外的单独孵育中应用,其中添加了相对于每克预处理小麦秸干物质2mg TEMER08806蛋白(作为BSA当量)。作为比较,也以相对于每克预处理的小麦秸干物质2.5或5mg蛋白(作为BSA当量)的蛋白剂量,添加或没有添加相对于每克预处理的小麦秸干物质2mg TEMER08806蛋白(作为BSA当量),也在相
同的底物浓度、pH和温度下孵育Filtrase NL-典型的Talaromyces emersonii纤维素
酶产物。孵育持续24小时并在若干时间间隔下取样。将样品旋转,并将上清液冷冻直到通过NMR分析。葡萄糖随时间的释放量在表I中示出。表1.都以每g预处理小麦秸DM的2.5和5mg蛋白剂量,添加或没有添加每g预处理小麦秸DM的2mg膨胀因子样蛋白(TEMER08806),通过FikraseQDNL以及含有相对于混合物的总蛋白的9 %、30 %、24%和37 %的相对量的1BG、ICBH1、ICBHI1、I纤维素酶增强蛋白(TEMER07589)的4种酶混合物(=4E),在pH 4.5和65°C下对2% DM洗涤的预处理小麦秸孵育期间的葡萄糖的释放量,表示为mmol/L。
权利要求
1.多肽,其包含SEQID NO:2中示出的氨基酸序列或SEQ ID NO:1的核苷酸序列编码的氨基酸序列,或其变体多肽或变体多核苷酸,其中所述变体多肽与SEQ ID NO:2中示出的序列具有至少73%的序列同一性,或所述变体多核苷酸编码与SEQ ID NO:2中示出的序列具有至少73%序列同一性的多肽。
2.根据权利要求1所述的多肽,其中所述多肽具有膨胀因子活性。
3.多核苷酸,其包含: (a)SEQ ID NO:1中示出的核苷酸序列;或 (b)与是SEQID NO:1的反向互补体的多核苷酸选择性杂交的核苷酸序列;或 (c)与SEQID NO:1的核苷酸序列具有至少78%序列同一性的核苷酸序列;或 (d)长度至少约100个核苷酸的(a)、(b)或(c)中定义的核苷酸序列的长度至少约100个核苷酸的片段;或 (e)序列,其是作为遗传编码的结果的(a)、(b)、(c)或(d)任一中定义的序列的简并体;或 (f)核苷酸序列,其为(a)、(b)、(C)、(d)或(e)中任一项所定义的核苷酸序列的反向互补体。
4.根据权利要求3所述的多核苷酸,其编码根据权利要求1或2所述的多肽。
5.根据权利要求3或4所述的多核苷酸,其为DNA序列。
6.包含根据权利要求3到5中任一项所述的多核苷酸的核酸构建体。
7.根据权利要求6所述的核酸构建体,其中GC含量为56%或更多,58%或更多,或从58%至 65%。
8.载体,其中包括根据权利要求3到5中任一项所述的多核苷酸序列。
9.细胞,其包含根据权利要求1或2所述的多肽、根据权利要求3到5中任一项所述的多核苷酸、根据权利要求6或7所述的核酸构建体或根据权利要求8所述的载体。
10.根据权利要求9所述的细胞,其中所述细胞是真核细胞。
11.根据权利要求10所述的细胞,其中所述细胞是真菌细胞。
12.根据权利要求11所述的细胞,其中所述真菌细胞选自由Aspergillus、Trichoderma/Hypocrea、Fusarium、Disporotrichum、Penicillium、Acremonium、Neurospora、Thermoascus、Myceliophtora、Sporotrichum、Thielavia、Chryosporium、Fusarium、Humicola、Neurospora 和 Talaromyces 属构成的组。
13.根据权利要求12所述的细胞,其中所述真菌细胞是Aspergillusoryzae、Aspergillus so jae、Aspergillus nidulans 或 Aspergillus niger 的种。
14.根据权利要求9-13中任一项所述的细胞,其中一个或多个基因被完全或部分破坏、敲除或缺失,其中任选地所述基因编码蛋白酶。
15.转基因植物或其部分,其包含根据权利要求3-5中任一项所述的多核苷酸、根据权利要求6或7所述的核酸构建体、根据权利要求8的载体或根据权利要求9-14中任一项所述的细胞,其中任选地所述植物是玉米植物、高粱植物、番茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、大麦植物、草或烟草植物;或Anacardium、Arachis> ragus、Atropa、Avena、Brassica、Citrus、Citrullus、Capsicum、CarthamusΛ Cocos、Coffea、ferae、Cucumis、Cucurbita 、Daucus、Elaeis、Fragaria、Glycine、Gossypium、Helianthus、Ocallis、Hordeum、Hyoscyamus> Lactuca、Linum、Lolium、Lupinus、Lycopersicon、Malus、Maj orana、Medicago、Nicotiana、Olea、Oryza、Panieum、Pannisetum、Persea、eolus、Pistachio、Pisum、Pyrus、Prunus、Raphanus、Ricinus、Secale、Senecio、Sinapis、Sorghum、Theobromus> Trigonella、Triticum、Vicia、Vitis、Vigna 或 Zea 属的植物。
16.用于制备根据权利要求1或2所述的多肽的方法,所述多肽具有降解碳水化合物材料和/或水解碳水化合物的活性,所述方法包括在允许所述多肽表达的条件下培养根据权利要求9到14中任一项所述的细胞,以及任选地,回收所表达的多肽。
17.组合物,其 包含⑴根据权利要求1或2所述的多肽;和(ii)纤维素酶和/或半纤维素酶和/或果胶酶和/或GH61家族的多肽成员。
18.根据权利要求17所述的组合物,其中所述纤维素酶是纤维二糖水解酶、纤维二糖水解酶1、纤维二糖水解酶11、内切-β -1,4-葡聚糖酶、β -葡糖苷酶或β - (I,3) (I,4)-葡聚糖酶。
19.根据权利要求17或18所述的组合物,其中所述半纤维素酶是内切木聚糖酶、β_木糖苷酶、a-L-阿拉伯呋喃糖苷酶、a-D-葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、α -半乳糖苷酶、β -半乳糖苷酶、β -甘露聚糖酶或β -甘露糖苷酶。
20.根据权利要求17到19中任一项所述的组合物,其中所述果胶酶是内切多聚半乳糖醛酸酶,果胶甲基酯酶,内切-半乳聚糖酶,β -半乳糖苷酶,果胶乙酰基酯酶,内切-果胶裂合酶,果胶酸裂合酶,α -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶,α -阿拉伯呋喃糖苷酶或内切-阿拉伯聚糖酶。
21.根据权利要求17到20中任一项所述的组合物,其包含木质酶、扩展蛋白、扩展蛋白样多肽、膨胀因子或编码纤维素整合蛋白或纤维素诱导的蛋白质的基因的多肽产物。
22.用于处理包含碳水化合物材料的底物、任选地处理植物材料的方法,所述方法包括使所述底物与根据权利要求1或2所述的多肽和/或根据权利要求17到21中任一项所述的组合物接触。
23.根据权利要求22所述的方法,其中所述底物是植物材料,所述植物材料以下述形式提供:植物、植物浆体、植物提取物、食品或源于其的成分,或包含植物材料的织物、纺织品或衣物。
24.根据权利要求22和/或权利要求23所述的方法,其中所述处理包括纤维素和/或半纤维素和/或果胶物质的降解和/或改性。
25.根据权利要求1或2所述的多肽和/或根据权利要求17到21中任一项所述的组合物用于从木质-纤维素材料生产糖的用途。
全文摘要
本发明涉及多肽,所述多肽包含SEQ ID NO2中示出的氨基酸序列或SEQ ID NO1的核苷酸序列编码的氨基酸序列,或其变体多肽或变体多核苷酸,其中变体多肽与SEQ ID NO2中示出的序列具有至少73%的序列同一性,或变体多核苷酸编码与SEQ ID NO2中示出的序列具有至少73%序列同一性的多肽。本发明描述了新颖基因的全长编码序列以及全长功能性多肽的氨基酸序列和所述基因或氨基酸序列的功能等同物。本发明还涉及在工业方法中使用所述多肽的方法。本发明还包括用根据本发明的多核苷酸转化的适用于生产这些蛋白质的细胞。
文档编号C07K14/37GK103180337SQ201180032943
公开日2013年6月26日 申请日期2011年6月23日 优先权日2010年6月29日
发明者玛格特·伊丽莎白·弗兰克希斯·休恩瓦尔德-贝格曼斯, 威尔伯特·赫尔曼·马里·海涅, 莫妮卡·戴安娜·弗拉西, 罗波图斯·安东尼厄斯·戴维尔德 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1