在丝状真菌宿主细胞中产生多种重组多肽的方法

文档序号:511323阅读:182来源:国知局
在丝状真菌宿主细胞中产生多种重组多肽的方法
【专利摘要】本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法。本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法。本发明还涉及表达具有生物活性的多种重组多肽的丝状真菌菌株。
【专利说明】在丝状真菌宿主细胞中产生多种重组多肽的方法
序列表的引用
本申请含有计算机可读形式的序列表,其通过引用的方式合并入本文。
发明领域
本发明涉及在丝状真菌宿主细胞中产生多种重组多肽的方法。
【背景技术】
在丝状真菌宿主细胞中重组产生多肽可以为生产商业相关量的多肽提供更为合意的载体。多肽的重组产生通常通过构建表达盒来实现,其中在表达盒中,将编码多肽的DNA置于来自调控基因的启动子的表达控制下。通常通过质粒介导的转化将表达盒导入到宿主细胞中。然后通过在表达盒中含有的启动子适当发挥作用所必需的诱导性条件下培养所转化的宿主细胞来实现多肽的生产。
可以通过涉及原生质体形成、原生质体的转化和细胞壁的再生的方法以本身已知的方式用载体转化丝状真菌细胞。用两种或更多种载体单独或一起(共转化)转化丝状真菌宿主细胞的效率是非常低的,并受到可用的可选择性标记物的可得性的限制。
本领域需要一些方法,通过将串联表达构建体定向至一个或多个(例如几个)特定基因组基因座来构建能够表达多种重组多肽的丝状真菌菌株,从而实现所需表达量的所有目标多肽。
本发明提供在丝状真菌宿主细胞中产生多种重组多肽的改进方法。

【发明内容】

本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,包
括:
(a)通过向丝状真菌菌株中导入第一串联构建体,通过祀向整合(targetedintegration)来取代内源性第一基因,该第一串联构建体包含:(i)第一基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合来取代内源性第二基因,该第二串联构建体包含:(i)第二 基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(V)第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。本发明还涉及丝状真菌菌株,其包含:
(a)通过向丝状真菌菌株中导入第一串联构建体经靶向整合被取代的内源性第一基因,该第一串联构建体包含:(i)第一基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过向丝状真菌菌株中导入第二串联构建体经靶向整合被取代的内源性第二基因,该第二串联构建体包含:(i)第二基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(V)第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含
(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子`可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合;以及任选地
(B)回收多种重组多肽。
本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;
(ii)一个或多个(例如,几个)可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)基因的同源3’区、其同源侧翼区或其组合。
本发明还涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
(a)通过祀向整合向内源性第一基因座中插入第一串联构建体,该第一串联构建体包含:(i)第一基因座的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合向内源性第二基因座中插入第二串联构建体,该第二串联构建体包含:(i)第二基因座的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(V)第二基因座的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合;
(ii)一个或多个第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因座的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合。
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第二可选择性标记物,
(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因座的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合;以及
(B)回收多种重组多肽。
本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;
(ii)一个或多个可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)基因座的同源3’区、其同源侧翼区或其组合。
【专利附图】

【附图说明】图1示出质粒PAG43的限制性酶切图谱。
图2示出质粒pSMai214的限制性酶切图谱。
图3示出质粒pDM287的限制性酶切图谱。
图4示出阳性转化体对于β-葡糖苷酶活性的比较:pDM287的45个转化子与pEJG107+pSMai214的45个转化子之间。
图5示出质粒pDM286的限制性酶切图谱。
图6示出质粒pDM290的限制性酶切图谱。
图7示出质粒pJfyS142的限制性酶切图谱。
图8示出质粒pJfyS144的限制性酶切图谱。
图9示出质粒pJfyS139的限制性酶切图谱。
图10示出质粒PQM18的限制性酶切图谱。
图11示出质粒PQM21的限制性酶切图谱。
图12示出质粒pAG121的限制性酶切图谱。
图13示出质粒pRRABOl的限制性酶切图谱。
图14示出质粒pDFngll3-3的限制性酶切`图谱。
图15示出质粒pAmFs074的限制性酶切图谱。
图16示出质粒PQM22的限制性酶切图谱。
【具体实施方式】
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”是指催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α -萘酯和乙酸对硝基苯酯水解的羧酸酯酶(E.C.3.1.1.72)。出于本发明的目的,乙酰木聚糖酯酶的活性是使用在含0.01% TWEEN?20 (聚氧乙烯失水山梨醇单月桂酸酯)的50mM乙酸钠pH5.0中的0.5mM乙酸对硝基苯酯作为底物而确定的。一个单位的乙酰木聚糖酯酶被定义为能够在pH5、25°C下每分钟释放I微摩尔(μ mole)对硝基苯酚阴离子的酶量。
等位变体(allelic variant):术语“等位变体”是指占据同一染色体基因座的基因的两种或更多种(例如,几种)可选形式中的任意种。等位变化通过突变而自然发生,并可能引起种群内的多态性。基因突变可以是沉默的(在所编码的多肽中没有变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体所编码的多肽。
a -L-阿拉伯呋喃糖苷酶:术语“ a -L-阿拉伯呋喃糖苷酶”是指催化a _L_阿拉伯糖苷中末端非还原性a-L-阿拉伯呋喃糖苷残基的水解的a-L-阿拉伯呋喃糖苷阿拉伯呋喃水角军酶(alpha-L-arabinofuranoside arabinofuranohydrolase) (E.C.3.2.1.55)。该酶作用于a-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖、和阿拉伯半乳聚糖。a-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或a-L-阿拉伯聚糖酶。出于本发明的目的,a -L-阿拉伯呋喃糖苷酶的活性是使用总体积200 μ I的IOOmM乙酸钠ρΗ5中的每 ml5mg 中等粘度小麦阿拉伯木聚糖(Megazyme International Ireland, Ltd., Bray,C0.Wicklow,爱尔兰)在40°C下30分钟,随后通过AMINEX? HPX-87H柱层析(Bio-RadLaboratories, Inc., Hercules, CA,美国)的阿拉伯糖分析而确定的。
α -葡糖醛酸糖苷酶:术语“ α -葡糖醛酸糖苷酶”是指催化a -D-葡糖苷酸水解为D-葡糖醒酸和醇的a -D-葡糖苷酸葡糖醒酸水解酶(alpha-D-glucosiduronateglucuronohydrolase) (E.C.3.2.1.139)。出于本发明的目的,α -葡糖醒酸糖苷酶活性是根据de Vries, 1998,J.Bacteriol.180:243-249而确定的。一个单位的α -葡糖醒酸糖苷酶等于能够在pH5、40°C下每分钟释放I微摩尔的葡糖醛酸或4-0-甲基葡糖醛酸的酶量。
天冬氨酸蛋白酶:术语“天冬氨酸蛋白酶”是指使用天冬氨酸残基来催化肽和蛋白中肽键的水解的蛋白酶。天冬氨酸蛋白酶是使用天冬氨酸残基来催化它们的肽底物的水解的蛋白酶家族。一般情况下,它们在活性位点中具有两个高度保守的天冬氨酸盐(酯),且在酸性 pH 下活性最佳(Szecsi, 1992, Scand.J.Clin.Lab.1n vest.Supp1.210:5 - 22)。出于本发明的目的,天冬氨酸蛋白酶活性根据Aikawa等人、2001,J.Biochem.129:791-794描述的过程来确定。
β-葡糖苷酶:术语“β-葡糖苷酶”是指催化末端非还原性β-D-葡萄糖残基的水解并释放β -D-葡萄糖的β -D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase) (E.C.3.2.1.21)。出于本发明的目的,β -葡糖苷酶活性是根据Venturi等人,2002,Extracellular beta-D-glucosidase from Chaetomium thermophilum var.coprophilum:production, purification and some biochemical properties,J.BasicMicrobiol.42:55-66的过程使用对硝基苯基-β _D_吡喃葡糖苷作为底物而确定的。一个单位的β -葡糖苷酶被定义为在25°C、pH4.8下在含0.01%TWEEN? 20的50mM柠檬酸钠中从作为底物的ImM对硝基苯基-β -D-吡喃葡糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
β -木糖苷酶:术语“ β -木糖苷酶”是指催化短β -(4)-低聚木糖的外水解以从非还原性末端去除连续的D-木糖残基的β -D-木糖苷木糖水解酶(EC3.2.1.37)。出于本发明的目的,一个单位的木糖苷酶被定义为在40°C、pH5下在含0.01% TWEEN? 20的IOOmM柠檬酸钠中从作为底物的ImM对硝基苯基-β -D-木糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
cDNA:术语“cDNA”是指可以通过反转录从成熟的、剪接的从真核或原核细胞获得的mRNA分子制备而来的DNA分子。cDNA缺少可以存在于对应基因组DNA中的内含子序列。最初的初级RNA转录体是在呈现为成熟剪接的mRNA前的经由一系列步骤包括剪接而加工的mRNA的前体。
纤维二糖水解酶:术语“纤维二糖水解酶”是指催化纤维素、纤维寡糖、或任何含有β-1,4-连接的葡萄糖的聚合物中l,4-13-D-糖苷键的水解以从链的还原末端或非还原末端释放纤维二糖的1,4-β-?-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和Ε.C.3.2.1.176) (Teeri,1997,Crystalline cellulose degradation:New insightinto the function of cellobiohydrolases, Trends in Biotechnologyl5:160—167 ;Teeri 等人,1998, Trichoderma reesei cellobiohydrolases:why so efficienton crystalline cellulose ? Biochem.Soc.Trans.26:173-178)?纤维二糖水解酶活性根据 Lever 等人,1972,Anal.Biochem.47:273-279 ;van Tilbeurgh 等人,1982,FEBS Letters, 149:152-156 ;van Tilbeurgh and Claeyssens, 1985, FEBSLetters, 187:283-288 ;以及 Tomme 等人,1988,Eur.J.Biochem.170:575-581 描述的过程来确定。在本发明中,Tomme等人的方法可被用于确定纤维二糖水解酶的活性。
纤维分解酶或纤维素酶:术语“纤维分解酶”或“纤维素酶”是指一种或多种(例如,几种)水解纤维素材料的酶。这样的酶包括内切葡聚糖酶、纤维二糖水解酶、葡糖苷酶或其组合。测量纤维分解活性的两种基本方法包括:(1)测量总纤维分解活性,和(2)测量单独的纤维分解活性(内切葡聚糖酶、纤维二糖水解酶和β_葡糖苷酶),如 Zhang 等人,Outlook for cellulase improvement: Screening and selectionstrategies, 2006, Biotechnology Advances24:452-481 所综述的。总纤维分解活性通常是使用不溶性底物来测量的,该底物包括Whatman No I滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木质纤维素等。最常见的总纤维分解活性检定是使用Whatman N2 I滤纸作为底物的滤纸检定。该检定是由国际纯粹与应用化学联合会(International Unionof Pure and Applied Chemistry, IUPAC)石角立的(Ghose, 1987, Measurement of cellulaseactivities,Pure App1.Chem.59:257-68)。
出于本发明的目的,纤维分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料的水解的增加而加以确定~50mg纤维分解酶蛋白/g PCS中纤维素(或其他经预处理的纤维素材料),在合适的温度例如50°C、55°C或60°C下3~7天,与未添加纤维分解酶蛋白的对照水解相比较。通常条件为:1ml反应物,经洗涤或未洗涤的PCS,5%不溶性固体,50mM 乙酸钠pH5,ImM MnSO4,50°C、55°C或60°C,72 小时,通过 AMINEX? HPX-87H柱(Bio-Rad Laboratories, Inc., Hercules, CA,美国)进行糖分析。
纤维素材料:术语“纤维素材料”是指包含纤维素的任何材料。在生物质的初生细胞壁中的主要多糖是纤维素,其次丰富的是半纤维素,而第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,且次生细胞壁通过与半纤维素共价交联的聚合木质素而进行加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链β_ (1-4)-D-葡聚糖;而半纤维素包括多种化合物,例如 木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,处于具有系列取代基的复杂分支结构。尽管通常是多晶形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其他半纤维素以氢键相连,这帮助稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于Handbook onBioethanol(Charles E.Wyman 编辑),pp.105-118,Taylor&Francis, Washington D.C.;Wyman,1994, Bioresource Technology50:3-16 ;Lynd, 1990, Applied Biochemistry andBiotechnology24/25:695-719 ;Mosier 等人,1999,Recent Progress in Bioconversionof Lignocellulosicsj 于 Advances in Biochemical Engineering/Biotechnology, T.Scheper 主编,Volume65,pp.23-40,Springer-Verlagj New York)。在本文中应理解的是,纤维素可以是木质纤维素的形式,即在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,纤维素材料是木质纤维素,其包含纤维素、半纤维素和木质素。在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
在另一个方面,纤维素材料是芦竹。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸杆。在另一个方面,纤维素材料是芒草。在另一个方面,纤维素材料是橘皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是柳枝稷。在另一个方面,纤维素材料是麦杆。
在另一个方面,纤维素材料是山杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是冷杉。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。
在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉绒。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
在另一个方面,纤维素材料是水生生物质。如本文所使用的,术语“水生生物质”是指在水生环境中由光合作用过程产生的生物质。水生生物质可以为藻类、挺水植物、浮叶植物或沉水植物。
如本文所述,纤维素材料可以使用本领域已知的常规方法按原样使用或进行预处理。在优选的方面,纤维素材料被预处理。
编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框确定,开放阅读框以起始密码子如ATG、GTG或TTG开始并以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”是指编`码多肽的多核苷酸在表达时所必需的核酸序列。各个控制序列对于编码多肽的多核苷酸可以是内生的(即,来自相同基因)或外来的(即,来自不同基因)或彼此为内生或外来的。这些控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最低限度,控制序列包括启动子、以及转录和翻译终止信号。控制序列可以设有接头,以用于导入特定的促进控制序列与编码多肽的多核苷酸编码区进行连接的限制性酶切位点。
异位整合:术语“异位整合”是指向微生物的基因组在非靶位点或除其通常的染色体基因座以外的位点插入核酸,即,随机整合。
内切葡聚糖酶:术语“内切葡聚糖酶”是指催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键的内水解(endohydrolysis),催化混合的β-1,3-葡聚糖例如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β -1,4键的内水解的内切-1,4- (1,3 ; 1,4) - β -D-葡聚糖4-葡聚糖水解酶(endo-1, 4-(1, 3 ; I, 4) -beta-D-glucan4-glucanohydrolase) (E.C.3.2.1.4)。内切葡聚糖酶的活性可以通过测量底物粘度的减少或由还原糖检定(Zhang等人,2006,BiotechnologyAdvances24:452-481)确定的还原端的增加来确定。出于本发明的目的,内切葡聚糖酶的活性根据Ghose, 1987, Pure and Appl.Chem.59:257-268 的方法,在pH5、40°C下使用羧甲基纤维素(CMC)作为底物而确定。
表达:术语“表达”包括在多肽生产中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”是指包含编码多肽的多核苷酸并与提供用于其表达的控制序列可操作地连接的线性或环状DNA分子。
糖苷水解酶61家族:术语“糖苷水解酶61家族”或“GH61家族”或“GH61”是指根据 Henrissat B., 1991,A classification of glycosyl hydrolases based onamino-acid sequence similarities, Biochem.J.280:309-316 及 Henrissat B.和Bairoch A., 1996, Updating the sequence-based classification of glycosylhydrolases, Biochem.J.316:695-696而落入糖苷水解酶61家族的多肽。原先,该家族中的酶基于一个家族成员中测量的非常弱的内切-1,4-β -D-葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非公认的,且它们无法被视为真正的糖苷酶。然而,基于它们在与纤维素酶或纤维素酶的混合物一同使用时增强木质纤维素分解的能力,它们被保留在CAZy分类中。
阿魏酸酯酶:术语“阿魏酸酯酶”是指催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(在天然生物质底物中通常为阿拉伯糖)中水解以产生阿魏酸酯(盐)(4-羟基-3-甲氧基肉桂酸酯(盐))的4-羟基-3-甲氧基肉桂酰-糖水解酶(EC3.1.1.73)。阿魏酸酯酶也被称为阿魏酸酯酶、羟基肉桂酰基酯酶、FAE-1I1、肉桂酸酯水解酶、FAEA、cinnAE、FAE-1或FAE-1I。出于本发明的目的,阿魏酸酯酶的活性是使用50mM乙酸钠pH5.0中的0.5mM阿魏酸对硝基苯酯作为底物而确定的。一个单位的阿魏酸酯酶等于能够在pH5、25°C下每分钟释放I微摩尔对硝基苯酚阴离子的酶量。
侧翼:术语“侧翼”是指在特定DNA序列、基因座或基因的任一侧延伸的DNA序列。侧翼DNA紧邻将要整合到丝状真菌细胞的基因组中的另一 DNA序列、基因座或基因。` 片段:术语“片段”是指在成熟多肽域的氨基端和/或羧基端缺少一个或多个(如,几个)氨基酸的多肽;其中该片段具有酶活性。在一方面,片段含有酶的成熟多肽的至少85 %,例如至少90 %或至少95 %的氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”是指一种或多种(例如,几种)水解半纤维素材料的酶。参见,例如Shallom, D.和Shoham, Y.Microbialhemicellulases.Current Opinion In Microbiology, 2003,6 (3): 219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括,但不限于,乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖苷酸酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支链和直链多糖的混杂群,它们通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为稳定网路。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变结构和组织需要许多酶的协同作用来使其完全降解。半纤维素酶的催化单元为水解糖苷键的糖苷水解酶(GH),或水解乙酸酯或阿魏酸侧基的酯键的糖酯酶(CE)。这些催化单元,基于其一级序列的同源性,可分类到GH和CE家族。具有总体上类似的折叠的一些家族还可以归类为宗族,按字母顺序标记(例如,GH-A)。这些和其他糖类活性酶的最具信息性和最新的分类可以在糖类活性酶(CAZy)数据库中获得。半纤维素分解酶活性可以根据 Ghose 和 Bisaria, 1987,Pure & Appl.Chem.59:1739-1752 在合适的温度例如50°C、55°C或60°C以及pH例如5.0或5.5下进行测量。
高等严格条件:术语“高等严格条件”是指至少100个核苷酸长度的探针于42°C在5XSSPE、0.3% SDS,200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交,遵循标准DNA印迹程序进行12至24小时。载体材料最后使用2XSSC、0.2% SDS在65 °C洗涤三次,每次15分钟。
同源3’或5’区:术语“同源3’区”是指以下DNA片段,其与基因组中区域的序列相同或者序列同一性为至少70 %,例如至少75 %、至少80 %、至少81 %、至少82 %、至少83 %、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %,并且当与同源5’区结合时可以通过同源重组将一条DNA靶向整合至基因组中的特定位点。术语“同源5’区”是指以下DNA片段,其与基因组中区域的序列相同,并且当与同源3’区结合时可以通过同源重组将一条DNA靶向整合至基因组中的特定位点。同源5’和3’区必须连接在基因组中,这意味着它们处于同一染色体中,彼此在至少200kb内。
同源侧翼区:术语“同源侧翼区”是指以下DNA片段,其与基因组中区域的序列相同或者序列同一性为至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %,并且紧邻基因组中的细胞外DNA靶向整合入的特定位点的上游或下游。
同源重复:术语“同源重复”是指在导入宿主细胞的重组DNA中重复至少两次且可以通过同源重组而促进DNA( 即,插在两个同源重复之间的可选择性标记物)的丢失的DNA片段。
宿主细胞:术语“宿主细胞”是指对具有含编码多肽的多核苷酸的核酸构建体或表达载体的转化、转染、转导等敏感的任何细胞类型。术语“宿主细胞”包括由于复制过程中发生的突变而不与亲本细胞相同的任何亲本细胞后代。
分离的:术语“分离的”是指,处于非天然发生的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质;(2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅助因子的任何物质,其至少部分地从与其天然相关联的一种或多种或所有天然发生成分中移出;(3)相对于天然发现的物质,经人工修饰的任何物质;或者(4)通过增加物质相对于与其天然相关的其他组分的含量而修饰的任意物质(例如,宿主细胞中的重组生产;多个拷贝的物质编码基因;相比于与编码物质的基因天然相关的启动子,使用更强的启动子)。
低等严格条件:术语“低等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3% SDS,200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交,遵循标准DNA印迹过程进行12~24个小时。载体材料最终使用2XSSC、0.2%SDS在50°C下洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”是指翻译和任何翻译后修饰例如N-端加工、C-端截短、糖基化、磷酸化等之后的最终形式的多肽。在一方面,基于预测SEQ ID NO:2的氨基酸I~17是信号肽的 SignalP 程序(Nielsen 等人,1997, Protein EngineeringlO: 1-6),里氏木霉(T.Reesei)纤维二糖水解酶I的成熟多肽是SEQ ID NO:2的氨基酸18~514。另一方面,基于预测SEQ ID NO:4的氨基酸I~18是信号肽的SignalP程序,里氏木霉纤维二糖水解酶II的成熟多肽是SEQ ID NO:4的氨基酸19~471。另一方面,基于预测SEQ ID NO:6的氨基酸I~22是信号肽的SignalP程序,里氏木霉内切葡聚糖酶I的成熟多肽是SEQ IDNO:6的氨基酸23~459。另一方面,基于预测SEQ ID NO:8的氨基酸I~21是信号肽的SignalP程序,里氏木霉内切葡聚糖酶II的成熟多肽是SEQ ID NO:8的氨基酸22~418。另一方面,基于预测SEQ ID NO: 10的氨基酸I~19是信号肽的SignalP程序,里氏木霉β-葡糖苷酶的成熟多肽是SEQ ID NO: 10的氨基酸20~744。另一方面,基于预测SEQ IDNO: 12的氨基酸I~19是信号肽的SignalP程序,里氏木霉木聚糖酶I的成熟多肽是SEQID NO: 12的氨基酸20~229。另一方面,基于预测SEQ ID NO: 14的氨基酸I~19是信号肽的SignalP程序,里氏木霉木聚糖酶II的成熟多肽是SEQ ID NO: 14的氨基酸20~223。另一方面,基于预测SEQ ID NO: 16的氨基酸I~16是信号肽的SignalP程序,里氏木霉木聚糖酶III的成熟多肽是SEQ ID NO: 16的氨基酸17~347。另一方面,基于预测SEQ IDNO: 18的氨基酸I~20是信号肽的SignalP程序,里氏木霉β -木糖苷酶的成熟多肽是SEQID NO: 18的氨基酸21~797。另一方面,基于预测SEQ ID NO:20的氨基酸I~18是信号肽的SignalP程序,里氏木霉膨胀因子的成熟多肽是SEQ ID NO: 20的氨基酸19~493。另一方面,基于预测SEQ ID NO:22的氨基酸I~19是信号肽的SignalP程序,里氏木霉的枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO: 22的氨基酸20~882。另一方面,基于预测SEQ ID NO: 24的氨基酸I~20是信号肽的SignalP程序,里氏木霉天冬氨酸蛋白酶的成熟多肽是SEQ ID NO:24的氨基酸21~407。另一方面,基于预测SEQ ID NO:26的氨基酸I~19是信号肽的SignalP程序,里氏木霉胰蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO: 26的氨基酸20~259。另一方面,基于预测SEQ ID NO: 28的氨基酸I~15是信号肽的SignalP程序,另一种里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO:28的氨基酸16~540。另一方面,基于预测SEQ ID NO:30的氨基酸I~17是信号肽的SignalP程序,另一种里氏木霉天冬氨酸蛋白酶的成熟多肽是SEQ ID Ν0:30的氨基酸18~395。在本领域已知宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(例如,具有不同的C-端和/或N-端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序`列”是指编码具有酶活性的成熟多肽的多核苷酸。在一方面,基于预测SEQ ID NO:1的核苷酸I~51编码信号肽的SignalP程序,里氏木霉纤维二糖水解酶I的成熟多肽编码序列是SEQ ID NO:1的核苷酸52~1545或其cDNA序列。另一方面,基于预测SEQ ID NO:3的核苷酸I~54编码信号肽的SignalP程序,里氏木霉纤维二糖水解酶II的成熟多肽编码序列是SEQ ID NO:3的核苷酸55~1608或其cDNA序列。另一方面,基于预测SEQ ID NO: 5的核苷酸I~66编码信号肽的SignalP程序,里氏木霉内切葡聚糖酶I的成熟多肽编码序列是SEQ ID NO:5的核苷酸67~1374或其cDNA序列。另一方面,基于预测SEQ ID NO:7的核苷酸I~63编码信号肽的SignalP程序,里氏木霉内切葡聚糖酶II的成熟多肽编码序列是SEQ ID NO:7的核苷酸64~1254或其cDNA序列。另一方面,基于预测SEQ ID NO:9的核苷酸I~57编码信号肽的SignalP程序,里氏木霉β-葡糖苷酶的成熟多肽编码序列是SEQ ID ΝΟ:9的核苷酸58~2612或其cDNA序列。另一方面,基于预测SEQ ID NO: 11的核苷酸I~57编码信号肽的SignalP程序,里氏木霉木聚糖酶I的成熟多肽编码序列是SEQ ID NO: 11的核苷酸58~749或其cDNA序列。另一方面,基于预测SEQ ID NO: 13的核苷酸I~57编码信号肽的SignalP程序,里氏木霉木聚糖酶II的成熟多肽编码序列是SEQ ID NO: 13的核苷酸58~778或其cDNA序列。另一方面,基于预测SEQ ID NO: 15的核苷酸I~48编码信号肽的SignalP程序,里氏木霉木聚糖酶III的成熟多肽编码序列是SEQ ID NO: 15的核苷酸49~1349或其cDNA序列。另一方面,基于预测SEQ ID NO: 17的核苷酸I~60编码信号肽的SignalP程序,里氏木霉木糖苷酶的成熟多肽编码序列是SEQ ID NO: 17的核苷酸61~2391或其cDNA序列。另一方面,基于预测SEQ ID NO: 19的核苷酸I~54编码信号肽的SignalP程序,里氏木霉膨胀因子的成熟多肽编码序列是SEQ ID NO: 19的核苷酸55~2776或其cDNA序列。另一方面,基于预测SEQ ID NO: 21的核苷酸I~57编码信号肽的SignalP程序,里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:21的核苷酸58~2774。另一方面,基于预测SEQ ID NO: 23的核苷酸I~60编码信号肽的SignalP程序,里氏木霉天冬氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:23的核苷酸61~1299。另一方面,基于预测SEQ ID NO:25的核苷酸I~57编码信号肽的SignalP程序,里氏木霉胰蛋白酶样蛋白酶的成熟多肽编码序列是SEQ ID NO:25的核苷酸58~930。另一方面,基于预测SEQ ID NO: 27的核苷酸I~45编码信号肽的SignalP程序,另一种里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:27的核苷酸46~1681。另一方面,基于预测SEQ ID NO:29的核苷酸I~51编码信号肽的SignalP程序,另一种里氏木霉天冬氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:29的核苷酸52~1339。
中等严格条件:术语“中等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3% SDS,200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12~24个小时。载体材料最终使用2XSSC、0.2%SDS在55 °C下洗涤三次,每次15分钟。
中到高等严格条件:术语“中到高等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3% SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12~24个小时。载体材料最终使用2 X SSC、0.2% SDS在60V下洗涤三次,每次15分钟。
核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离出或以自然中不会出现或是合成的方式修饰成包含核酸片段,其包含一个或多个(例如,几个)控制序列。
可操作地连接:术语“可操作地连接”是指一种构造,其中控制序列位于相对于多核苷酸的编码序列为合适的位置,从而使控制序列引导编码序列的表达。
具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”是指通过具有纤维素分解活性的酶来催化纤维素材料水解的增强的GH61多肽。出于本发明的目的,通过测量由纤维素分解酶在下述条件下水解纤维素材料而来的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性=PCS中的I~50mg总蛋白/g纤维素,其中总蛋 白包含50~99.5% w/w的纤维素分解酶蛋白和0.5~50% w/w的具有纤维素分解增强活性的GH61多肽的蛋白,在合适的温度例如50°C、55°C或60°C以及pH例如5.0或5.5下I~7天,与用等量的无纤维素分解增强活性的总蛋白加载量(PCS中的I~50mg纤维素分解蛋白/g纤维素)所进行的对照水解相比。在优选的方面,在2~3%总蛋白质重量的米曲霉(Aspergillus oryzae) β -葡糖苷酶(根据W002/095014在米曲霉中重组产生)或2~3%总蛋白质重量的烟曲霉(Aspergillus fumigatus) β -葡糖苷酶(根据W02002/095014在米曲霉中重组产生)的纤维素酶蛋白质加载量的存在下将CELLUCLAST? 1.5L (Novozymes A/S, BagSViErd, Denmark)的混合物用作纤维素分解活性的来源。
具有纤维素分解增强活性的GH61多肽通过降低达到相同水解程度所需的纤维素分解酶的量来增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.0l倍,例如至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍或至少20倍。
经预处理的玉米秸杆:术语“PCS”或“经预处理的玉米秸杆”是指通过用热和稀硫酸处理、碱预处理或中性预处理而得自玉米秸杆的纤维素材料。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联性通过参数“序列同一'I"生”来描述。
出于本发明的目的,使用在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite (欧洲分子生物学开放软件包),Rice 等人,2000, TrendsGenet.16:276-277)(优选 5.0.0 或更新版本)的 Needle 程序中执行的 Needleman-Wunsch算法(Needleman and Wunsch, 1970,J.Mol.Biol.48:443-453),来确定两个氛基酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EBL0SUM62 (BL0SUM62的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的)被用作百分比同一性并计算如下:
(相同残基X 100)/(比对长度-比对中的空位总数)。
出于本发明的目的,使用 在EMBOSS软件包(EMBOSS:The European Molecular BiologyOpen Software Suite (欧洲分子生物学开放软件包),Rice等人,2000,同上)(优选5.0.0或更新版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman andWunsch, 1970,同上),来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的)被用作百分比同一性并计算如下:
(相同的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)。
子序列:术语“子序列”是指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如,几个)核苷酸的多核苷酸;其中子序列编码具有酶活性的片段。在一个方面,子序列含有酶的成熟多肽编码序列的至少85%,例如,至少90%或至少95%的核苷酸。
枯草杆菌蛋白酶样丝氨酸蛋白酶:术语“枯草杆菌蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于枯草杆菌蛋白酶的蛋白酶,枯草杆菌蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。枯草杆菌蛋白酶样蛋白酶(枯草杆菌酶)为丝氨酸蛋白酶,其特征在于三个氨基酸天冬氨酸、组氨酸和丝氨酸的催化三联体(catalytic triad)。这些催化残基的排布为来自地衣芽孢杆菌(Bacillus licheniformis)的原型枯草杆菌蛋白酶所共有(Siezen和Leunissen, 1997, Prot ein Science 6:501-523)。枯草杆菌蛋白酶样丝氨酸蛋白酶的活性可以使用合成的底物N-琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基酰苯胺(AAPF) (BachemAG, Bubendorf,瑞士 )于 IOOmM NaCl-1OOmM MOPS pH7.0 中在 50°C下 3 小时并接着测量在405nm处吸光度而确定。
靶向整合:术语“靶向整合”是指细胞外DNA在指定的基因组基因座处的稳定整合。 转化体:术语“转化体”是指已接纳胞外DNA(外来的、人工的或修饰的)并表达包含其中的基因的细胞。
转化:术语“转化”是指将胞外DNA导入细胞,即,由从其周围直接摄入、整合并表达外来遗传物质(外来DNA)以及经细胞膜接收而引起的细胞的遗传改变。
转化效率:术语“转化效率”是指细胞能够摄入胞外DNA并表达其中所含的基因的效率,转化效率通过将表达基因的阳性转化体的数目除以转化过程中使用的DNA量来计算。
胰蛋白酶样丝氨酸蛋白酶:术语“胰蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于胰蛋白酶的蛋白酶,胰蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。出于本发明的目的,胰蛋白酶样丝氨酸蛋白酶的活性是根据Dienes等人,2007,Enzyme and MicrobialTechnology40:1087-1094所述的方法而确定的。
变体:术语“变体”是指,在一个或多个(例如,几个)位置上包含改变(即替换、插入和/或缺失)的具有酶活性的多肽。替换是指用不同的氨基酸取代占据位置的氨基酸;缺失是指去除占据位置的氨基酸;而插入是指将氨基酸添加至紧邻占据位置的氨基酸。
极高等严格条件:术语“极高等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3% SDS,200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12至24个小时。载体材料最终使用2XSSC、0.2% SDS在70°C下洗涤三次,每次15分钟。
极低等严格条件:术语“极低等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3% SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12至24个小时。载体材料最终使用2XSSC、
0.2% SDS在45°C下洗涤三次,每次15分钟。
含木聚糖的材料:术语“含木聚糖的材料”是指任何包含植物细胞壁多糖的材料,植物细胞壁多糖含有β-(1-4)-连接的木糖残基的骨架。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖骨架的杂聚物,其由短的糖链分支。它们包含D-葡糖醛酸或其4-0-甲基酿、L-阿拉伯糖和/或多种由D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-匍萄糖构成的寡糖。木聚糖类的多糖可以分为均木聚糖(homoxylan)和杂木聚糖(heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯木聚糖、阿拉伯木聚糖和复合杂木聚糖。参见,例如Ebringerova等人,2005,Adv.Polym.Sc1.186:1-67。
在本发明的方法中,可以使用任何含有木聚糖的材料。在优选的方面,含木聚糖的材料为木质纤维素。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”是指水解含木聚糖的材料的生物学活性。两种基础的测量木聚糖分解活性的方法包括:(I)测量总木聚糖分解活性,
和⑵测量单个的木聚糖分解活性(例如,内切木聚糖酶、β_木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(alpha-glucuronyl esterase))。木聚糖分解酶检定的最新进展被总结于几个公开文献中,包括 Biely and Puchard, Recent progress in the assays of xylanolyticenzymes, 2006, Journal of the Science of Food and Agriculture86(11):1636-1647 ;Spanikova and Biely,2006, Glucuronoyl esterase-Novel carbohydrate esteraseproduced by Schizophyllum commune, FEBS Letters580(19):4597-4601 ;Herrmann,Vrsanska, Jurickova, Hirsch, Biely and Kubicek,1997, The beta-D-xylosidase ofTrichoderma reesei is a multifunctional beta—D—xylan xylohydrolase, BiochemicalJournal321:375-381。
总木聚糖降解活性可以通过确定由多种类型的木聚糖形成的还原糖来测量,木聚糖包括,例如,燕麦(oat spelt)、山毛榉材和落叶松材木聚糖,或可以通过光度法确定从多种共价染色的木聚糖中释放出的染色木聚糖片段而测量。最常见的总木聚糖分解活性检定基于由多聚4-0-甲基葡糖醒酸木聚糖生产还原糖,如Bailey, Biely, Poutanen, 1992,Interlaboratory testing of methods for assay of xylanase activity> Journal ofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可以用0.2% AZCL-阿拉伯木聚糖作为底物在37°C下于0.01%TRITON? X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH6中加以确定。一个单位的木聚糖酶活性定义为在37°C、pH6下在200mM磷酸钠pH6缓冲液中从作为底物的0.2% AZCL-阿拉伯木聚糖中每分钟产生1.0微摩尔可可碱醋酸钠(azurine)。
出于本发明的目的,木聚糖降解活性是通过在以下通常条件下测量由木聚糖降解酶引起的白桦木聚糖(Sigma Chemical C0.,Inc.,St.Louis, MO,美国)水解的增加而确定的:1ml反应,5mg/ml底物(总固体),5mg木聚糖分解蛋白/g底物,50mM乙酸钠pH5,50 °C, 24 小时,如 Lever, 1972,A new reaction for colorimetric determination ofcarbohydrates, Anal.Biochem47:273-279所述的使用对羟基苯甲酸酸餅(PHBAH)检定的糖分析。
木聚糖酶:术语“木聚糖酶”是指催化木聚糖中l,4-13-D-木糖苷键的内水解的
I,4-β -D-木聚糖-木糖水`解酶(I, 4-beta-D-xylan-xylohydrolase) (E.C.3.2.1.8)。出于本发明的目的,木聚糖酶活性是用0.2% AZCL-阿拉伯木聚糖作为底物在37°C下于0.01%TRITON? X-100和200mM磷酸钠缓冲液pH6中加以确定的。一个单位的木聚糖酶活性定义为在37°C、pH6下于200mM磷酸钠pH6缓冲液中从作为底物的0.2% AZCL-阿拉伯木聚糖中每分钟产生1.0微摩尔可可碱醋酸钠。
发明详述
本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合。
本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)基因的同源3’区、其同源侧翼区或其组合。
本发明还涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合插入到内源性第一基因座中,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合插入到内源性第二基因座中,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因座的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合。
本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)基因座的同源3’区、其同源侧翼区或其组合。`
在本发明的方法中,各个串联构建体均通过双同源重组整合至丝状真菌菌株染色体中的目标位点。在一方面,第一基因或第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少lOObp、至少200bp、至少400bp、至少800bp、至少lOOObp、至少1500bp或至少2000bp。另一方面,第一基因或第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少lOObp、至少200bp、至少400bp、至少800bp、至少lOOObp、至少1500bp或至少2000bp。另一方面,第二基因或第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少lOObp、至少200bp、至少400bp、至少800bp、至少lOOObp、至少1500bp或至少2000bp。另一方面,第二基因或第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少lOObp、至少200bp、至少400bp、至少800bp、至少lOOObp、至少1500bp或至少2000bp。
本发明的方法还可以包括将一个或多个(例如,几个)其他内源性基因各自通过靶向整合用针对各个基因的对应串联构建体取代,串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)可选择性标记物;(iii)与启动子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(V)基因的同源3’区、其同源侧翼区或其组合。
本发明的方法还可以包括向一个或多个(例如,几个)其他内源性基因座中各自通过靶向整合插入针对各个基因座的对应串联构建体,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(V)基因座的同源3’区、其同源侧翼区或其组合。
在本发明的方法中,丝状真菌宿主细胞还可以用串联构建体进行转化,该串联构建体包含:(i) 一个或多个(例如,几个)可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中串联构建体通过异位整合来整合。
本发明提供几项优势,包括在丝状真菌宿主中产生多种重组多肽的改良方法;使得一个或多个导入到丝状真菌菌株中的重组多肽可以简单地得以取代和/或缺失的方法(如果一个或多个重组多肽在单个基因座处导入,该一个或多个重组多肽可以在单一步骤中被取代和/或缺失,而不是在多个步骤中);以及使得丝状真菌宿主中存在的一个或多个重组多肽可以简单地得以修饰(如果一个或多个重组多肽在单个基因座处导入,一个或多个这些重组多肽的变体/突变体可以很容易地在单一步骤中加以修饰,而不是在多个步骤中)。本发明构建的丝状真菌菌株的其他优势是可以诱变菌株并选择收率提高的突变体。然后可以将这些突变体的串联构建体用表达新的多种重组多肽的新的串联构建体取代,从而利用作为宿主细胞的突变体的提高的收率生产率。
内源性基因
在本发明的方法中,任何对于丝状真菌菌株来说为内源性的的基因可以被取代,或者可以是基因座。基因对于丝状真菌菌株来说可以是内生的或外来的。术语“内源性基因”或其变型,例如,“内源性第一基因”或“内源性第二基因”将理解成包括一个或多个(例如,几个)基因。当多于一个基因被取代时,基因优选是邻接的。这样的多个基因可以是,例如,代谢通路或其一部分。
内源性基因可以编码选自抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫增强剂(immunodiIator)、神经递质、受体、报告蛋白质、结构蛋白或转录因子的多肽。
在一方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。另一方面,酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α -淀粉酶、α -半乳糖苷酶、α _葡糖苷酶、α -1, 6-葡糖苷转移酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、β -半乳糖苷酶、β -葡糖苷酶、β -木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精 糖基转移酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解促进活性的GH61多肽、葡糖脑苷脂酶、葡萄糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、卤过氧化物酶(halopeiOxidase)、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶和木聚糖酶。
另一方面,一个或多个(例如,几个)内源性蛋白酶基因是失活的。另一方面,一个或多个(例如,几个)内源性蛋白酶基因是枯草杆菌蛋白酶样丝氨酸蛋白酶、天冬氨酸蛋白酶和胰蛋白酶样丝氨酸蛋白酶基因,如W02011/075677中所述,其通过引用的方式全部并入本文。
另一方面,酶是枯草杆菌蛋白酶样丝氨酸蛋白酶。另一方面,酶是天冬氨酸蛋白酶。另一方面,酶是胰蛋白酶样丝氨酸蛋白酶。
另一方面,酶是内切葡聚糖酶。另一方面,酶是纤维二糖水解酶。另一方面,酶是β -葡糖苷酶。另一方面,酶是具有纤维素分解增强活性的GH61多肽。另一方面,酶是木聚糖酶。另一方面,酶是木糖苷酶。另一方面,酶是膨胀因子。另一方面,酶是乙酰木聚糖酯酶。另一方面,酶是阿魏酸酯酶。另一方面,酶是阿拉伯呋喃糖苷酶。另一方面,酶是葡糖醛酸酶。另一方面,酶是乙酰甘露聚糖酯酶。另一方面,酶是阿拉伯聚糖酶。另一方面,酶是香豆酸酯酶。另一方面,酶是半乳糖苷酶。另一方面,酶是葡糖醛酸酯酶。另一方面,酶是甘露聚糖酶。另一方面,酶是甘露糖苷酶。
另一方面,内源性基因可以是纤维二糖水解酶I基因。另一方面,纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶1: α)包含SEQ ID NO: 2的成熟多肽的纤维二糖水解酶I ;(ii)包含与SEQ ID NO: 2的成熟多肽具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I由包含
与SEQ ID ΝΟ:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87 %、至少88 %、至少89 %、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
另一方面,内源性基因可以是纤维二糖水解酶II基因。另一方面,纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II: (i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II ;(ii)包含与SEQ ID N0:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II ;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
另一方面,内源性基因可以是内切葡聚糖酶I基因。另一方面,内切葡聚糖酶I基因编码选自以下的内切葡聚糖酶1:(i)包含SEQ ID NO: 6的成熟多肽的内切葡聚糖酶I ;(ii)包含与SEQ ID N0:6的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的内切葡聚糖酶I由包含与SEQ ID NO: 5
的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的内切葡聚糖酶I ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的内切葡聚糖酶I。
另一方面,内源性基因可以是内切葡聚糖酶II基因。另一方面,内切葡聚糖酶II基因编码选自以下的内切葡聚糖酶I1:(i)包含SEQ ID NO:8的成熟多肽的内切葡聚糖酶II ;(ii)包含与SEQ ID NO:8的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的内切葡聚糖酶II ; (iii)由包含与SEQ IDNO: 7的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的内切葡聚糖酶II ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:7的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的内切葡聚糖酶II。
另一方面,内源性基因可以是β -葡糖苷酶基因。另一方面,β -葡糖苷酶基因编码选自以下的β_葡糖苷酶:(i)包含SEQ ID NO: 10的成熟多肽的β_葡糖苷酶;(ii)包含与SEQ ID NO: 10的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的β-葡糖苷酶;(iii)由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的β_葡糖苷酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:9的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的β_葡糖苷酶。
另一方面,内源性基因可以是木聚糖酶I基因。另一方面,木聚糖酶I基因编码选自以下的木聚糖酶1:⑴包含SEQ ID NO: 12的成熟多肽的木聚糖酶I ;(ii)包含与SEQID NO: 12的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶I ; (iii)由包含与SEQ ID N0:11的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶I ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 11的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶I。
另一方面,内源性基因可以是木聚糖酶II基因。另一方面,木聚糖酶II基因编码选自以下的木聚糖酶I1:(i)包含SEQ ID NO: 14的成熟多肽的木聚糖酶II ;(ii)包含与SEQID NO: 14的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶II ; (iii)由包含与SEQ ID NO: 13的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶II ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 13的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶II。
另一方面,内源性基因可以是木聚糖酶III基因。另一方面,木聚糖酶III基因编码选自以下的木聚糖酶II1:(i)包含SEQ ID NO: 16的成熟多肽的木聚糖酶III ;(ii)包含与SEQ ID NO: 16的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶III ; (iii)由包含与SEQ ID NO:15的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少`87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶III ;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 15的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶III。
另一方面,内源性基因可以是β_木糖苷酶基因。另一方面,β_木糖苷酶基因编码选自以下的β_木糖苷酶:(i)包含SEQ ID NO: 18的成熟多肽的β_木糖苷酶;(ii)包含与SEQ ID NO: 18的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的β-木糖苷酶;(iii)由包含与SEQ ID NO: 17的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的β_木糖苷酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 17的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的β_木糖苷酶。
另一方面,内源性基因可以是膨胀因子基因。另一方面,膨胀因子基因编码选自以下的膨胀因子:⑴包含SEQ ID NO:20的成熟多肽的膨胀因子;(ii)包含与SEQ ID NO:20的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的膨胀因子;(iii)由包含与SEQ ID NO: 19的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的膨胀因子;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 19的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的膨胀因子。
另一方面,内源性基因可以是枯草杆菌蛋白酶样丝氨酸蛋白酶基因。另一方面,枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码选自以下的枯草杆菌蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:22的成熟多肽的枯草杆菌蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:22的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的枯草杆菌蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:21的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶。
另一方面,内源性基因可以是天冬氨酸蛋白酶基因。另一方面,天冬氨酸蛋白酶基因编码选自以下的天冬氨酸蛋白酶:⑴包含SEQ ID NO:24的成熟多肽的天冬氨酸蛋白酶;(ii)包含与SEQ ID NO:24的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的天冬氨酸蛋白酶;(iii)由包含与SEQID NO:23的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84% 、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的天冬氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 23的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的天冬氨酸蛋白酶。
另一方面,内源性基因可以是胰蛋白酶样丝氨酸蛋白酶基因。另一方面,胰蛋白酶样丝氨酸蛋白酶基因编码选自以下的胰蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID N0:26的成熟多肽的胰蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO: 26的成熟多肽具有至少70%,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的胰蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:25的成熟多肽编码序列具有至少70%,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的胰蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:25的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的胰蛋白酶样丝氨酸蛋白酶。
另一方面,内源性基因可以是枯草杆菌蛋白酶样丝氨酸蛋白酶基因。另一方面,枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码选自以下的枯草杆菌蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:28的成熟多肽的枯草杆菌蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:28的成熟多肽具有至少70%,例如至少75 %、至少80 %、至少81 %、至少82 %、至少83 %、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的枯草杆菌蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:27的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81 %、至少82 %、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常`高等严格条件下与SEQ ID NO:27的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶。
另一方面,内源性基因可以是天冬氨酸蛋白酶基因。另一方面,天冬氨酸蛋白酶基因编码选自以下的天冬氨酸蛋白酶:(i)包含SEQ ID N0:30的成熟多肽的天冬氨酸蛋白酶;(ii)包含与SEQ ID N0:30的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的天冬氨酸蛋白酶;(iii)由包含与SEQID NO:29的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的天冬氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 29的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的天冬氨酸蛋白酶。
串联构建体
本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)基因的同源3’区、其同源侧翼区或其组合。
本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)基因座的同源3’区、其同源侧翼区或其组合。
串联构建体可以通过使一个或多个(例如,几个)控制基因与构建体的各个多核苷酸可操作连接而构建,从而在与控制序列相容的条件下引导编码序列在丝状真菌宿主细胞中的表达。取决于表达载体,在插入到载体之前对各个多核苷酸进行操纵可能是合意的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域公知的。
控制序列可以是启动子,即被宿主细胞识别用于编码多肽的多核苷酸的表达的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是任何在宿主细胞中表现出转录活性的多核苷酸,包括突变的、截短的和杂合的启动子,并且可以得自与宿主细胞同源或异源的编码胞外或胞内多肽的基因。
一方面,启动子是不同的启动子。另一方面,两个或更多个(例如,几个)启动子是相同的启动子。 用于在丝状真菌宿主细胞中引导构建体的转录的适当启动子的实例是从构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性 α-淀粉酶、黑曲霉酸稳定性α -淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae)TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(W096/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(W000/56900)、壤片键抱(Fusarium venenatum)Daria (W000/56900)、壤片键抱 Quinn (W000/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β -葡糖苷酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶I1、里氏木霉内切葡聚糖酶II1、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶
I1、里氏木霉木聚糖酶II1、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因中获得的启动子,以及NA2-tpi启动子(得自曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被曲霉磷酸丙糖异构酶基因的非翻译前导替换;非限制性实例包括黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被构巢曲霉或米曲霉磷酸丙糖异构酶基因的非翻译前导替换);以及其突变的、截短的和杂合的启动子。其他启动子在美国专利第6,011,147中描述,其整体并入本文。
控制序列也可以是转录终止 子,其由宿主细胞识别来终止转录。终止子与编码多肽的多核苷酸的3’端可操作地连接。可以在宿主细胞中起作用的任何终止子可以用在本发明中。
在一个方面,终止子是不同的终止子。在另一个方面,两个或更多个(例如,几个)终止子是相同的终止子。
用于丝状真菌宿主细胞的优选终止子得自构巢曲霉邻氨基苯甲酸合酶、构巢曲霉乙酰胺酶(amdS)、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉葡糖苷酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶I1、里氏木霉内切葡聚糖酶II1、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉木聚糖酶
II1、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因。
控制序列还可以是前导序列,即,对由宿主细胞的翻译较为重要的mRNA非翻译区。前导序列可操作地连接到编码多肽的多核苷酸的5’端。任何在宿主细胞中起作用的前导序列均可以使用。
用于丝状真菌宿主细胞的优选前导序列得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。
控制序列也可以是多腺苷酸化序列,即可操作地连接至多核苷酸的3’端的序列,在转录时被宿主细胞识别为向所转录的mRNA添加多腺苷残基的信号。在宿主细胞中起作用的任何多腺苷酸化序列均可以使用。
用于丝状真菌宿主细胞的优选多腺苷酸化序列得自构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、和里氏木霉内切葡聚糖酶V的基因。
控制序列也可以是编码与多肽N端连接的信号肽并引导多肽进入细胞分泌通路的信号肽编码区。多核苷酸的编码序列的5’端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段自然连接的信号肽编码序列。或者,编码序列的5’端可以包含对于编码序列为外来的信号肽编码序列。在编码序列不天然包含信号肽编码序列时,外来信号肽编码序列可能是需要的。或者,为增强多肽的分泌,外来信号肽编码序列可以简单地取代天然信号肽编码序列。然而,任何引导所表达的多肽进入宿主细胞的分泌通路的信号肽编码序列均可以使用。
用于丝状真菌宿主细胞的有效信号肽编码序列是得自黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉(Humicola lanuginosa)脂肪酶、米黑根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶I1、里氏木霉内切葡聚糖酶II1、和里氏木霉切葡聚糖酶V的基因的信号肽编码序列。
控制序列也可以是编码位于多肽N端的前肽的前肽编码序列。得到的多肽称为酶原或前多肽(或在一些情况下为酵素原)。前多肽一般是失活的且可以通过从前多肽到前肽的催 化或自催化切割而转化为活性多肽。前肽编码序列可以得自嗜热毁丝菌(Myceliophthora thermophila)漆酶(W095/33836)和米黑根毛霉天冬氨酸蛋白酶的基因。
在信号肽和前肽序列均存在时,前肽序列紧邻多肽的N端且信号肽序列紧邻前肽序列的N端。
也可能需要添加调控多肽相对于宿主细胞生长的表达的调控序列。调控序列的实例是响应于化学或物理刺激(包括调控化合物的存在)引起基因表达的开启和关闭的那些。丝状真菌中的调控序列包括黑曲霉葡糖淀粉酶启动子、米曲霉TAKAa -淀粉酶启动子、米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是使得基因扩增的那些。在这些情况下,编码多肽的多核苷酸将与调控序列可操作地连接。
本发明的串联构建体优选包含一个或多个(例如,几个)允许方便地选择所转化细胞的可选择性标记物。可选择性标记物是基因,其产物提供对生物灭杀剂的抗性或病毒抗性、重金属抗性、相对于营养缺陷型的原养型等。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA(磷酸核糖基氨基咪唑-琥拍羧胺合酶(phosphoribosylaminoimidazoIe-succinocarboxamide synthase))、adeB (憐酸核糖基氨基咪唑合酶(phosphoribosylaminoimidazole synthase))、amdS (乙酸胺酶)、argB (鸟氨酸氨甲酸基转移酶)、bar (膦丝菌素乙酰转移酶)、hph (潮霉素磷酸转移酶)、niaD (硝酸还原酶)、PyrG (乳清酸核苷-5’ -磷酸脱羧酶)、sC (硫酸腺苷酰转移酶)、和trpC (邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus) bar基因。优选用在木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨节青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
一个或多个(例如,几个)可选择性标记物可以是如W02010/039889A2(通过引用的方式全部合并入本文)中所述的双选择标记物体系。在一个方面,一个或多个可选择性标记物是hph-tk双选择标记物体系。` 在本发明的各串联构建体中,一个或多个(例如,几个)可选择性标记物是不同的标记物,除非如本文所述重复使用可选择性标记物。
一个或多个(例如,几个)可选择性标记物可以再用于将针对各个基因或基因座的对应串联构建体各自通过靶向整合来取代一个或多个(例如,几个)其他内源性基因或插入到一个或多个其他内源性基因座中。一个或多个串联构建体还可以包含一个或多个可选择性标记物的5’侧翼的第一同源重复以及一个或多个可选择性标记物的3’侧翼的第二同源重复,其中,第一同源重复和第二同源重复进行同源重组以切除一个或多个可选择性标记物。在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因或基因座的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因或插入到一个或多个其他内源性基因座中。
在一个方面,第一和第二同源重复是相同的。在另一个方面,第一和第二同源重复彼此具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性。在另一个方面,第一和第二同源重复各自为至少50bp,例如,至少lOObp、至少200bp、至少400bp、至少800bp、至少lOOObp、至少1500bp、或至少2000bp。包含一个重复的片段可以比
含有另一重复的片段长。
本发明的串联构建体还可以包含一个或多个(例如,几个)编码其他具有生物活性的多肽的其他多核苷酸。例如,串联构建体可以含有一个其他多核苷酸、两个其他多核苷酸、三个其他多核苷酸等。
具有生物活性的多肽
多肽可以是具有目标生物活性的任何多肽。在本文中,术语“多肽”不是指特定长度的所编码产物,因此涵盖肽、寡肽和蛋白。术语“多肽”还涵盖组合形成所编码产物的两个或更多个(例如,几个)多肽。多肽也包括融合多肽,其包含得自至少两个不同多肽的部分或完整多肽序列的组合,其中一个或多个(例如,几个)多肽可以对丝状真菌宿主细胞为异源。多肽还可以包括下述多肽的天然存在的等位变化和遗传工程变化以及杂合多肽。
在一个方面,多肽选自抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫增强剂、神经递质、受体、报告蛋白、结构蛋白、或转录因子。
另一方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。在另一个方面,酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α-淀粉酶、α-半乳糖苷酶、α -葡糖苷酶、α -1, 6-葡糖苷转移酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、β -半乳糖苷酶、β -葡糖苷酶、β -木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、葡糖脑苷脂酶、葡糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、齒过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶和木聚糖酶
另一方面,多肽选自白蛋白、胶原蛋白、弹性蛋白原、弹性蛋白、和明胶。
另一方面,具有生物活性的多肽可以是不同的多肽。另一方面,具有生物活性的两个或更多个(例如,几个)多肽是相同的多肽。
另一方面,多肽包含选自纤维素酶、cipl蛋白、具有纤维素分解增强活性的GH61、半纤维素酶、酯酶、膨胀素、漆酶、木质素降解酶、果胶酶、过氧化物酶、蛋白酶、和膨胀因子的一种或多种酶。在另一方面,纤维素酶是选自内切葡聚糖酶、纤维二糖水解酶、和β_葡糖苷酶的一种或多种酶。在另一方面,半纤维素酶是选自木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸酶的一种或多种酶。
在另一方面,多肽之一是纤维素酶。在另一方面,多肽之一是内切葡聚糖酶。在另一方面,多肽之一是纤维二糖水解酶。在另一方面,多肽之一是β -葡糖苷酶。在另一方面,多肽之一是具有纤维素分解增强活性的GH61多肽。在另一方面,多肽之一是膨胀因子蛋白。在另一方面,多肽之一是cipl蛋白。在另一方面,多肽之一是酯酶。在另一方面,多肽之一是膨胀素。在另一方面,多肽之一是漆酶。在另一方面,多肽之一是木质素降解酶。在另一方面,多肽之一是果 胶酶。在另一方面,多肽之一是过氧化物酶。在另一方面,多肽之一是蛋白酶。在另一方面,多肽之一是膨胀因子。
在另一方面,多肽之一是半纤维素酶。在另一方面,多肽之一是木聚糖酶。在另一方面,多肽之一是β-木糖苷酶。在另一方面,多肽之一是乙酰木聚糖酯酶。在另一方面,多肽之一是阿魏酸酯酶。在另一方面,多肽之一是阿拉伯呋喃糖苷酶。在另一方面,多肽之一是葡糖醛酸酶。在另一方面,多肽之一是乙酰甘露聚糖酯酶。在另一方面,多肽之一是阿拉伯聚糖酶。在另一方面,多肽之一是香豆酸酯酶。在另一方面,多肽之一是半乳糖苷酶。在另一方面,多肽之一是葡糖醛酸酯酶。在另一方面,多肽之一是甘露聚糖酶。在另一方面,多肽之一是甘露糖苷酶。
作为具有生物活性的多肽的内切葡聚糖酶的实例包括,但不限于,里氏木霉内切葡聚糖酶 I (PenttiIa 等人,1986,Gene45:253-263)、里氏木霉 Cel7B 内切葡聚糖酶 I (GENBANK?登录号M15665)、里氏木霉内切葡聚糖酶II (Saloheimo等人,1988,Gene63:11-22)、里氏木霉Cel5A内切葡聚糖酶II(GENBANK?登录号M19373)、里氏木霉内切葡聚糖酶III (Okada等人,1988,Appl.Environ.Microbiol.64:555-563 ;GENBANK? 登录号 AB003694)、里氏木霉内切葡聚糖酶 V (Saloheimo 等人,1994, Molecular Microbiology 13:219-228,GENBANK?登录号Z33381)、棘孢曲霉(Aspergillus aculeatus)内切葡聚糖酶(Ooi等人,1990,Nucleic Acids Researchl8:5884)、白曲霉(Aspergillus kawachii)内切葡聚糖酶(Sakamoto 等人,1995,Current Genetics27:435-439)、软腐欧氏杆菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti等人,1990,Gene90:9_14)、尖孢镰孢内切葡聚糖酶(GENBANK? 登录号 L29381)、灰腐质霉高温变种(Humicola grisea var.thermo idea)内切葡聚糖酶(GENBANK?登录号AB003107)、热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(GENBANK?登录号MAL515703)、粗糙脉孢菌(Neurospora crassa)内切葡聚糖酶(GENBANK?登录号XM_324477)、特异腐质霉内切葡聚糖酶V、嗜热毁丝菌CBSl 17.65内切葡聚糖酶、担子菌(basidiomycete)CBS495.95内切葡聚糖酶、担子菌CBS494.95内切葡聚糖酶、太瑞斯梭孢壳(Thielavia terrestris)NRRL8126CEL6B内切葡聚糖酶、太瑞斯梭孢壳NRRL8126CEL6C内切葡聚糖酶、太瑞斯梭孢壳NRRL8126CEL7C内切葡聚糖酶、太瑞斯梭孢壳NRRL8126CEL7E内切葡聚糖酶、太瑞斯梭孢壳NRRL8126CEL7F内切葡聚糖酶、多生枝鼻菌(Cladorrhinum foecundissimum)ATCC62373CEL7A内切葡聚糖酶、和里氏木霉菌株N0.VTT-D-80133 内切葡聚糖酶(GENBANK? 登录号 Ml5665)。
作为具有生物活性的多肽的纤维二糖水解酶的实例包括,但不限于,棘孢曲霉纤维二糖水解酶 II(W02011/059740)、嗜热毛壳菌(Chaetomium thermophilum)纤维二糖水解酶1、嗜热毛壳菌纤维二糖水解酶I1、特异腐质霉纤维二糖水解酶1、嗜热毁丝菌纤维二糖水解酶 II (W02009/042871)、Thielavia hyrcanie 纤维二糖水解酶 II (W02010/141325)、太瑞斯梭孢壳纤维二糖水解酶II(CEL6A,W02006/074435)、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶II和囊状长毛盘菌(Trichophaea saccata)纤维二糖水解酶IKW02010/057086)。
作为具有生物活性的多肽的β_葡糖苷酶的实例包括,但不限于,来自棘孢曲霉(Kawaguchi 等人,1996,Genel73:287-288)、烟曲霉(TO2005/047499)、黑曲霉(Dan 等人,2000,J.Biol.Chem.275:4973-4980)、米曲霉(W02002/095014)、巴西青霉(Penicillium brasilianum) IBT20888 (W02007/019442 和 TO2010/088387)、太瑞斯梭孢壳(W02011/035029)和囊状长毛盘菌(W02007/019442)的β-葡糖苷酶。
β-葡糖苷酶还可以是融合蛋白。在一个方面,葡糖苷酶是米曲霉葡糖苷酶变体BG融合蛋白(W02008/057637)或米曲霉β-葡糖苷酶融合蛋白(W02008/057637)。使用根据 Henrissat B., 1991, A classification of glycosyl hydrolases basedon amino-acid sequence similarities, Biochem.J.280:309-316、及 Henrissat B.andBairoch A., 1996, Updating the sequence-based classification of glycosylhydrolases, Biochem.J.316:695-696所述的分类,其他内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶的实例在众多的糖基水解酶家族中公开。
可以用于本发明的其他纤维素分解酶在W098/13465、W098/015619、W098/015633、W099/06574、W099/1048U W099/025847、W099/031255、W02002/101078, W02003/027306,W02003/052054, W02003/052055, W02003/052056, W02003/052057, W02003/052118,W02004/016760, W02004/043980, W02004/048592, W02005/001065, W02005/028636、W02005/093050, W02005/093073, W02006/074005, W02006/117432, W02007/071818,W02007/071820、W02008/008070, TO2008/008793、美国专利第 5,457,046 号、美国专利第5,648,263号和美国专利第5,686,593号中有过记载。 作为具有生物活性的多肽的具有纤维素分解增强活性的GH61多肽的实例包括,但不限于,来自太瑞斯梭孢壳(W02005/074647、W02008/148131、和 W02011/035027)、嗜热子囊菌(Thermoascus aurantiacus) (W02005/074656 和 W02010/065830)、里氏木霉(W02007/089290)、嗜热毁丝菌(W02009/085935、W02009/085859、W02009/085864、W02009/085868)、烟曲霉(W02010/138754)的 GH61 多肽,来自嗜松青霉(Penicilliumpinopuilum) (W02011/005867)、嗜热子囊菌(W02011/039319)、青霉(W02011/041397)、和甲壳嗜热子囊菌(Thermoascus crustaceous) (W02011/041504)的 GH61 多妝。
作为具有生物活性的多肽的木聚糖酶的实例包括,但不限于,来自棘孢曲霉(GeneSeqP:AAR63790 ;TO94/21785)、烟曲霉(TO2006/078256)、嗜松青霉(W02011/041405)、青霉(W02010/126772)、太瑞斯梭孢壳 NRRL8126 (W02009/079210)、以及囊状长毛盘菌GHlO (W02011/057083)的木聚糖酶。
作为具有生物活性的多肽的β_木糖苷酶的实例包括,但不限于,来自粗糙脉孢菌(SwissProt登录号Q7S0W4)、里氏木霉(UniProtKB/TrEMBL登录号Q92458)、和埃默森篮状菌(Talaromyces emersonii) (SwissProt 登录号 Q8X212)的 β-木糖苷酶。
作为具有生物活性的多肽的乙酰木聚糖酯酶的实例包括,但不限于,来自棘孢曲霉(W02010/108918)、球毛壳菌(Chaetomium globosum)(UniProt 登录号 Q2GWX4)、细丽毛壳菌(Chaetomium gracile) (GeneSeqP登录号AAB82124)、特异腐质霉DSM1800(TO2009/073709)、红褐肉座菌(Hypocrea jecorina) (TO2005/001036)、嗜热毁丝菌(W02010/014880)、粗糙脉孢菌(UniProt 登录号 q7s259)、颖枯壳针孢(Phaeosphaerianodorum) (UniProt 登录号 Q0UHJ1)、和太瑞斯梭孢壳 NRRL8126 (W02009/042846)的乙酰木聚糖酯酶。
作为具有生物活性的多肽的阿魏酸酯酶的实例包括,但不限于,来自特异腐质霉 DSM1800(W02009/076122)、费希新萨托菌(Neosartorya fischeri)(UniProt 登录号A1D9T4)、粗糙脉孢菌(UniProt登录号Q9HGR3)、橘灰青霉(Penicilliumaurantiogriseum) (W02009/127729)、和太瑞斯梭孢壳(W02010/053838 和 TO2010/065448)的阿魏酸酯酶。
作为具有生物活性的多肽的阿拉伯呋喃糖苷酶的实例包括,但不限于,来自黑曲霉(GeneSeqP 登录号 AAR94170)、特异腐质霉 DSM1800 (W02006/114094 和 W02009/073383)、和大型亚灰树花菌(M.giganteus) (W02006/114094)的阿拉伯呋喃糖苷酶。
作为具有生物活性的多肽的α-葡糖醛酸酶的实例包括,但不限于,来自棒曲霉(Aspergillus clavatus) (UniProt 登录号 alccl2)、烟曲霉(SwissProt 登录号 Q4WW45)、黑曲霉(UniProt 登录号 Q96WX9)、土曲霉(Aspergillus terreus) (SwissProt 登录号Q0CJP9)、特异腐质霉(W02010/014706)、橘灰青霉(W02009/068565)、埃默森篮状菌(UniProt登录号Q8X211)、和里氏木霉(UniProt登录号Q99024)的α-葡糖醛酸酶。
登录号通过引用的方式整体并入本文。
表达载体
本发明还涉及包含本发明的串联构建体的表达载体。串联构建体可以插入到载体中或者串联构建体的多个组分可以结合在一起以产生重组表达载体。载体可以包含一个或多个(例如,几个)方便的限制性酶切位点以使得在这些位点插入多核苷酸。在表达载体的创建中,将编码序列置于载体中,从而将编码序列与适当的用于表达的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将导入载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体优选地含有一个或多个(例如,几个)可选择性标记物,其使得可以方便选择所转化的细胞。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA(磷酸核糖基氨基咪唑-琥珀羧胺合酶)、adeB (磷酸核糖基氨基咪唑合酶)、amdS (乙酰胺酶)、argB (鸟氨酸氨甲酰基转移酶)、bar (膦丝菌素乙酰转移酶)、hph (潮霉素磷酸转移酶)、niaD (硝酸还原酶)、pyrG (乳清酸核苷-5’ -磷酸脱羧酶)、sC (硫酸腺苷酰转移酶)、和trpC (邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基`因。优选用在木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨节青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
用于连接上述元件以构建重组表达载体的方法为本领域技术人员公知(参见,例如,Sambrook 等人,1989,同上)。
丝状真菌宿主细胞
本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合。本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合通过经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因座的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合。
术语“宿主细胞”包括由于在复制过程中发生突变而与亲本细胞不同的亲本细胞的任何子代。宿主细胞的选择将在很大程度上取决于编码多肽的基因及其来源。
宿主细胞可以是在多肽的重组生产中有用的任何丝状真菌细胞。“丝状真菌”包括真菌门和卵菌门的的亚门(如由Hawksworth等人,1995,同上,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长,碳分解代谢必须是需氧的。相反,酵母例如酿酒酵母(Saccharomyces cerevisiae)的营养生长是通过单细胞菌体的出芽,且碳分解可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、黑管菌属(Bjerkandera)、拟腊霉属(Ceriporiopsis)、金孢属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉酵母属(Filibasidium)、镰孢菌属(Fusarium)、腐质霉属(Humicola)、巨座壳属(Magnaporthe)、毛霉属(Mucor)、毁丝菌属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉抱菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革 菌属(Phanerochaete)、白腐菌属(Phlebia)、梨囊鞭菌属(Piromyces)、侧耳属(Pleurotus)、裂裙菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉、米曲霉、烟管菌(Bjerkandera adusta)、干拟腊菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、浅黄拟腊菌(Ceriporiopsis gilvescens)、Ceriporiopsispannocinta、 Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、 虫拟腊菌(Ceriporiopsis subvermispora) > Chrysosporium inops、嗜毛金色抱(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、!^状金抱(Chrysosporium merdarium)、Chrysosporium pannicola>Chrysosporium queenslandicum、热带金抱菌(Chrysosporiumtropicum) >Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、粗毛云芝(Coriolushirsutus)、杆抱状键抱(Fusarium bactridioides)、谷类键抱(Fusarium cerealis)、克鲁克威尔键抱菌(Fusarium crookwellense)、黄色键抱菌(Fusarium culmorum)、禾谷键抱菌(Fusarium graminearum)、禾赤键抱(Fusarium graminum)、异抱键抱(Fusariumheterosporum)、合欢木键抱(Fusarium negundi)、尖抱键抱、多枝键抱(Fusariumreticulatum)、粉红键抱(Fusarium roseum)、接骨木键抱(Fusarium sambucinum)、肤色键抱(Fusarium sarcochroum)、拟枝抱键抱菌(Fusarium sporotrichioides)、硫色键抱(Fusarium sulphureum)、圆键抱(Fusarium torulosum)、拟丝抱键抱(Fusariumtrichothecioides)、镶片镰孢、特异腐质霉、柔毛腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉、粗糙脉胞菌、产紫青霉(Penicillium purpurogenum)、黄抱原毛平革菌(Phanerochaete chrysosporium)、脉射菌(Phlebia radiata)、刺芳:侧耳(Pleurotus eryngii)、太瑞斯梭孢壳、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康氏木霉(Trichodermakoningii)、长梗木霉(Trichoderma 1ngibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。
在一个方面,丝状真菌宿主细胞是米曲霉。在另一方面,丝状真菌宿主细胞是黑曲霉。在另一方面,丝状真菌宿主细胞是镶片镰孢。在另一方面,丝状真菌宿主细胞是里氏木霉。在另一方面,丝状真菌宿主细胞是长梗木霉。
在另一方面,丝状真菌宿主细胞是里氏木霉RutC30。在另一方面,丝状真菌宿主细胞是里氏木霉TV10。在另一方面,丝状真菌宿主细胞是里氏木霉RutC30的突变体。在另一方面,丝状真菌宿主细胞是里氏木霉TVlO的突变体。在另一方面,丝状真菌宿主细胞是里氏木霉的形态突变体。参见,例如,W097/26330,其通过引用的方式整体并入本文。
在另一方面,丝状真菌宿主细胞是包含一个或多个(例如,几个)选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因、第一天冬氨酸蛋白酶基因、胰蛋白酶样丝氨酸蛋白酶基因、第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因、和第二天冬氨酸蛋白酶基因的基因的木霉属菌株,其中一个或多个(例如,几个)基因修饰成使突`变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(例如,几种)选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶、第一天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、第二枯草杆菌蛋白酶样丝氨酸蛋白酶、和第二天冬氨酸蛋白酶的酶的产生方面有缺陷,如W02011/075677中所述,其通过引用的方式整体并入本文。
可以将丝状真菌细胞通过涉及原生质体形成、原生质体转化、和细胞壁再生的方法以本身已知的方式进行转化。用于转化曲霉属和木霉属宿主细胞的适当方法在EP238023、Yelton 等人,1984,Proc.Natl.Acad.Sc1.USA81:1470-1474 以及 Christensen 等人,1988,Bio/Technology6:1419-1422中有过记载。用于转化镰孢属的种的适当方法由Malardier 等人,1989,Gene78:147-156 和 W01996/00787 记载。
产生的方法
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合;以及任选地
(B)回收多种重组多肽。
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)第二基因座的同源3’区、其同源侧翼区或其组合;或(c) (a)和(b)的组合;以及任选地
(B)回收多种重组多肽。
使用本领域已知的方法,在 适于产生多肽的营养介质中培养丝状真菌宿主细胞。例如,细胞可以通过在合适的介质中并在使得多肽进行表达和/或分离的条件下进行摇瓶培养或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)来培养。使用本领域已知的步骤,培养在包含碳源和氮源以及无机盐的合适营养介质中进行。合适的介质可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)来制备。如果多肽被分泌到营养介质中,则可以直接从介质中回收多肽。如果多肽未被分泌,则可以从细胞裂解物中回收。
多肽可以使用领域内已知的特定用于多肽的方法来检测。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成、或酶底物的消失。例如,酶检定可以用来判定多肽的活性。
多肽可以使用本领域已知的方法来回收。例如,多肽可以通过常规步骤从营养介质中回收,这些常规步骤包括但不限于收集、离心、过滤、萃取、喷雾干燥、蒸发或沉淀。在一个方面,回收整个发酵液。
多肽可以通过本领域已知的多种方法进行纯化,以获得基本纯的多肽,方法包括但不限于层析法(例如,离子交换层析、亲和层析、疏水性层析、聚焦层析、和尺寸排阻层析)、电泳法(例如,制备式等电聚焦)、差 别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,Protein Purification, Janson 和 Ryden 编,VCH Publishers, New York, 1989)。
本发明通过以下实施例进一步加以说明,这些实施例不应理解成对本发明的范围加以限定。
实施例

里氏木霉菌株 981-0-8 (D4)是里氏木霉 RutC30 (ATCC56765 ;Montenecourt andEveleigh, 1979, Adv.Chem.Ser.181:289-301)的诱变菌株。
里氏木霉菌株 AgJgl 15-104-7B1 (PCT/US2010/061105、W02011/075677)是里氏木霉菌株 981-0-8 (D4)的 ku70-衍生体。
培养基和缓冲溶液
LB平板由IOg胰蛋白胨、5g酵母提取物、5g NaCl、15g Bacto琼脂和加至I升的去离子水组成。
2XYT+氨苄青霉素平板由16g胰蛋白胨、IOg酵母提取物、5g氯化钠、15g Bacto琼脂和加至I升去离子水组成。在高压灭菌的培养基冷却至55°C之后,加入lmllOOmg/ml的氨节
青霉素溶液。
SOC培养基由20g BactO-胰蛋白胨、5g Bacto酵母提取物、0.5gNaCl、2.5mllM KCl和加至I升的去离子水组成。在高压灭菌之前,用ION NaOH将pH调节至7.0。然后在临用前加入20ml的无菌IM葡萄糖。
COVE 盐溶液由 26g KCl、26g` MgSO4.7H20、76g KH2PO4,50ml COVE 痕量金属溶液和加至I升的去离子水组成。
COVE 痕量金属溶液由 0.04g NaB4O7.10Η20、0.4g CuSO4.5Η20、1.2g FeSO4.7Η20、0.7gMnSO4.H2O,0.8g Na2MoO2.2H20、10g ZnSO4.7H20 和加至 I 升的去离子水组成。
COVE 平板由 342.3g 蔗糖、20ml COVE 盐溶液、IOmllM 乙酰胺、IOmlL 5M CsCl、25gNoble琼脂(Difco)和加至I升的去离子水组成。
C0VE2平板由30g蔗糖、20ml COVE盐溶液、IOmllM乙酰胺、25g Noble琼脂(Difco)和加至I升的去离子水组成。
木霉属痕量金属溶液由 216g FeCl3.6H20、58g ZnSO4.7H20、27g MnSO4.H2OUOgCuSO4.5Η20、2.4g H3B03、336g柠檬酸和加至I升的去离子水组成。
CIM 培养基由 20g 纤维素、IOg 玉米浆冻干粉、1.45g (NH4) 2S04、2.08g KH2PO4'0.28gCaCl2,0.42g MgSO4.7H20、0.42ml木霉属痕量金属溶液、I~2滴消泡剂和加至I升的去离子水组成;pH调节至6.0。
YP培养基由IOg酵母提取物、20g Bacto蛋白胨和加至I升的去离子水组成。
YPG培养基由4g酵母提取物、Ig K2HP04、0.5g MgS04、15.0g葡萄糖和加至I升的去离子水组成(PH6.0)。
PEG 缓冲液由 500g 聚乙二醇 4000 (PEG4000) UOmM CaCl2UOmM Tris-HCl ρΗ7.5 和加
至I升的去离子水组成;过滤除菌。
PDA平板由39g 土豆右旋糖琼脂(Difco)和加至I升的去离子水组成。
PDA覆层培养基由39g 土豆右旋糖琼脂(Difco)、2.44g尿苷和加至I升的去离子水组成。使用之前,将高压灭菌的培养基在微波中融化,然后冷却至55°C。STC 由 IM 山梨糖醇、IOmM mM CaCl2 和 IOmM Tris-HCl,pH7.5 组成;过滤除菌。
TE 缓冲液由 IM Tris pH8.0 和 0.5M EDTA pH8.0 组成。
变性溶液由0.5M NaOH和1.5M NaCl组成。
中和溶液由IM Tris ρΗ8.0和1.5Μ NaCl组成。
20Χ SSC由175.3g NaCl,88.2g柠檬酸钠和加至I升的去离子水组成。
TrMM-G培养基由 20ml COVE 盐溶液、6g (NH4) 2S04、0.6g CaCl2、25g Nobel 琼脂(Difco)、20g葡萄糖和加至I升的去离子水组成。
NZY+培养基由 5g NaCl、3g MgSO4.7Η20、58 酵母提取物、IOgNZ 胺、1.2g MgCl2、4g 葡萄糖和加至I升的去离子水组成。
实施例1:烟曲霉GH61B多肽基因的克隆
烟曲霉部分基因组序列(The Institute for Genomic Research, Rockville, MD, USA)的 tblastn 搜索(Altschul 等人,1997,Nucleic Acids Res.25:3389-3402)使用几种已知的GH61多肽(包括嗜热子囊菌GH61A多肽(GeneSeqP登录号AEC05922))作为查询序列来进行。基于在氨基酸水平上与查询序列的高度类似性,数个基因被识别为推定的家族GH61同源物。选择一个约850bp的与嗜热子囊菌GH61A多肽序列在氨基酸水平具有高于70%序列同一性的基因组区域进行进一步研究。
烟曲霉NN051616如美国专利第7,244,605号中所述生长并收获。将冷冻的菌丝体用研钵和研杵研磨成细粉末,并使用DNEASY?植物大量提取试剂盒(DNEASY? PlantMaxi Kit) (QIAGEN Inc., Valencia, CA, USA)根据生产商的说明来分离基因组DNA。` 设计以下示出的两个合成的寡核苷酸引物,以从基因组DNA中PCR扩增出烟曲霉GH6IB多妝编码序列。使用 IN-FUS1.0N⑧j克隆试剂盒(Clontech Laboratories, Inc., MountainView, CA, USA)将片段直接克隆入表达载体pAlLo2 (W02004/099228),而无需进行限制性酶切消化和连接。
正向引物:
5’-ACTGGATTTACCATGACTTTGTCCAAGATCACTTCCA-3’ (SEQ ID NO:31)
反向引物:
5’-TCACCTCTAGTTAATTAAGCGTTGAACAGTGCAGGACCA G_3’ (SEQ ID NO:32)
粗体字母代表编码序列。剩余序列与PAlLo2的插入位点同源。
将五十皮摩尔的各个上述引物用于PCR反应中,反应由204ng的烟曲霉基因组DNA, IXPfx 扩增缓冲液(Invitrogen, Carlsbad, CA, USA),1.5 μ I 的 dATP、dTTP、dGTP和 dCTP 的 IOmM 混合物,2.5 个单位的 PLATFNUM? Pfx DNA 聚合酶(InvitrogenCorp., Carlsbad, CA, USA),和 ΙμL 的 50mM MgSO4 构成,终体积为 50 μ I。扩增使用 EPPENDORF? ΜASTERCYCLER? 5333epgradient S (EppendorfScientific, Inc., ffestbury, NY, USA)进行,程序为:94 °C 3分钟,I个循环;和每循环94°C 30秒、56°C 30秒、和72°C I分钟,30个循环。然后将加热块维持在72°C 15分钟,接着进行4°C浸泡循环。反应产物通过使用40mM Tris碱、20mM乙酸钠、ImM EDTA 二钠盐(TAE)缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将约850bp的产物条带从凝胶中切出,并使用MINELUTE?凝胶提取试剂盒(QIAGEN Inc.,Valencia, CA, USA)根据生产商的说明进行纯化。
然后使用IN-FUSION?克隆试剂盒将850bp片段克隆入PAlLo2。将质粒PAlLo2用Nco I和Pac I消化。将质粒片段通过如上的凝胶电泳和QIAQUICK?凝胶纯化试剂盒(QIAGEN Inc., Valencia, CA, USA)进行纯化。将基因片段和消化的载体在后述的反应中合并在一起,得到表达质粒PAG43 (图1),其中烟曲霉GH61B多肽编码序列的转录处于NA2_tpi启动子的调控之下。NA2-tpi启动子是来自黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译的前导序列被来自构巢曲霉磷酸丙糖异构酶基因的非翻译前导序列替代。重组反应(20 μ I)由 I xIN-FUSION?.反应缓冲液(Clontech Laboratories, Inc., MountainView, CA, USA) > I XBSA (Clontech Laboratories, Inc.,Mountain View, CA, USA) > I μ I 的IN-FUSION? 酶(稀释 1:10) (Clontech Laboratories, Inc., Mountain View, CA, USA)、166ng的用Nco I和Pac I消化的pAlLo2、和IlOng的烟曲霉GH61B多肽的纯化PCR产物构成。将反应在37°C下孵育15分钟,接着在50°C孵育15分钟。将反应物用40μ1的IOmMTris-0.1M EDTA缓冲液稀释,并根据生产商的说明将2.5 μ I的稀释反应物用来转化大肠杆菌(E.coli)XLlO SOLOPACK? Gold感受态细胞(Stratagene, LaJolla, CA, USA)。含有pAG43 (GH61B多肽编码序列)的大肠杆菌转化体通过限制性酶切消化进行鉴定,并使用 BIOROBOT? 9600 (QIAGEN Inc.,Valencia, CA, USA)制备质粒 DNA。
862bp PCR 片段的 DNA 测序用 Applied Biosystems Model377XL 自动 DNA 测序仪(Applied Biosystems, Carlsbad, CA, USA)使用染料-终止子化学法(Giesecke 等人,1992, Journal of Virology Methods38:47-60)和引物步移策略进行。使用下述的载体特异性引物进行测序:
pAllo25Seq:
5’-TGTCCCTTGTCGATGCG3’ (SEQ ID NO:33)
pAllo23Seq:
5’-CACATGACTTGGCTTCC3’ (SEQ ID NO:34)
仔细检查核苷酸序列数据的质量,并将所有序列经PHRED/PHRAP软件(University ofWashington, Seattle, WA, USA)的协助而进行彼此比较。
基于所编码的蛋白与嗜热子囊菌GH61A蛋白(GeneSeqP登录号AEC05922)的相似性来构建用于烟曲霉序列的基因模型。烟曲霉GH61B多肽编码序列的核苷酸序列和推导的氨基酸序列分别示于SEQ ID N0:35和SEQ ID NO:36。基因组片段编码250个氨基酸的多肽,被2个53和56bp的内含子打断。编码序列和成熟编码序列的G+C含量百分比分别为53.9%和 57 %。使用 SignalP 软件程序(Nielsen 等人,1997,Protein EngineeringlO: 1-6),预测21个残基的信号肽。预测的成熟蛋白含有221个氨基酸,其具有23.39kDa的预测分子量。
实施例2:用于表达烟曲霉GH61B多肽的pSMai214的构建
使用如下所示的基因特异性的正向和反向引物从质粒pAG43(实施例1)中扩增烟曲霉GH61B多肽编码序列。斜体的区域表示与IN-FUSION?反应的插入位点的载体同源性。
正向引物:
5’-GGACTGCGCACCATGACTTTGTCCAAGATCACTTCCA-3’ (SEQ ID NO:37)
反向引物:5’-GCCACGGAGCTTAATTAATTAAGCGTTGAACAGTGCAG-3’ (SEQ ID NO:38)
将五十皮摩尔的各上述引物用于PCR反应中,该反应由IOng的pAG43DNA,IXPfx扩增缓冲液,1.5μ l的dATP、dTTP、dGTP和dCTP的IOmM混合物,2.5个单位的PLATINUM? Pfx DNA聚合酶,和1μ l的50mM MgSO4构成,最终体积为50 μ l。扩增使用 EPPENDORF? MASTERCYCLER? 5333印gradient S 进行,其程序为:98°C 3 分钟,1个循环;和每循环98°C30秒、56°C30秒、和72°C1分钟,30个循环。然后将加热块维持在72°C 15分钟。PCR产物通过使用TAE缓冲液的1 %琼脂糖凝胶电泳进行分离,其中将约0.9kb的片段从凝胶切出,并使用MINELUTE?凝胶提取试剂盒根据生产商的操作指南进行提取。
将质粒 PMJ09 (W02005/047499)用 Nco I 和 Pac I 消化,通过在 ImM EDTA 二钠盐 _50mMTris碱-50mM硼酸(TBE)缓冲液中的1.0%琼脂糖凝胶电泳来分离,从凝胶中切出,并根据生产商的说明使用QIAQUICK?凝胶提取试剂盒(QIAGEN Inc.,Valencia, CA, USA)提取。
根据生产商的操作指南,使用iN-FUSION? PCR克隆试剂盒将0.9kb的PCR产物插入到凝胶纯化的经Nco I/Pac I消化的PMJ09中。IN-FUSION?及应由1XIN-FUSION?,反应缓冲液、IOOng的凝胶纯化的经Nco I/Pac I消化的pMJ09、37ng的0.9kb PCR产物、2 μ I的500 μ g/ml BSAJP I μ I的TN-FUSION?酶构成,反应体积为20 μ I。将反应在37°C孵育15分钟并在50°C孵育15分钟。在孵育期后,将30 μ I的TE缓冲液加入反应中。根据制造商的操作指南,将2.5μ I等份用于转化SOLOPACK? Gold超级感受态细胞(Agilent Technologies, Inc., Cedar Creek, TX, USA)。通过测序来筛选转化体,鉴定出含有无PCR错误的插入的一个克隆并将其定名为pSMai214(图2)。可以用Pme I消化质粒pSMai214,以产生用于里氏木霉转化的约5.4kb的片段。该5.4kb的片段包含由里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、和构巢曲霉乙酰胺酶(amdS)基因组成的表达盒。
实施例3:用于表达烟曲霉CEL3AP -葡糖苷酶和烟曲霉GH61B多肽两者的串联构建体PDM287的构律
使用如下所示的基因特异性的正向和反向引物从质粒pSMai214中扩增烟曲霉GH6IB多肽表达盒。斜体的区域表示与IN-FUSION?反应的插入位点的载体同源性。
正向引物:
5’-CGCGGTAGTGGCGCGGTCGACCGAATGTAGGATTGTT-3’ (SEQ ID NO:39)
反向引物:
5’-TTACCAATTGGCGCGCCACTACCGCGTTCGAGAAGA-3’ (SEQ ID NO:40)
将五十皮摩尔的各上述引物用于PCR反应中,该反应由25ng的pSMai214DNA,IX PHUS10N? 高保真热启动 DNA 聚合酶缓冲液(Finnzymes 0y, Espoo, Finland), 1 μ I的dATP、dTTP、dGTP和dCTP的IOmM混合物,以及I个单位的PHUS10N?高保真热启动DNA聚合酶(Finnzymes 0y, Espoo, Finland)构成,最终体积为50 μ I。扩增使用EPPENDORF? MASTERCYCLER? 5333印gradient S进行,其程序为:98°C30 秒,I个循环;每循环98°C 10秒、60°C 30秒、和72°C I分30秒,35个循环;和72°C 10分钟,I个循环。PCR产物通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行分离,其中将约2.3kb的片段从凝胶中切出,并使用NUCLEOSPIN?提取II试剂盒(Macherey-NageI,Inc.,Bethlehem, PA, USA)根据生产商的操作指南进行提取。
将约 2.3kb 的 PCR 产物使用 IN-FUSION? Advantage PCR 克隆试剂盒(ClontechLaboratories, Inc., Mountain View, CA, USA)根据生产商的操作指南而插入至经Asc I消化的pEJG107(W02005/047499)。质粒pEJG107包含烟曲霉CEL3A0 -葡糖苷酶编码序列(SEQID NO:53[DNA序列]和SEQ ID NO:54[推导的氨基酸序列])。该IN-FUSION ?.反应由IX IN-FUSION?,反应缓冲液、125ng 的经 Asc I 消化的 pEJG107、90ng 的 2.33kb 的 PCR产物、和I μ I IN-FUSION?酶组成,反应体积为?ο μ I。将反应在37°C孵育15分钟,接着在50°C孵育15分钟。在孵育期后,将40μ I的TE加入反应中。根据制造商的操作指南,将2 μ I 等份用于转化 ONE SHOT? T0P10 感受态细胞(Invitrogen, Carlsbad, CA, USA)。将大
肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,鉴定出含有无PCR错误的插入的一个克隆并将其命名为pDM287(图3)。可以用Pme I消化质粒pDM287,产生用于里氏木霉转化的约9.9kb的片段。该9.9kb的片段包含由(I)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉CEL3A3 -葡糖苷酶编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子;以及(2)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B多肽编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子组成的两个表达盒。该9.9kb的片段也包含构巢曲霉乙酰胺酶(amdS)基因。
实施例4:里氏木霉原生质体的产生和转化
原生质体的制备和转化使用Penttila等人,1987,Gene61:155-164的修改操作指南来进行。简要地,在27°C下于25ml的补充有2% (w/v)葡萄糖和IOmM尿苷的YP培养基中在90rpm的轻柔振荡下培养里氏木霉菌株981-0-8 (D4) 17小时。菌丝体使用真空驱动的一次性过滤系统(Millipore, Bedford, MA, USA)通过过滤来收集,并用去离子水洗涤两次和用
1.2M山梨糖醇洗涤两次。通过在34°C下于20ml的1.2M山梨糖醇中以90rpm的轻柔振荡来悬浮所洗涤的菌丝体15~25分钟,从而产生原生质体,该20ml的1.2M山梨糖醇含有每mll5mg 的 GLUCANEX⑧ 200G (Novozymes A/S, Bagsvaerd, Denmark)和每 ml0.36 个单位的几丁质酶(Sigma Chemical C0., St.Louis, MO, USA) ?原生质体通过在400 X g下离心7分钟而收集,用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器来计数,并在STC中再悬浮至I X IO8原生质体/ml的最终浓度。将过量的原生质体储存在-80°C的Cryol°C冷冻容器(Nalgene, Rochester, NY, USA)中。
用Pme I消化约100 μ g的转化质粒(pSMai214、pDM287或pEJG107)。消化反应物通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化。将含有pSMai214、pDM287或pEJG107的表达盒以及构巢曲霉乙酰胺酶(amdS)基因的DNA条带从凝胶中切出,并根据制造商建议的操作指南使用NUCLEOSPIN?提取II试剂盒进行提取。
将所得的纯化的DNA[1 μ g的9.9kb的经Pme I消化的pDM287 (串联转化)或I μ g的7.6kb的经Pme I消化的pEJG107加I μ g的5.4kb的经Pme I消化的pSMai214 (共转化)]加至100 μ I的原生质体溶液中并轻柔地混合。加入PEG缓冲液(250 μ I),将反应物混合并在34°C下孵育30分钟。然后加入STC(3ml),并将反应物混合,然后涂布在用于amdS选择的COVE平板上。将平板在28°C下孵育6~11天。
实施例5:对表达烟曲霉CEL3A g -葡糖苷酶和烟曲霉GH61B多肽的里氏木霉转化体的
ML
使用接种环将里氏木霉转化体(实施例4)从COVE转化平板转移至补充了 IOmM尿苷的C0VE2平板,并在28°C下孵育5~7天。用接种环收集孢子,并将其转移至125ml塑料摇瓶中的25ml CM培养基中。将摇瓶培养物在28°C、200rpm下孵育5天。将各个培养物的Iml等份在微量离心机中以13,400Xg离心,并回收培养物上清液。根据制造商的说明通过使用 CRITERION? 8 ~16% Tris-HCl 凝胶(Bio-Rad Laboratories, Hercules, CA, USA)
的SDS-PAGE对5 μ I的各个培养物上清液进行分析。将所得凝胶用B10-SAFE?考马斯(Bio-Rad Laboratories, Hercules, CA, USA)染色。45 个 pDM287 转化体(串联构建体)和45个pEJG107+pSMai214转化体(共转化)的SDS-PAGE图谱示出,转化体产生对应于烟曲霉CEL3A0 -葡糖苷酶的约130kDa以及对应于烟曲霉GH61B多肽的约24kDa的主要蛋白条带。由未转化的里氏木霉菌株981-0-8Φ4)培养物上清液构成的阴性对照样本,未示出约130kDa和约24kDa的显著条带。
以下所示的结果表明,串联构建体PDM287的转化比pEJG107和pSMai214的共转化得到更多的生产烟曲霉β -葡糖苷酶和烟曲霉GH61B多肽的阳性转化体。
【权利要求】
1.一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括: (a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)所述第一基因的同源3’区、其同源侧翼区或其组合; (b)通过向所述丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(?) 一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)所述第二基因的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合。
2.根据权利要求1所述的方法,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID N0:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ IDNO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少9 3%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
3.根据权利要求1或2所述的 方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
4.一种丝状真菌菌株,其包含: (a)通过靶向整合用第一串联构建体取代的内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)所述第一基因的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合用第二串联构建体取代的内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)所述第二基因的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合。
5.根据权利要求4所述的丝状真菌菌株,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID ΝΟ:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70 %,例如至少75 %、至少80 %、至少81 %、至少82 %、至少83 %、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少.92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少.93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
6.根据权利要求4或5所述的丝状真菌菌株,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
7.—种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中所述丝状真菌宿主细胞包含: (a)通过靶向整合用第一串联构建体取代的内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)所述第一基因的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合用第二串联构建体取代的内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)所述第二基因的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合。
8.根据权利要求7所述的方法,其还包括回收所述多种重组多肽。
9.根据权利要求7或8所述的方法,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93`%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ IDNO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID N0:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iV)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
10.根据权利要求7~9中任一项所述的方法,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
11.一种串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)所述基因的同源3’区、其同源侧翼区或其组合。
12.根据权利要求11所述的串联构建体,其中所述基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ IDNO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 或其中所述基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
13.—种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括: (a)通过祀向整合向内源性第一基因座中插入第一串联构建体,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)所述第一基因座的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合向内源性第二基因座中插入第二串联构建体,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)所述第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合。
14.根据权利要求13所述的方法,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ IDNO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ IDNO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 并且其中所述第二基因座是 编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID N0:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID N0:3的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
15.根据权利要求13或14所述的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
16.一种丝状真菌菌株,其包含 :(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)所述第一基因座的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)所述第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合。
17.根据权利要求16所述的丝状真菌菌株,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID N0:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70 %,例如至`少75 %、至少80 %、至少81 %、至少82 %、至少83 %、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
18.根据权利要求16或17所述的丝状真菌菌株,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
19.一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中所述丝状真菌宿主细胞包含: (a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(V)所述第一基因座的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(V)所述第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合。
20.根据权利要求19所述的方法,其还包括回收所述多种重组多肽。
21.根据权利要求19或20所述的方法,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92 %、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID N0:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
22.根据权利要求19~21中 任一项所述的方法,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
23.一种串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(V)所述基因座的同源3’区、其同源侧翼区或其组合。
24.根据权利要求23所述的串联构建体,所述基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO: 2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ IDNO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I ; 或其中所述基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70 %,例如至少75 %、至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %或至少99 %序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO: 3的成熟 多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
【文档编号】C12N15/80GK103890180SQ201280052277
【公开日】2014年6月25日 申请日期:2012年8月23日 优先权日:2011年8月24日
【发明者】D·亚韦, 金绮明 申请人:诺维信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1