获得丝状真菌宿主细胞的阳性转化体的方法

文档序号:511032阅读:446来源:国知局
获得丝状真菌宿主细胞的阳性转化体的方法
【专利摘要】本发明涉及获得丝状真菌宿主细胞的阳性转化体的方法,其包括:将串联构建体转化至丝状真菌宿主细胞群,并分离包含该串联构建体的丝状真菌宿主细胞的转化体。本发明还涉及这类串联构建体、包含这类串联构建体的丝状真菌宿主细胞、以及生产多种重组蛋白的方法。
【专利说明】获得丝状真菌宿主细胞的阳性转化体的方法
[0001]对序列表的引用
[0002]本申请包含计算机可读形式的序列表,其通过引用的方式合并入本文。
【技术领域】
[0003]本发明涉及增加丝状真菌宿主细胞的阳性转化体的产生的方法,其中该阳性转化体表达多种重组多肽。
【背景技术】
[0004]丝状真菌宿主细胞中多肽的重组生产可以提供更理想的用于以商业上有意义的量生产多肽的媒介。多肽的重组生产一般是通过构建表达盒来实现,在该表达盒中,编码多肽的DNA被置于来自所调苄基因的启动子的表达控制之下。通常通过质粒介导的转化,将表达盒导入宿主细胞中。然后在该表达盒所含启动子正常发挥功能所必需的诱导条件下,通过培养所转化的宿主细胞来实现多肽的生产。
[0005]丝状真菌细胞可以通过涉及原生质体形成、原生质体转化、和细胞壁再生的方法以本身已知的方式用载体进行转化。表达多种重组蛋白的两种或更多种载体的共转化并不能有效地提供生产出显著量的多种重组多肽的阳性转化体。
[0006]本领域需要一种方法来改善获得产生出显著量的多种重组多肽的阳性转化体的效率,相比于通过用于多种重组多肽中的每一种的载体的共转化而产生的阳性转化体,减少将要进行筛选的转化体的数目。
[0007]本发明提供用于产生对多种重组多肽进行表达的丝状真菌宿主细胞的阳性转化体的改进方法。

【发明内容】

[0008]本发明涉及获得丝状真菌宿主细胞的阳性转化体的方法,其包括:
[0009](a)向丝状真菌宿主细胞群转化串联构建体,该串联构建体包含(i) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸,其中该串联构建体通过异位整合而整合;
[0010](b)基于该一个或多个(例如,几个)可选择性标记物来选择转化体,其中,与通过用于第一和第二多核苷酸中的每一种的单独构建体的共转化而获得的阳性转化体的数目相比,通过串联构建体的转化而获得的用于具有生物活性的第一和第二多肽的阳性转化体的数目更高;以及
[0011](C)分离包含串联构建体的丝状真菌宿主细胞的转化体,该串联构建体表达具有生物活性的第一和第二多肽。
[0012]本发明还涉及丝状真菌宿主细胞,其包含:串联构建体,该串联构建体包含(i) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸,其中该串联构建体通过异位整合而整合。
[0013]本发明还涉及生产具有生物活性的多种重组多肽的方法,其包括:
[0014](a)在有益于生产多肽的条件下,培养用串联构建体转化的丝状真菌宿主细胞,该串联构建体包含(i) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸,其中该串联构建体通过异位整合而整合;及任选地
[0015](b)回收具有生物活性的第一和第二多肽。
[0016]本发明还涉及串联构建体和表达载体,该串联构建体和表达载体包含(i ) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸。
【专利附图】

【附图说明】
[0017]图1示出质粒pAG43的限制性酶切图谱。
[0018]图2示出质粒pSMai214的限制性酶切图谱。
[0019]图3示出质粒pDM287的限制性酶切图谱。
[0020]图4A~4D示出pDM287的45个转化体的SDS-PAGE图谱(串联构建体的转化;4A和4B)以及pEJG107+pSMai214的`45个转化体(共转化;4C和图4D)的SDS-PAGE图谱。
[0021]图5示出阳性转化体的β -葡糖苷酶活性的比较:在PDM287的45个转化体与pEJG107+pSMai214的45个转化体之间。
【具体实施方式】
[0022]定义
[0023]乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”是指催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α -萘酯和乙酸对硝基苯酯水解的羧酸酯酶(EC3.1.1.72)。出于本发明的目的,乙酰木聚糖酯酶的活性是使用在含0.01%TWEEN?20(聚氧乙烯失水山梨醇单月桂酸酯)的50mM乙酸钠pH5.0中的0.5mM乙酸对硝基苯酯作为底物而确定的。一个单位的乙酰木聚糖酯酶被定义为能够在pH5、25°C下每分钟释放I微摩尔(μ mole)对硝基苯酹阴离子的酶量。
[0024]等位变体(allelic variant):术语“等位变体”是指占据同一染色体基因座的基因的两种或更多种可选形式中的任意种。等位变化通过突变而自然发生,并可能引起种群内的多态性。基因突变可以是沉默的(在所编码的多肽中没有变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体所编码的多肽。
[0025]a -L-阿拉伯呋喃糖苷酶:术语“ a _L_阿拉伯呋喃糖苷酶”是指催化a -L-阿拉伯糖苷中末端非还原性a-L-阿拉伯呋喃糖苷残基的水解的a-L-阿拉伯呋喃糖苷阿拉伯呋喃水角军酶(alpha-L-arabinofuranosidearabinofuranohydrolase) (EC3.2.1.55)0 该酶作用于a-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖、和阿拉伯半乳聚糖。a-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、a-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖a-L-阿拉伯呋喃糖苷酶、a-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或a-L-阿拉伯聚糖酶。出于本发明的目的,a -L-阿拉伯呋喃糖苷酶的活性是使用总体积200 μ I的IOOmM乙酸钠ρΗ5中的每 ml5mg 中等粘度小麦阿拉伯木聚糖(Megazyme International Ireland, Ltd., Bray,C0.Wicklow,爱尔兰)在40°C下30分钟,随后通过AMINEX? HPX-87H柱色谱(Bio-RadLaboratories, Inc., Hercules, CA,美国)的阿拉伯糖分析而确定的。[0026]α-葡糖苷酸酶:术语“α-葡糖醛酸糖苷酶”是指催化a-D-葡糖苷酸水解为D-葡糖醒酸和醇的a -D-葡糖苷酸葡糖醒酸水解酶(alpha-D-glucosiduronateglucuronohydrolase) (EC3.2.1.139)。出于本发明的目的,α -葡糖苷酸酶活性是根据deVries, 1998, J.Bacteriol.180:243-249而确定的。一个单位的α -葡糖苷酸酶等于能够在pH5、40°C下每分钟释放I微摩尔的葡糖醛酸或4-0-甲基葡糖醛酸的酶量。
[0027]天冬氨酸蛋白酶:术语“天冬氨酸蛋白酶”是指使用天冬氨酸残基来催化肽和蛋白中肽键的水解的蛋白酶。天冬氨酸蛋白酶是使用天冬氨酸残基来催化它们的肽底物的水解的蛋白酶家族。一般情况下,它们在活性位点中具有两个高度保守的天冬氨酸盐(酯),且在酸性 pH 下活性最佳(Szecsi, 1992, Scand.J.Clin.Lab.1n vest.Supp1.210:5 - 22)。出于本发明的目的,天冬氨酸蛋白酶活性根据Aikawa等人、2001,J.Biochem.129:791-794描述的方案来确定。
[0028]β -葡糖苷酶:术语“ β -葡糖苷酶”是指催化末端非还原性β -D-葡萄糖残基的水解并释放β-D-葡萄糖的β-D-葡糖苷葡糖水解酶(beta-D-glucoside glucohydrolase)(E.C.3.2.1.21)。出于本发明的目的,β -葡糖苷酶活性是根据Venturi等人,2002, Extracellularbeta-D-glucosidase from Chaetomium thermophilum var.coprophiIum:production,purification and some biochemical properties, J.BasicMicrobiol.42:55-66 的方案使用对硝基苯基-β-D-吡喃葡糖苷作为底物而确定的。一个单位的葡糖苷酶被定义为在25°C、ρΗ4.8下在含0.01% TWEEN? 20的50mM柠檬酸钠中从作为底物的ImM对硝基苯基-β -D-吡喃葡糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
[0029]木糖苷酶:术语木糖苷酶”是指催化短β — (4)-低聚木糖的外水解以从非还原性末端去除连续的D-木糖残基的β -D-木糖苷木糖水解酶(EC3.2.1.37)。出于本发明的目的,一个单位的木糖苷酶被定义为在40°C、pH5下在含0.01% TWEEN?20的IOOmM柠檬酸钠中从作为底物的ImM对硝基苯基-β -D-木糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
[0030]cDNA:术语“cDNA”是指可以通过反转录从成熟的、剪接的从真核或原核细胞获得的mRNA分子制备而来的DNA分子。cDNA缺少可以存在于对应基因组DNA中的内含子序列。最初的初级RNA转录体是在呈现为成熟剪接的mRNA前的经由一系列步骤包括剪接而加工的mRNA的前体。
[0031]纤维二糖水解酶:术语“纤维二糖水解”是指催化纤维素、纤维寡糖、或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解以从链的还原末端或非还原末端释放纤维二糖的1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和Ε.C.3.2.1.176) (Teerij 1997,CrystalIinecellulose degradation: New insightinto the function of cellobiohydrolases, Trends in Biotechnology15:160-167 ;Teeri 等人,1998,Trichodermareesei cellobiohydrolases:why so efficienton crystalline cellulose?Biochem.Soc.Trans.26:173-178)。纤维二糖水解酶活性根据 Lever 等人,1972,Anal.Biochem.47:273-279 ;van Tilbeurgh 等人,1982,FEBS Letters, 149:152-156 ;van Tilbeurgh and Claeyssens, 1985, FEBSLetters, 187:283-288 ;以及 Tomme 等人,1988, Eur.J.Biochem.170:575-581 描述的方案来确定。在本发明中,Tomme等人的方法可被用于确定纤维二糖水解酶的活性。 [0032]纤维分解酶或纤维素酶:术语“纤维分解酶”或“纤维素酶”是指一种或多种(例如,几种)水解纤维素材料的酶。这样的酶包括内切葡聚糖酶、纤维二糖水解酶、β -葡糖苷酶或其组合。测量纤维分解活性的两种基本方法包括:(1)测量总纤维分解活性,和(2)测量单独的纤维分解活性(内切葡聚糖酶、纤维二糖水解酶和β -葡糖苷酶),如Zhang等人,Outlook for cellulase improvement: Screening and selectionstrategies, 2006, Biotechnology Advances24:452-481所综述的。总纤维分解活性通常是使用不溶性底物来测量的,该底物包括Whatman N2 I滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木质纤维素等。最常见的总纤维分解活性检定是使用WhatmanN2 I滤纸作为底物的滤纸检定。该检定是由国际纯粹与应用化学联合会(International Union of Pure and AppliedChemistry, IUPAC)石角立的(Ghose, 1987,Measurement of cellulase activities, PureApp1.Chem.59:257-68)。
[0033]出于本发明的目的,纤维分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料的水解的增加而加以确定:1~50mg纤维分解酶蛋白/g PCS中纤维素(或其他经预处理的纤维素材料),在合适的温度例如50°C、55°C或60°C下3~7天,与未添加纤维分解酶蛋白的对照水解相比较。通常条件为:Iml反应物,经洗涤或未洗涤的PCS,5%不溶性固体,50mM 乙酸钠 pH5,ImM MnS04,50°C、55°C或 60°C,72 小时,通过 AMINEX? HPX-87H柱(Bio-Rad Laboratories, Inc., Hercules, CA,美国)进行糖分析。
[0034]纤维素材料:术语“纤维素材料”是指包含纤维素的任何材料。在生物质的初生细胞壁中的主要多糖是纤维素,其次丰富的是半纤维素,而第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,并通过与半纤维素共价交联的聚合木质素而进行加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链i3-(l_4)-D-葡聚糖;而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,处于具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其他半纤维素以氢键相连,这帮助稳定细胞壁基质。
[0035]纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于HandbookonBioethanol (Charles E.Wyman 编),pp.105-118,Taylor&Francis, Washington D.C.;Wyman, 1994, Bioresource Technology50:3-16 ;Lynd,1990,Applied Biochemistry andBiotechnology24/25:695-719 ;Mosier 等人,1999,Recent Progress in Bioconversionof Lignocellulosicsj 于 Advances in Biochemical Engineering/Biotechnology, T.Scheper 主编,Volume65,pp.23-40,Springer-Verlagj New York)。在本文中应理解的是,纤维素可以是木质纤维素的形式,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,纤维素材料是木质纤维素,其包含纤维素、半纤维素和木质素。
[0036]在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
[0037]在另一个方面,纤维素材料是芦竹。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸杆。在另一个方面,纤维素材料是芒草。在另一个方面,纤维素材料是橘皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是柳枝稷。在另一个方面,纤维素材料是麦杆。
[0038]在另一个方面,纤维素材料是山杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是冷杉。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。
[0039]在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉绒。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
[0040]在另一个方面,纤维素材料是水生生物质。如本文所使用的,术语“水生生物质”是指在水生环境中由光合作用过程产生的生物质。水生生物质可以为藻类、挺水植物、浮叶植物或沉水植物。
[0041]如本文所述,纤维素材料可以使用本领域已知的常规方法按原样使用或进行预处理。在一个优选的方面,纤维素材料被预处理。
[0042]编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框确定,开放阅读框以起始密码子如ATG、GTG或TTG开始并以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
[0043]控制序列:术语“控制序列”是指编码多肽的多核苷酸的表达所必需的核酸序列。各个控制序列对于编码多肽的多核苷酸可以是内生的(即,来自相同基因)或外来的(即,来自不同基因)或彼此为内生或外来。这些控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最低限度,控制序列包括启动子、以及转录和翻译终止信号。控制信号可以设有用于导入特定的促进控制序列与编码多肽的多核苷酸编码区进行连接的限制性酶切位点的接头。
[0044]异位整合:术语“异位整合”是指向微生物的基因组在非靶位点或除其通常的染色体基因座以外的位点插入核酸,即,随机整合。
[0045]内切葡聚糖酶:术语“内切葡聚糖酶”是指催化纤维素、纤维素衍生物(例如羧甲基纤维素和轻乙基纤维素)、地衣多糖中的1,4-β -D-糖苷键的内水解(endohydrolysis),催化混合的β-1,3-葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和含有纤维素组分的其他植物材料中的β -1, 4键的内水解的内切-1,4-(1, 3; 1,4) - β -D-葡聚糖4-葡聚糖水解酶(endo-1, 4-(1, 3; I, 4)-beta-D-glucan4-glucanohydrolase) (E.C.3.2.1.4)。内切葡聚糖酶的活性可以通过测量底物粘度的减少或由还原糖检定(Zhang等人,2006, BiotechnologyAdvances24:452-481)确定的还原端的增加来确定。出于本发明的目的,内切葡聚糖酶的活性根据 Ghose, 1987, Pure and Appl.Chem.59:257-268 的方法,在pH5、40°C下使用羧甲基纤维素(CMC)作为底物而确定。
[0046]表达:术语“表达”包括在多肽生产中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
[0047]表达载体:术语“表达载体”是指包含编码多肽的多核苷酸并与提供用于其表达的控制序列可操作地连接的线性或环状DNA分子。
[0048]糖苷水解酶61家族:术语“糖苷水解酶61家族”或“GH61家族”或“GH61”是指根 据 Henrissat B., 1991, A classification of glycosylhydrolases based onamino-acid sequence similari ties, Biochem.J.280:309-316 及 Henrissat B.和Bairoch A., 1996, Updating the sequence-base(!classification of glycosylhydrolases, Biochem.J.316:695-696而落入糖苷水解酶61家族的多肽。原先,该家族中的酶基于一个家族成员中测量的非常弱的内切-1,4-β -D-葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非公认的,且它们无法被视为真正的糖苷酶。然而,基于它们在与纤维素酶或纤维素酶的混合物一同使用时增强木质纤维素分解的能力,它们被保留在CAZy分类中。
[0049]阿魏酸酯酶:术语“阿魏酸酯酶”是指催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(在天然生物质底物中通常为阿拉伯糖)中水解以产生阿魏酸酯(盐)(4-羟基-3-甲氧基肉桂酸酯(盐))的4-羟基-3-甲氧基肉桂酰-糖水解酶(EC3.1.1.73)。阿魏酸酯酶也被称为阿魏酸酯酶、羟基肉桂酰基酯酶、FAE-1I1、肉桂酸酯水解酶、FAEA、cinnAE、FAE-1或FAE-1I。出于本发明的目的,`阿魏酸酯酶的活性是使用50mM乙酸钠pH5.0中的
0.5mM阿魏酸对硝基苯酯作为底物而确定的。一个单位的阿魏酸酯酶等于能够在pH5、25°C下每分钟释放I微摩尔对硝基苯酚阴离子的酶量。
[0050]侧翼:术语“侧翼”是指在特定DNA序列、基因座或基因的任一侧延伸的DNA序列。侧翼DNA紧邻将要整合到丝状真菌细胞的基因组中的另一 DNA序列、基因座或基因。
[0051]片段:术语“片段”是指在成熟多肽域的氨基端和/或羧基端缺少一个或多个(如,几个)氨基酸的多肽;其中该片段具有酶活性。在一方面,片段含有酶的成熟多肽的至少85%,例如至少90%或至少95%的氨基酸残基。
[0052]半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”是指一种或多种(例如,几种)水解半纤维素材料的酶。参见,例如Shallom, D.和Shoham, Y.Microbialhemicellulases.CurrentOpinion In Microbiology, 2003,6 (3): 219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括,但不限于,乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖苷酸酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支链和直链多糖的混杂群,它们通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为稳定网路。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变结构和组织需要许多酶的协同作用来使其完全降解。半纤维素酶的催化单元为水解糖苷键的糖苷水解酶(GH),或水解乙酸酯或阿魏酸侧基的酯键的糖酯酶(CE)。这些催化单元,基于其一级序列的同源性,可分配到GH和CE家族。具有总体上类似的折叠的一些家族还可以归类为宗族,按字母顺序标记(例如,GH-A)。这些和其他糖类活性酶的最具信息性和最新的分类可以在糖类活性酶(CAZy)数据库中获得。半纤维素分解酶活性可以根据Ghose和Bisaria, 1987,Pure&Appl.Chem.59:1739-1752在合适的温度例如50°C、55°C或60°C以及pH例如5.0或5.5下进行测量。
[0053]高等严格条件:术语“高等严格条件”是指至少100个核苷酸长度的探针于42°C在5 X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交,遵循标准DNA印迹程序进行12至24小时。载体材料最后使用2XSSC、0.2%SDS在65V洗涤三次,每次15分钟。
[0054]同源重复:术语“同源重复”是指在导入宿主细胞的重组DNA中重复至少两次且可以通过同源重组而促进DNA (即,插在两个同源重复之间的可选择性标记物)的丢失的DNA片段。 [0055]宿主细胞:术语“宿主细胞”是指对具有含编码多肽的多核苷酸的核酸构建体或表达载体的转化、转染、转导等敏感的任何细胞类型。术语“宿主细胞”包括由于复制过程中发生的突变而不与亲本细胞相同的任何亲本细胞后代。
[0056]分离的:术语“分离的”是指,处于非天然发生的形式或环境中的物质。分离的物质的非限制性实例包括:(I)任何非天然发生的物质;(2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅助因子的任何物质,其至少部分地从与其天然相关联的一种或多种或所有天然发生成分中移出;(3)相对于天然发现的物质,经人工修饰的任何物质;或者(4)通过增加物质相对于与其天然相关的其他组分的含量而修饰的任意物质(例如,宿主细胞中的重组生产;多个拷贝的物质编码基因;相比于与编码物质的基因天然相关的启动子,使用更强的启动子)。
[0057]低等严格条件:术语“低等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5 X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交,遵循标准DNA印迹过程进行12~24个小时。载体材料最终使用2 X SSC、0.2%SDS在50°C下洗涤三次,每次15分钟。
[0058]成熟多肽:术语“成熟多肽”是指,在翻译和任何翻译后修饰(例如N端加工、C端截短、糖基化、磷酸化等)之后处于其最终形式的多肽。领域内已知,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即,具有不同的C端和/或N端氨基酸)的混合物。
[0059]成熟多肽编码序列:术语“成熟多肽编码序列”是指编码具有酶活性的成熟多肽的多核苷酸。
[0060]中等严格条件:术语“中等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5 X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12~24个小时。载体材料最终使用2 X SSC、0.2%SDS在55 °C下洗涤三次,每次15分钟。[0061]中到高等严格条件:术语“中到高等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12~24个小时。载体材料最终使用2XSSC、0.2%SDS在60V下洗涤三次,每次15分钟。
[0062]核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离出或以自然中不会出现或是合成的方式修饰成包含核酸片段,其包含一个或多个(例如,几个)控制序列。
[0063]可操作地连接:术语“可操作地连接”是指一种构造,其中控制序列位于相对于多核苷酸的编码序列为合适的位置,从而使控制序列引导编码序列的表达。
[0064]具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”是指通过具有纤维素分解活性的酶来催化纤维素材料水解的增强的GH61多肽。出于本发明的目的,通过测量由纤维素分解酶在下述条件下水解纤维素材料而来的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性=PCS中的I~50mg总蛋白/g纤维素,其中总蛋白包含50~99.5%w/w的纤维素分解酶蛋白和0.5~50%w/w的具有纤维素分解增强活性的GH61多肽的蛋白,在合适的温度例如50°C、55°C或60°C以及pH例如5.0或5.5下I~7天,与用等量的无纤维素分解增强活性的总蛋白加载量(PCS中的I~50mg纤维素分解蛋白/g纤维素)所进行的对照水解相比。在优选的方面,使用纤维素酶蛋白加载量的存在总蛋白重量的2~3%的米曲霉(Aspergillus oryzae) β -葡糖苷酶(根据W002/095014在米曲霉中重组产生)或总蛋白重量的2~3%的烟曲霉(Aspergillus fumigatus) β -葡糖苷酶(如W02002/095014中所述在米曲霉中重组产生)的CELLUCLAST? 1.5L(NovozymesA/S, Bagsvaerd,丹麦)的混合物作为纤维素分解活性的来源。
[0065]具有纤维素分解增强活性的GH61多肽通过降低达到相同水解程度所需的纤维素分解酶的量来增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍或至少20倍。`
[0066]阳性转化体:术语“阳性转化体”是指来自用本发明的串联构建体转化或用多种构建体共转化的丝状真菌宿主细胞群的转化体,其中该转化体产生两种或更多种(例如,几种)由串联构建体或多种构建体编码的重组多肽。
[0067]序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联性通过参数“序列同一'I"生”来描述。
[0068]出于本发明的目的,使用在EMBOSS软件包(EMBOSS:TheEuropean MolecularBiology Open Software Suite (欧洲分子生物学开放软件包),Rice 等人,2000, TrendsGenet.16:276-277)(优选 5.0.0 或更新版本)的 Needle 程序中执行的 Needleman-Wunsch算法(Needlemanand Wunsch, 1970, J.Mol.Biol.48:443-453),来确定两个氛基酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EBL0SUM62(BL0SUM62的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的)被用作百分比同一性并计算如下:
[0069](相同残基X100) / (比对长度-比对中的空位总数)。
[0070]出于本发明的目的,使用在EMBOSS软件包(EMBOSS:TheEuropean MolecularBiology Open Software Suite (欧洲分子生物学开放软件包),Rice等人,2000,同上)(优选5.0.0或更新版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman andWunsch, 1970,同上),来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EDNAFULUNCBI NUC4.4的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的)被用作百分比同一性并计算如下:
[0071](相同的脱氧核糖核苷酸X100)/(比对长度-比对中的空位总数)。
[0072]子序列:术语“子序列”是指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如,几个)核苷酸的多核苷酸;其中子序列编码具有酶活性的片段。在一个方面,子序列含有酶的成熟多肽编码序列的至少85%,例如,至少90%或至少95%的核苷酸。 [0073]枯草杆菌蛋白酶样丝氨酸蛋白酶:术语“枯草杆菌蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于枯草杆菌蛋白酶的蛋白酶,枯草杆菌蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。枯草杆菌蛋白酶样蛋白酶(枯草杆菌酶)为丝氨酸蛋白酶,其特征在于三个氨基酸天冬氨酸、组氨酸和丝氨酸的催化三联体(catalytic triad)。这些催化残基的排布为来自地衣芽孢杆菌(Bacillus licheniformis)的原型枯草杆菌蛋白酶所共有(Siezen和Leunissen, 1997,Protein Science6:501-523)。枯草杆菌蛋白酶样丝氨酸蛋白酶的活性可以使用合成的底物N-琥珀酰-L-Ala-L-Ala-L-Pr0-L-Phe-对硝基酰苯胺(AAPF)(BachemAG, Bubendorf,瑞士)于 IOOmM NaCl-1OOmM MOPS ρΗ7.0 中在 50°C下 3 小时并接着测量在405nm处吸光度而确定。
[0074]转化体:术语“转化体”是指已接纳胞外DNA (外来的、人工的或修饰的)并表达包含其中的基因的细胞。
[0075]转化:术语“转化”是指将胞外DNA导入细胞,即,由从其周围直接摄入、整合并表达外来遗传物质(外来DNA)以及经细胞膜接收而引起的细胞的遗传改变。
[0076]转化效率:术语“转化效率”是指细胞能够摄入胞外DNA并表达其中所含的基因的效率,转化效率通过将表达基因的阳性转化体的数目除以转化过程中使用的DNA量来计

ο
[0077]胰蛋白酶样丝氨酸蛋白酶:术语“胰蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于胰蛋白酶的蛋白酶,胰蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。出于本发明的目的,胰蛋白酶样丝氨酸蛋白酶的活性是根据Dienes等人,2007,Enzyme andMicrobialTechnology40:1087-1094 所述的方法而确定的。
[0078]变体:术语“变体”是指,在一个或多个(例如,几个)位置上包含改变(即替换、插入和/或缺失)的具有酶活性的多肽。替换是指用不同的氨基酸取代占据位置的氨基酸;缺失是指去除占据位置的氨基酸;而插入是指将氨基酸添加至紧邻占据位置的氨基酸。
[0079]极高等严格条件:术语“极高等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12至24个小时。载体材料最终使用2XSSC、
0.2%SDS在70°C下洗涤三次,每次15分钟。
[0080]极低等严格条件:术语“极低等严格条件”是指,长度为至少100个核苷酸的探针,在42°C下,在5XSSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12至24个小时。载体材料最终使用2XSSC、
0.2%SDS在45 °C下洗涤三次,每次15分钟。
[0081]含木聚糖的材料:术语“含木聚糖的材料”是指任何包含含有β-(1-4)-连接的木糖残基的骨架的植物细胞壁多糖的材料。陆生植物的木聚糖是具有i3-(l_4)-D-吡喃木糖骨架的杂聚物,其由短的糖链分支。它们包含D-葡糖醛酸或其4-0-甲基醚、L-阿拉伯糖和/或多种由D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖构成的寡糖。木聚糖类的多糖可以分为均木聚糖(homoxylan)和杂木聚糖(heteroxylan),包括葡糖醒酸木聚糖、(阿拉伯)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯木聚糖、阿拉伯木聚糖和复合杂木聚糖。参见,例如 Ebringerova 等人,2005, Adv.Polym.Sc1.186:1-67。
[0082]在本发明的方法中,可以使用任何含有木聚糖的材料。在一个优选的方面,含木聚糖的材料为木质纤维素。
[0083]木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”是指水解含木聚糖的材料的生物学活性。两种基础的测量木聚糖分解活性的方法包括:(I)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如,内切木聚糖酶、β -木糖苷酶、阿拉伯呋喃糖苷酶、α -葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醒酸酯酶(alpha-glucuronyl esterase))。木聚糖分解酶检定的最新进展被总结于几个公开文献中,包括 Biely 和 Puchard, Recentprogress in the assays of xylanolyticenzymes, 2006, Journal of the Scienceof Food and Agriculture86(I I):1636-1647 ;Spanikova 和 Biely, 2006,Glucuronoyl esterase-Novel carbohydrate esteraseproduced bySchizophylIum commune,FEBS Letters580(19):4597-4601 ;Herrmann,Vrsanska, Jurickova, Hirsch,Biely 和 Kubicek, 1997, Thebeta-D-xylosidase ofTrichoderma reesei is a multifunctional beta-D-xylanxylohydrolase, BiochemicalJournal321:375-381。
[0084]总木聚糖降解活性可以通过确定由多种类型的木聚糖形成的还原糖来测量,木聚糖包括,例如,燕麦(oat spelt)、山毛榉材和落叶松材木聚糖,或可以通过光度法确定从多种共价染色的木聚糖中释放出的染色木聚糖片段而测量。最常见的总木聚糖分解活性检定基于由多聚4-0-甲基葡糖醒酸木聚糖生产还原糖,如Bailey, Biely, Poutanen, 1992, Interlaboratory testing of methods for assay of xylanase activity, JournalofBiotechnology23(3):257-270中所述。木聚糖酶活性亦可以用0.2%AZCL_阿拉伯木聚糖作为底物在37°〇下于0.01%丁111丁0凡? X-100(4-(l,1,3,3_四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH6中加以确定。一个单位的木聚糖酶活性定义为在37°C、pH6下在200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL_阿拉伯木聚糖中每分钟产生1.0微摩尔可可碱醋酸钠(azurine)。
[0085]出于本发明的目的,木聚糖降解活性是通过在以下通常条件下测量由木聚糖降解酶引起的白桦木聚糖(Sigma Chemical C0.,Inc.,St.Louis, MO,美国)水解的增加而确定的:1ml反应,5mg/ml底物(总固体),5mg木聚糖分解蛋白/g底物,50mM乙酸钠pH5, 50 °C, 24 小时,如 Lever, 1972,A new reaction for colorimetric determinationof carbohydrates, Anal.Biochem47:273-279所述的使用对羟基苯甲酸酸餅(PHBAH)检定的糖分析。[0086]木聚糖酶:术语“木聚糖酶”是指催化木聚糖中l,4-13_D-木糖苷键的内水解的I, 4- β -D-木聚糖-木糖水解酶(1,4-beta-D-xylan-xylohydrolase) (E.C.3.2.1.8)。出于本发明的目的,木聚糖酶活性是用0.2%AZCL-阿拉伯木聚糖作为底物在37°C下于
0.01% TRITON'? X-100和200mM磷酸钠缓冲液pH6中加以确定的。一个单位的木聚糖酶活性定义为在37°C、pH6下于200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL_阿拉伯木聚糖中每分钟产生1.0微摩尔可可碱醋酸钠。
[0087]发明详沭 [0088]本发明涉及获得丝状真菌宿主细胞的阳性转化体的方法,其包括:(a)向丝状真菌宿主细胞群转化串联构建体,该串联构建体包含(i) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸,其中该串联构建体通过异位整合而整合;(b)基于一个或多个(例如,几个)可选择性标记物来选择转化体,其中,与通过用于第一和第二多核苷酸中的每一种的单独构建体的共转化而获得的阳性转化体的数目相比,通过串联构建体的转化而获得的用于具有生物活性的第一和第二多肽的阳性转化体的数目更高;以及(c)分离包含串联构建体的丝状真菌宿主细胞的转化体,该串联构建体表达具有生物活性的第一和第二多肽。
[0089]本发明方法的优势是增加了获得生产出显著量的两种或更多种(例如,几种)重组多肽的阳性转化体的转化效率,这减少了需要生成并筛选的转化体的数目。使用本发明的表达两种或更多种重组多肽的串联构建体,当与通过共转化用于两种或更多种重组多肽中的每一种的单独构建体(例如,两种或更多种单独的表达构建体)所生成的转化体相比,得到更高数目的以显著量生产两种或更多种重组多肽的转化体。
[0090]在一个方面,与通过共转化用于具有生物活性的第一和第二多肽中各个的单独构建体而获得的阳性转化体的数目相比,通过本发明的串联构建体的转化而获得的用于具有生物活性的第一和第二多肽的阳性转化体的数目增加至少1.1倍,例如,至少1.25倍、至少
1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、或至少10倍。串联构津体
[0091]本发明还涉及串联构建体,其包含(i) 一个或多个(例如,几个)可选择性标记物、
(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸。串联构建体可以通过可操作地连接一个或多个(例如,几个)控制序列至构建体的各种多核苷酸而加以构建,控制序列在与控制序列相容的条件下引导编码序列在丝状真菌宿主细胞中的表达。在插入载体之前对各多核苷酸的操纵可能是所期望的或必要的,这取决于表达载体。利用重组DNA方法来修饰多核苷酸的技术在本领域中是众所周知的。
[0092]控制序列可以是启动子,即,被丝状真菌宿主细胞识别的用于编码多肽的多核苷酸的表达的多核苷酸。启动子含有介导多肽的表达的转录控制序列。启动子可以是在丝状真菌宿主细胞中显示出转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码对宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
[0093]在一个方面,串联构建体中的启动子是不同的启动子。在另一个方面,串联构建体中的两个或更多个启动子是相同的启动子。
[0094]引导构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性 α-淀粉酶、黑曲霉酸稳定性α -淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米曲霉(AspergiIIus oryzae) TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(W096/00787)、镶片镰孢(Fusariumvenenatum)淀粉葡萄糖苷酶(W000/56900)、壤片键抱(Fusarium venenatum) Daria(W000/56900)、镶片镰孢 Quinn (W000/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei) β -葡糖苷酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶I1、里氏木霉内切葡聚糖酶II1、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉木聚糖酶II1、里氏木霉β -木糖苷酶、和里氏木霉翻译延伸因子的基因中获得的启动子,以及NA2-tpi启动子(得自曲霉中性α -淀粉酶基因的修饰启动子,其中非翻译前导已被曲霉磷酸丙糖异构酶基因的非翻译前导替换;非限制性实例包括黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被构巢曲霉或米曲霉磷酸丙糖异构酶基因的非翻译前导替换);以及其突变的、截短的和杂合的启动子。其他启动子在美国专利第6,011,147中描述,其整体并入本文。
[0095]控制序列也可以是转录终止子,其由丝状真菌宿主细胞识别来终止转录。终止子可操作地与编码多肽的多核苷酸的3’端连接。可以在宿主细胞中起作用的任何终止子可以用在本发明中。
[0096]在一个方面,串联构建体中的终止子是不同的终止子。在另一个方面,在串联构建体中的一个或多个终止子是相 同的终止子。
[0097]用于丝状真菌宿主细胞的优选终止子得自构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α -葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β -葡糖苷酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶I1、里氏木霉内切葡聚糖酶II1、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶1、里氏木霉木聚糖酶I1、里氏木霉木聚糖酶II1、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因。
[0098]控制序列还可以是前导序列,即,对由宿主细胞的翻译较为重要的mRNA非翻译区。前导序列可操作地连接到编码多肽的多核苷酸的5’端。任何在丝状真菌宿主细胞中起作用的前导序列均可以使用。
[0099]用于丝状真菌宿主细胞的优选前导序列得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。
[0100]控制序列也可以是多腺苷酸化序列,即可操作地连接至多核苷酸的3’端的序列,在转录时被丝状真菌宿主细胞识别为向转录mRNA添加多腺苷残基的信号。在宿主细胞中起作用的任何多腺苷酸化序列均可以使用。
[0101]用于丝状真菌宿主细胞的优选多腺苷酸化序列得自构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、和里氏木霉内切葡聚糖酶V的基因。
[0102]控制序列也可以是编码与多肽N端连接的信号肽并引导多肽进入细胞分泌通路的信号肽编码区。多核苷酸的编码序列的5’端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段自然连接的信号肽编码序列。或者,编码序列的5’端可以包含对于编码序列为外来的信号肽编码序列。在编码序列不天然包含信号肽编码序列时,外来信号肽编码序列可能是需要的。或者,为增强多肽的分泌,外来信号肽编码序列可以简单地取代天然信号肽编码序列。然而,任何引导所表达的多肽进入丝状真菌宿主细胞的分泌通路的信号肽编码序列均可以使用。
[0103]用于丝状真菌宿主细胞的有效信号肽编码序列是得自黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉(Humicola lanuginosa)脂肪酶、米黑根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶I1、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶I1、里氏木霉内切葡聚糖酶II1、和里氏木霉切葡聚糖酶V的基因的信号肽编码序列。
[0104]控制序列也可以是编码位于多肽N端的前肽的前肽编码序列。得到的多肽称为酶原或前多肽(或在一些情况下为酵素原)。前多肽一般是失活的且可以通过从前多肽到前肽的催化或自催化切割而转化为活性多肽。前肽编码序列可以得自嗜热毁丝菌(Myceliophthorathermophila)漆酶(W095/33836)和米黑根毛霉天冬氨酸蛋白酶的基因。
[0105]在信号肽和前肽序列均存在时,前肽序列紧邻多肽的N端且信号肽序列紧邻前肽序列的N端。
[0106] 也可能需要添加调控相对于丝状真菌宿主细胞生长的多肽的表达的调控序列。调控序列的实例是响应于化学或物理刺激(包括调控化合物的存在)引起基因表达的开启和关闭的那些。丝状真菌中的调控序列包括黑曲霉葡糖淀粉酶启动子、米曲霉TAKAa-淀粉酶启动子、米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是使得基因扩增的那些。在这些情况下,编码多肽的多核苷酸将可操作地与调控序列连接。
[0107]本发明的串联构建体优选包含一个或多个(例如,几个)允许方便地选择转化细胞的可选择性标记物。可选择性标记物是基因,其产物提供对生物灭杀剂的抗性或病毒抗性、重金属抗性、相对于营养缺陷型的原养型等。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA (磷酸核糖基氨基咪唑-琥拍羧胺合酶(phosphoribosylaminoimidazoIe-succinocarboxamide synthase))、adeB (憐酸核糖基氨基咪唑合酶(phosphoribosylaminoimidazole synthase))、amdS (乙酸胺酶)、argB (鸟氨酸氨甲酸基转移酶)、bar (膦丝菌素乙酰转移酶)、hph (潮霉素磷酸转移酶)、niaD (硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、SC (硫酸腺苷酰转移酶)、和trpC (邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)bar基因。优选用在木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨节青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
[0108]一个或多个(例如,几个)可选择性标记物可以是如W02010/039889A2 (通过引用的方式全部合并入本文)中所述的双选择标记物体系。在一个方面,一个或多个(例如,几个)可选择性标记物是hph-tk双选择标记物体系。
[0109]在本发明的各串联构建体中,一个或多个可选择性标记物是不同的标记物,除非如本文所述重复使用可选择性标记物。
[0110]一个或多个(例如,几个)可选择性标记物可以再用于向丝状真菌宿主细胞导入新的串联构建体。本发明的串联构建体还可以包含一个或多个(例如,几个)可选择性标记物的5’侧翼的第一同源重复以及一个或多个可选择性标记物的3’侧翼的第二同源重复,其中,第一同源重复和第二同源重复进行同源重组以切除一个或多个可选择性标记物。在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以在新的串联构建体中再使用。
[0111]在一个方面,第一和第二同源重复是相同的。在另一个方面,第一和第二同源重复彼此具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少97%、至少98%、或至少99%的序列同一性。在另一个方面,第一和第二同源重复各自为至少50bp,例如,至少lOObp、至少200bp、至少400bp、至少800bp、至少lOOObp、至少1500bp、或至少2000bp。包含一个重复的片段可以比含有另一重复的片段长。
[0112]本发明的串联构建体还可以包含一个或多个(例如,几个)编码其他具有生物活性的多肽的其他多核苷酸。例如,串联构建体可以含有一个其他多核苷酸、两个其他多核苷酸、三个其他多核苷酸等。
[0113]具有生物活性的多肽
[0114]多肽可以是具有目标生物活性的任何多肽。在本文中,术语“多肽”不是指特定长度的所编码产物,因此涵盖肽、寡肽和蛋白。术语“多肽”还涵盖组合形成所编码产物的两个或更多个多肽。多肽也包括融合多肽,其包含得自至少两个不同多肽的部分或完整多肽序列的组合,其中一个或多个(例如,几个)多肽可以对丝状真菌宿主细胞为异源。多肽还包括下述多肽的天然存在的等位变体和遗传工程变体以及杂合多肽。
[0115]在一个方面,具有生物活性的多肽可以是不同的多肽。在另一个方面,两个或更多个具有生物活性的多肽是相同的多肽。
[0116]在另一个方面,多肽选自抗体、抗原、抗菌肽、酶、生长因子、激素、免疫增强剂(immunodilator)、神经递质、受体、报告蛋白、结构蛋白、或转录因子。
[0117]在另一个方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。在另一个方面, 酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α-淀粉酶、α-半乳糖苷酶、α -葡糖苷酶、α -1, 6-葡糖苷转移酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、β -半乳糖苷酶、葡糖苷酶、木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、葡糖脑苷酯酶、葡糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、齒过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶[0118]在另一个方面,多肽选自白蛋白、胶原蛋白、弹性蛋白原、弹性蛋白、和明胶。
[0119]在另一个方面,多肽选自纤维素酶、cipl蛋白、具有纤维素分解增强活性的GH61、半纤维素酶、酯酶、膨胀素、漆酶、木质素降解酶、果胶酶、过氧化物酶、蛋白酶、和膨胀因子(Swollenin)0在另一个方面,纤维素酶是选自内切葡聚糖酶、纤维二糖水解酶、和β -葡糖苷酶的一种或多种酶。在另一个方面,半纤维素酶是选自木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸酶的一种或多种酶。
[0120]在另一个方面,多肽之一是纤维素酶。在另一个方面,多肽之一是内切葡聚糖酶。在另一个方面,多肽之一是纤维二糖水解酶。在另一个方面,多肽之一是β_葡糖苷酶。在另一个方面,多肽之一是具有纤维素分解增强活性的GH61多肽。在另一个方面,多肽之一是cipl蛋白。在另一个方面,多肽之一是酯酶。在另一个方面,多肽之一是膨胀素。在另一个方面,多肽之一是漆酶。在另一个方面,多肽之一是木质素降解酶。在另一个方面,多肽之一是果胶酶。在另一个方面,多肽之一是过氧化物酶。在另一个方面,多肽之一是蛋白酶。在另一个方面,多肽之一是膨胀因子。
[0121]在另一个方面,多肽之一是半纤维素酶。在另一个方面,多肽之一是木聚糖酶。在另一个方面,多肽之一是β_木糖苷酶。在另一个方面,多肽之一是乙酰木聚糖酯酶。在另一个方面,多肽之一是阿魏酸酯酶。在另一个方面,多肽之一是阿拉伯呋喃糖苷酶。在另一个方面,多肽之一是葡糖醛酸酶。在另一个方面,多肽之一是乙酰甘露聚糖酯酶。在另一个方面,多肽之一是阿拉伯聚糖酶。在另一个方面,多肽之一是香豆酸酯酶。在另一个方面,多肽之一是半乳糖苷酶。在另一个方面,多肽之一是葡糖醛酸酯酶。在另一个方面,多肽之一是甘露聚糖酶。在另一个方面,多肽之一是甘露糖苷酶。
[0122]作为具有生物活性的多肽之一的内切葡聚糖酶的实例包括,但不限于,里氏木霉内切葡聚糖酶I (Penttila等人,1986,Gene45:253-263 ;里氏木霉Cel7B内切葡聚糖酶I ;GENBANK?登录号M15665 ;SEQ IDNO:2);里氏木霉内切葡聚糖酶II (Saloheimo等人,1988,Gene63:11-22 ;里氏木霉Cel5A内切葡聚糖酶II ;GENBANK?登录号M19373 ;SEQ ID NO:4);里氏木霉内切葡聚糖酶 III (Okada 等人,1988,Appl.Environ.Microbiol.64:555-563 ;GENBANK? 登录号 AB003694 ;SEQ ID NO:6);里氏木霉内切葡聚糖酶 V (Saloheimo 等人,1`994, Molecular Microbiology 13:219-228 ;GENBANK? 登录号 Z33381 ;SEQ ID NO:8);棘孢曲霉(Aspergillus aculeatus)内切葡聚糖酶(Ooi 等人,1990,Nucleic Acids Researchl8:5884);白曲霉(Aspergillus kawachii )内切葡聚糖酶(Sakamoto 等人,1995, CurrentGenetics27:435-439);软腐欧氏杆菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti等人,1990,Gene90:9-14);尖孢镰孢内切葡聚糖酶(GENBANK? 登录号 L29381);灰腐质霉高温变种(Humicola griseavar.thermo idea)内切葡聚糖酶(GENBANKTM登录号AB003107);热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(GENBANK?登录号MAL515703);粗糙脉孢菌(Neurospora crassa)内切葡聚糖酶(GENBANK?登录号XM_324477);特异腐质霉内切葡聚糖酶V (SEQ ID NO:10);嗜热毁丝霉 CBS117.65 内切葡聚糖酶(SEQ IDNO:12);担子菌(basidiomycete) CBS495.95 内切葡聚糖酶(SEQ IDNO:14);担子菌CBS494.95内切葡聚糖酶(SEQ ID NO:16);太瑞斯梭孢壳(Thielavia terrestris) NRRL8126CEL6B 内切葡聚糖酶(SEQID N0:18);太瑞斯梭抱壳NRRL8126CEL6C内切葡聚糖酶(SEQ IDNO:20);太瑞斯梭孢壳NRRL8126CEL7C内切葡聚糖酶(SEQ ID NO:22);太瑞斯梭孢壳NRRL8126CEL7E内切葡聚糖酶(SEQ ID NO:24);太瑞斯梭孢壳NRRL8126CEL7F内切葡聚糖酶(SEQ ID NO:26);多生枝鼻菌(Cladorrhinumfoecundissimum)ATCC62373CEL7A 内切葡聚糖酶(SEQ ID NO:28);和里氏木霉菌株N0.VTT-D-80133 内切葡聚糖酶(SEQ ID NO:30 ;GENBANKTM 登录号 M15665)。以上所述 SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO: 14, SEQ ID NO: 16, SEQID NO: 18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQIDNO:26,SEQ ID N0:28和SEQ ID NO:30 的内切葡聚糖酶分别由 SEQID NO: USEQ ID N0:3、SEQ ID N0:5、SEQ ID N0:7、SEQ ID N0:9、SEQ ID NO: 11、SEQ ID NO: 13、SEQ ID NO: 15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQID NO:27和SEQ ID NO:29的成熟多肽编码序列所编码。
[0123]作为具有生物活性的多肽之一的纤维二糖水解酶的实例包括,但不限于,里氏木霉纤维二糖水解酶I (SEQ ID NO:32)、里氏木霉纤维二糖水解酶II (SEQ ID NO:34)、特异腐质霉纤维二糖水解酶KSEQID NO:36)、嗜热毁丝菌纤维二糖水解酶II(W02009/042871 ;SEQ IDN0:38 和 SEQ ID NO:40)、太瑞斯梭孢壳纤维二糖水解酶 II(CEL6A,W02006/074435 ;SEQ ID NO:42)、嗜热毛壳菌(Chaetomiumthermophilum)纤维二糖水解酶 I (SEQ ID NO:44)、嗜热毛壳菌纤维二糖水解酶II (SEQ ID NO:46)、烟曲霉纤维二糖水解酶I (SEQ IDNO:48)、和烟曲霉纤维二糖水解酶II (SEQ ID NO:50)。以上所述的SEQID NO:32,SEQ IDNO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40,SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46, SEQ ID NO:48、和 SEQ ID NO:50 的纤维二糖水解酶分别由 SEQ ID NO:31, SEQIDNO:33, SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ IDNO:41,SEQ ID NO:43,SEQ IDNO:45, SEQ ID N0:47和SEQ ID N0:49的成熟多肽编码序列所编码。
[0124]作为具有生物活性的多肽之一的β_葡糖苷酶的实例包括,但不限于,来自米曲霉(W02002/095014,SEQ ID NO:52)、烟曲霉(W02005/047499 ;SEQ ID NO:54)、巴西青霉(Penicillium brasilianum)IBT20888(W02007/019442和W02010/088387 ;SEQ ID NO:56)、黑曲霉(Dan 等人,J.Biol.Chem.275:4973-4980 ;SEQ ID NO:58)、和棘孢曲霉(Kawaguchi等人,1996,Genel73:287-288 ;SEQ ID NO:60)的 β -葡糖苷酶。以上所述的 SEQ ID Ν0:52、SEQ ID NO:54、SEQID NO:56、SEQ ID NO:58、和 SEQ ID NO:60 的 β -葡糖苷酶分别由 SEQID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID N0:57 JPSEQ ID Ν0:59 的成熟多肽编码序列所编码。
[0125]葡糖苷酶还可以是融合蛋白。在一个方面,葡糖苷酶是米曲霉葡糖苷酶变体BG融合蛋白(W02008/057637,SEQ ID NO:62)或米曲霉β -葡糖苷酶融合蛋白(W02008/057637 ;SEQ ID NO:64)。SEQID NO:62 和 SEQ ID NO:64 的 β -葡糖苷酶融合蛋白分别由SEQ IDNO:61和SEQ ID NO:63编码。
[0126]使用根据Henrissat B., 1991, A classification of glycosyl hydrolasesbasedon amino-acid sequence similarities, Biochem.J.280:309-316> 及 HenrissatB.和 Bairoch A., 1996, Updating the sequence-basedclassification of glycosylhydrolases, Biochem.J.316:695-696所述的分类,其他内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶的实例在众多的糖基水解酶家族中公开。
[0127]可以用于本发明的其他纤维素分解酶在W098/13465、W098/015619、W098/015633、W099/06574、W099/10481、W099/025847、W099/031255、W02002/101078, W02003/027306,W02003/052054, W02003/052055, W02003/052056, W02003/052057, W02003/052118,W02004/016760, W02004/043980, W02004/048592, W02005/001065, W02005/028636,W02005/093050, W02005/093073, W02006/074005, W02006/117432, W02007/071818,W02007/071820、W02008/008070, TO2008/008793、美国专利第 5,457,046 号、美国专利第5,648,263号和美国专利第5,686,593号中有过记载。
[0128]作为具有生物活性的多肽之一的具有纤维素分解增强活性的GH61多肽的实例包括,但不限于,来自太瑞斯梭孢壳(W02005/074647、W02008/148131、和 W02011/035027)、嗜热子囊菌(Thermoascus aurantiacus) (W02005/074656 和 W02010/065830)、里氏木霉(W02007/089290)、嗜热毁丝霉(W02009/085935、W02009/085859、W02009/085864、W02009/085868)、烟曲霉(W02010/138754)的 GH61 多肽,来自嗜松青霉(Penicilliumpinopuilum)(W02011/005867)、嗜热子囊菌属(W02011/039319)、青霉属(W02011/041397)、和甲壳嗜热子囊菌(Thermoascus crustaceous)(W02011/041504)的 GH61 多妝。在一方面,具有纤维素分解增强活性的GH61多肽包括,但不限于,SEQ ID N0:66、SEQ ID N0:68、SEQIDNO:70,SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQID NO:94, SEQID N0:96、SEQ ID N0:98、SEQ ID NO: 100、SEQ ID NO: 102、SEQID NO: 104、SEQ ID NO: 106、SEQ ID NO: 108、SEQ ID NO: 110、SEQID NO: 112、SEQ ID NO: 114、SEQ IDNO:116、SEQ ID NO:118、SEQID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132; SEQ ID NO: 134, SEQID NO: 136, SEQ IDNO:138,SEQ ID NO:140,SEQ ID NO:142,SEQID NO:144,SEQ ID NO:146,SEQ ID NO:148,SEQID N0:150、或SEQ ID NO: 152,或其成熟多肽。以上所述的GH61多肽分别由SEQ IDNO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID N0:77、SEQ ID NO:79,SEQ ID N0:81、SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID N0:89、SEQID N0:91、SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ IDN0:99、SEQ ID NO:101、SEQ ID NO: 103、SEQ ID NO: 105、SEQ IDN0:107、SEQ ID NO: 109、SEQ ID NO: 111、SEQ IDNO: 113、SEQ IDN0:115、SEQ ID NO: 117、SEQ ID NO: 119、SEQ ID NO: 121、SEQ IDNO:123,SEQ ID NO: 125、或 SEQ ID NO: 127,SEQ ID NO: 129,SEQID N0:131、SEQ ID NO: 133,SEQ IDNO:135、SEQ ID NO:137、SEQID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQID NO: 147、SEQ ID NO: 149、或SEQ ID NO: 151的成熟多肽编码序列所编码。
[0129]作为具有生物活性的多肽之一的木聚糖酶的实例包括,但不限于,来自棘孢曲霉(GeneSeqP:AAR63790 ;冊94/21785)、烟曲霉(TO2006/078256 ;SEQ ID NO:154, SEQ IDNO:156、和 SEQ ID NO: 158)、嗜松青霉(W02011/041405)、青霉属(W02010/126772)、太瑞斯梭孢壳 NRRL8126 (W02009/079210)、以及囊状长毛盘菌(Trichophaea saccata) GHlO(W02011/057083)的木聚糖酶。以上所述的木聚糖酶分别由SEQ ID NO: 153,SEQ ID NO: 155、和SEQ IDNO: 1 57的成熟多肽编码序列所编码。
[0130]作为具有生物活性的多肽之一的β_木糖苷酶的实例包括,但不限于,来自粗糙脉孢菌(SwissProt 登录号 Q7S0W4)、里氏木霉(UniProtKB/TrEMBL 登录号 Q92458 ;SEQ IDNO:160)、烟曲霉(SEQID NO: 162)、和埃默森篮状菌(Talaromyces emersonii) (SwissProt登录号Q8X212)的β -木糖苷酶。以上所述的β -木糖苷酶分别由SEQ IDNO: 159和SEQID NO: 161的成熟多肽编码序列所编码。
[0131]作为具有生物活性的多肽之一的乙酰木聚糖酯酶的实例包括,但不限于,来自棘抱曲霉(W02010/108918)、球毛壳菌(Chaetomiumglobosum) (UniProt 登录号 Q2GWX4)、细 I? 毛壳菌(Chaetomiumgracile) (GeneSeqP 登录号 ΑΑΒ82124)、特异腐质霉 DSM1800(W02009/073709)、红褐肉座菌(Hypocrea jecorina) (W02005/001036)、嗜热毁丝菌(W02010/014880)、粗糖脉抱菌(UniProt 登录号 q7s259)、颖枯壳针抱(Phaeosphaerianodorum) (UniProt 登录号 QOUHJl)、和太瑞斯梭孢壳 NRRL8126 (W02009/042846)的乙酰木聚糖酯酶。
[0132]作为具有生物活性的多肽之一的阿魏酸酯酶的实例包括,但不限于,来自特异腐质霉 DSM1800 (W02009/076122)、费希新萨托菌(Neosartorya fischeri) (UniProt登录号A1D9T4)、粗糙脉孢菌(UniProt登录号Q9HGR3)、橘灰青霉(Penicilliumaurantiogriseum)(W02009/127729)、和太瑞斯梭孢壳(W02010/053838 和 W02010/065448)的阿魏酸酯酶。
[0133]作为具有生物活性的多肽之一的阿拉伯呋喃糖苷酶的实例包括,但不限于,来自黑曲霉(GeneSeqP登录号AAR94170)、特异腐质霉DSM1800 (W02006/114094和W02009/073383)、和大型亚灰树花菌(M.giganteus) (W02006/114094)的阿拉伯呋喃糖苷酶。
[0134]作为具有生 物活性的多肽之一的α-葡糖醛酸酶的实例包括,但不限于,来自棒曲霉(Aspergillus clavatus) (UniProt 登录号 alccl2)、烟曲霉(SwissProt 登录号Q4WW45)、黑曲霉(UniProt 登录号 Q96WX9)、土曲霉(Aspergillus terreus) (SwissProt登录号Q0CJP9)、特异腐质霉(W02010/014706)、橘灰青霉(W02009/068565)、埃默森篮状菌(UniProt登录号Q8X211)、和里氏木霉(UniProt登录号Q99024)的α -葡糖醛酸酶。
[0135]登录号通过引用的方式整体并入本文。
[0136]表汰载体
[0137]本发明还涉及包含本发明的串联构建体的表达载体。串联构建体可以插入到载体中或者串联构建体的多个组分可以结合在一起以产生重组表达载体。载体可以包含一个或多个(例如,几个)方便的限制性酶切位点以使得在这些位点插入多核苷酸。在表达载体的创建中,将编码序列置于载体中,从而将编码序列与适当的用于表达的控制序列可操作地连接。
[0138]重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
[0139]载体优选地含有一个或多个(例如,几个)可选择性标记物,其使得方便选择所转化的细胞。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA (磷酸核糖基氨基咪唑-琥珀羧胺合酶)、adeB (磷酸核糖基氨基咪唑合酶)、amdS (乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar (膦丝菌素乙酰转移酶)、hph (潮霉素磷酸转移酶)、niaD (硝酸还原酶)、pyrG (乳清酸核苷-5’-磷酸脱羧酶)、SC (硫酸腺苷酰转移酶)、和trpC (邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。优选用在木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,抗生素为例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
[0140]用于连接上述元件以构建重组表达载体的方法为本领域技术人员公知(参见,例如,Sambrook 等人,1989,Molecular Cloning, A LaboratoryManual,第 2 片反,Cold SpringHarbor,纽约)。
[0141]丝状真菌宿主细胞
[0142]本发明还涉及丝状真菌宿主细胞,其包含:串联构建体,该串联构建体包含(i) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸,其中该串联构建体通过异位整合而整合。[0143]串联构建体或包含串联构建体的表达载体导入丝状真菌宿主细胞中,使构建体保持为染色体整合体。术语“宿主细胞”涵盖由于复制过程中发生的突变而不同于亲本细胞的亲本细胞的任何后代。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。
[0144]宿主细胞可以是在多肽的重组生产中有用的任何丝状真菌细胞。“丝状真菌”包括真菌门和卵菌门的的亚门(如由Hawksworth等人,1995,同上,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长,碳分解代谢必须是需氧的。相反,酵母例如酿酒酵母的营养生长是通过单细胞菌体的出芽,且碳分解可以是发酵性的。
[0145]丝状真菌宿主细胞可以是枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、黑管菌 M (Bjerkandera)Λ 拟錯霉属(Ceriporiopsis)、金孢属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉酵母属(Filibasidium)、镰孢菌属(Fusarium)、腐质霉属(Humicola)、巨座壳属(Magnaporthe)、毛霉属(Mucor)、毁丝菌属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉抱菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、白腐菌属(Phlebia)、梨囊鞭菌属(Piromyces)、侧耳属(Pleurotus)、裂糟菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
[0146]例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉、米曲霉、烟管菌(Bjerkandera adusta)、干拟錯菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、浅黄拟錯菌(Ceriporiopsis gilvescens)、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsis subrufa、虫拟錯菌(Ceriporiopsissubvermispora)、Chrysosporium inops、嗜毛金色抱(Chrysosporium keratinophilum)、Chrysosporium lucknowense、类状金抱(Chrysosporium merdarium)、Chrysosporiumpannicola、Chrysosporium queenslandicum、热带金抱菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、粗毛云芝(Coriolushirsutus)、杆抱状键抱(Fusarium bactridioides)、谷类键抱(Fusarium cerealis)、克鲁克威尔键抱菌(Fusarium crookwellense)、黄色键抱菌(Fusarium culmorum)、禾谷键抱菌(Fusarium graminearum)、禾赤键抱(Fusarium graminum)、异抱键抱(Fusariumheterosporum)、合欢木键抱(Fusarium negundi)、尖抱键抱、多枝键抱(Fusariumreticulatum)、粉红键抱(Fusariumroseum)、接骨木键抱(Fusarium sambucinum)、肤色键抱(Fusariumsarcochroum)、拟枝抱键抱菌(Fusarium sporotrichioides)、硫色键抱(Fusarium sulphureum)、圆键抱(Fusarium torulosum)、拟丝抱键抱(Fusariumtrichothecioides)、镶片镰孢、特异腐质霉、柔毛腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉、粗糙脉胞菌、产紫青霉(Penicillium purpurogenum)、黄抱原毛平革菌(Phanerochaete chrysosporium)、脉射菌(Phlebia radiata)、刺芳:侧耳(Pleurotus eryngii)、太瑞斯梭孢壳、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康氏木霉(Trichodermakoningi i )、长梗木霉(Tr ichodermalongibrachiatum)、里氏木霉或绿色木霉(Trichodermaviride)细胞。
[0147]在一个方面,丝状真菌宿主细胞是米曲霉。在另一个方面,丝状真菌宿主细胞是黑曲霉。在另一个方面,丝状真菌宿主细胞是镶片镰孢。在另一个方面,丝状真菌宿主细胞是里氏木霉。在另一个方面,丝状真菌宿主细胞是长梗木霉。
[0148]在另一个方面,丝状真菌宿主细胞是里氏木霉RutC30。在另一个方面,丝状真菌宿主细胞是里氏木霉TV10。在另一个方面,丝状真菌宿主细胞是里氏木霉RutC30的突变体。在另一个方面,丝状真菌宿主细胞是里氏木霉TVlO的突变体。在另一个方面,丝状真菌宿主细胞是里氏木霉的形态突变体。参见,例如,W097/26330,其通过引用的方式整体并入本文。
[0149]在另一个方面,丝状真菌宿主细胞是包含一个或多个(例如,几个)选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因、第一天冬氨酸蛋白酶基因、胰蛋白酶样丝氨酸蛋白酶基因、第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因、和第二天冬氨酸蛋白酶基因的基因的木霉属菌株,其中一个或多个(例如,几个)`基因修饰成使突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(例如,几种)选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶、第一天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、第二枯草杆菌蛋白酶样丝氨酸蛋白酶、和第二天冬氨酸蛋白酶的酶的产生方面有缺陷,如W02011/075677中所述,其通过引用的方式整体并入本文。
[0150]可以将丝状真菌细胞通过涉及原生质体形成、原生质体转化、和细胞壁再生的方法以本身已知的方式进行转化。用于转化曲霉属和木霉属宿主细胞的适当方法在EP238023、Yelton 等人,1984,Proc.Natl.Acad.Sc1.USA81:1470-1474 和 Christensen 等人,1988,Bio/Technology6:1419-1422中有过记载。用于转化镰孢属菌种的适当方法由Malardier 等人,1989,Gene78:147-156 和 W01996/00787 记载。
[0151]产生方法
[0152]本发明还涉及产生多种具有生物活性的重组多肽的方法,其包括:
[0153](a)在有益于生产多肽的条件下,培养用串联构建体转化的丝状真菌宿主细胞,该串联构建体包含(i) 一个或多个(例如,几个)可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸,其中该串联构建体通过异位整合而整合;及任选地
[0154](b)回收具有生物活性的第一和第二多肽。
[0155]使用本领域已知的方法,在适于产生多肽的营养培养基中培养丝状真菌宿主细胞。例如,细胞可以通过在合适的介质中并在使得多肽进行表达和/或分离的条件下进行摇瓶培养或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)来培养。使用本领域已知的步骤,培养可以在包含碳源和氮源以及无机盐的合适营养介质中进行。合适的介质可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)来制备。如果多肽被分泌到营养介质中,则可以直接从介质中回收多肽。如果多肽未被分泌,则可以从细胞裂解物中回收。 [0156]多肽可以使用领域内已知的特定用于多肽的方法来检测。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成、或酶底物的消失。例如,酶检定可以用来判定多肽的活性。
[0157]多肽可以使用本领域已知的方法来回收。例如,多肽可以通过常规步骤从营养介质中回收,这些常规步骤包括但不限于收集、离心、过滤、萃取、喷雾干燥、蒸发或沉淀。在一个方面,回收整个发酵液。
[0158]多肽可以通过本领域已知的多种方法进行纯化,以获得基本纯的多肽,方法包括但不限于层析法(例如,离子交换层析、亲和层析、疏水性层析、聚焦层析、和尺寸排阻层析)、电泳法(例如,制备式等电聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,Protein Purification, Janson 和 Ryden 编,VCH Publishers,纽约,1989)。
[0159]通过以下实施例来进一步描述本发明,这些实施例不应被理解为限制本发明的范围。
[0160]实施例
[0161]菌株
[0162]里氏木霉菌株981-0-8 (D4)是里氏木霉菌株 RutC30 (ATCC56765 ;Montenecourt和 Eveleigh, 1979,Adv.Chem.Ser.181:289-301)的诱变菌株。
_3] 培养基和缓冲液
[0164]2XYT加氨苄青霉素的平板的组成为16g的胰蛋白胨、IOg的酵母提取物、5g的氯化钠、15g的Bacto琼脂、和加至I升的去离子水。在高压灭菌的培养基冷却至55°C后,加入Iml的100mg/ml氨苄青霉素溶液。
[0165]COVE 盐溶液的组成为 26g 的 KCl、26g 的 MgSO4.7H20、76g 的 KH2P04、50ml 的 COVE痕量金属溶液、和加至I升的去离子水。
[0166]COVE 痕量金属溶液的组成为 0.04g 的 NaB4O7.10H20、0.4g 的 CuSO4.5Η20、1.2g 的FeSO4.7Η20、0.7g 的 MnSO4.H20,0.8g 的 Na2MoO2.2H20、10g 的 ZnSO4.7H20、和加至 I 升的
去离子水。
[0167]COVE平板的组成为342.3g蔗糖、20ml的COVE盐溶液、IOml的IM乙酰胺、IOml的1.5M CsCl、25g的Noble琼脂(Difco)、和加至I升的去离子水。
[0168]C0VE2平板的组成为30g的蔗糖、20ml的COVE盐溶液、IOml的IM乙酰胺、25g的Noble琼脂(Difco)、和加至I升的去离子水。
[0169]木霉属痕量金属溶液的组成为216g的FeCl3.6H20、58g的ZnSO4.7H20、27g的MnSO4.H2OUOg的CuSO4.5H20、2.4g的H3B03、336g的柠檬酸、和加至I升的去离子水。
[0170]CIM培养基的组成为20g的纤维素、IOg的玉米衆冻干粉(cornsteep solid)、
1.45g 的(NH4)2SO4,2.08g 的 ΚΗ2Ρ04、0.28g 的 CaCl2,0.42g 的 MgSO4.7Η20、0.42ml 的木霉属痕量金属溶液、I~2滴的消泡剂、和加至I升的去离子水;pH调整至6.0。
[0171]YP培养基的组成为IOg的酵母提取物、20g的Bacto蛋白胨、和加至I升的去离子水。
[0172]PEG 缓冲液的组成为 500g 的聚乙二醇 4000(PEG4000)、10mMCaCl2、IOmM Tris-HClpH7.5、和加至I升的去离子水;过滤除菌。
[0173]STC 的组成为 IM 山梨糖醇、IOmM CaCl2、和 IOmM Tris-HCl, pH7.5 ;过滤除菌。 [0174]实施例1:烟曲霍GH61B多狀某闵的克降
[0175]烟曲霉部分基因组序列(TheInstitute for Genomic Research, Rockville, MD,美国)的 tblastn 搜索(Altschul 等人,1997, Nucleic AcidsRes.25:3389-3402)使用几种已知的GH61多肽(包括嗜热子囊菌GH61A多肽(GeneSeqP登录号AEC05922))作为查询序列来进行。基于在氨基酸水平与查询序列的高度类似性,数个基因被识别为推定的家族GH61同源物。选择一个约850bp的与嗜热子囊菌GH61A多肽序列在氨基酸水平具有高于70%序列同一性的基因组区域进行进一步研究。
[0176]烟曲霉NN051616如美国专利第7,244,605号中所述生长并收获。将冻结的菌丝体用研钵和研杵研磨成细粉末,并使用DNEASY?植物大量提取试剂盒(DNEASY?Plant Maxi KitXQIAGEN Inc., Valencia, CA,美国)根据生产商的说明来分离基因组DNA。
[0177]设计以下示出的两个合成的寡核苷酸引物,以从基因组DNA中PCR扩增出烟曲霉GH6IB多肽编码序列。使用IN-FUSION?克隆试剂盒(ClontechLaboratories, Inc., Mountain View, CA,美国)将片段直接克隆入表达载体pAlLo2(W02004/099228),而无需进行限制性酶切消化和连接。
[0178]正向引物:
[0179]5’-ACTGGATTTACCATGACTTTGTCCAAGATCACTTCCA-3’ (SEQ ID NO:163)
[0180]反向引物:
[0181]5’-TCACCTCTAGTTAATTAAGCGTTGAACAGTGCAGGACCAG-3’ (SEQ ID NO:164)
[0182]粗体字母代表编码序列。剩余序列与pAlLo2的插入位点同源。
[0183]将五十皮摩尔的各个上述引物用于PCR反应中,反应由204ng的烟曲霉基因组DNA, I XPfx 扩增缓冲液(Invitrogen Corp., Carlsbad, CA,美国),1.5μ I 的 dATP、dTTP、dGTP 和 dCTP 的 IOmM 混合物,2.5 个单位的 PLATTNUM? Pfx DNA 聚合酶(InvitrogenCorp.,Carlsbad, CA,美国),和I μ I的50mM MgSO4构成,终体积为50 μ I。扩增使用EPPENDORF? MASTERCYCLER R o333epgradient S(EppendorfScientific, Inc.,ffestbury, NY,美国)进行,程序为:94°C 3分钟,I个循环;和每循环94°C 30秒、56°C 30秒、和72°C I分钟,30个循环。然后将加热块维持在72°C 15分钟,接着进行4°C浸泡循环。反应产物通过使用40mM Tris碱、20mM乙酸钠、ImM EDTA 二钠盐(TAE)缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将约850bp的产物条带从凝胶中切出,并使用MINELUTE?凝胶提取试剂盒(QIAGEN Inc., Valencia, CA,美国)根据生产商的说明进行纯化。
[0184]然后使用IN-FUSION?克隆试剂盒将片段克隆入pA1Lo2。将质粒PAlLo2用Nco I和Pac I消化。将质粒片段通过上述的凝胶电泳和QIAQUICK?凝胶纯化试剂盒(QIAGEN Inc., Valencia, CA,美国)进行纯化。将基因片段和消化的载体在后述的反应中合并在一起,得到表达质粒pAG43(图1 ),其中烟曲霉GH61B多肽编码序列的转录处于NA2_tpi启动子的调控之下。NA2-tpi启动子是来自黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译的前导序列被来自构巢曲霉磷酸丙糖异构酶基因的非翻译前导序列替代。重组反应(20 μ I)由 IxIN-FUSION?反应缓冲液(Clontech Laboratories, Inc., MountainView, CA,美国)、I XBSA (Clontech Laboratories, Inc.,Mountain View, CA,美国)、1μ1的 IN-FUSION?酶(稀释 1:10) (Clontech Laboratories, Inc., Mountain View, CA,美国)、166ng的用Nco I和Pac I消化的pAlLo2、和IlOng的烟曲霉GH61B多肽的纯化PCR产物构成。将反应在37°C下孵育15分钟,接着在50°C孵育15分钟。将反应物用40 μ I的IOmMTris-0.1M EDTA缓冲液稀释,并根据生产商的说明将2.5 μ I的稀释反应物用来转化大肠杆菌(Ε.coli) XLlO SOLOPACK? Gold 感受态细胞(Stratagene, La Jolla, CA,美国)。含有PAG43 (GH61B多肽编码序列)的大肠杆菌转化体通过限制性酶切消化进行鉴定,并使用BIORO BOT? 9600 (QIAGEN Inc., Valencia, CA,美国)制备质粒 DNA。
[0185]862bp PCR 片段的 DNA 测序用 Applied Biosystems Model377XL 自动 DNA 测序仪(Applied Biosystems, Carlsbad, CA,美国)使用染料-终止子化学法(Giesecke等人,1992, Journal of Virology Methods38:47-60)和引物步移策略进行。使用下述的载体特异性引物进行测序:
[0186]pAllo25Seq:
[0187]5’-TGTCCCTTGTCGATGCG3’ (SEQ ID NO:165)
[0188]pAllo23Seq:
[0189]5’-CACATGACTTGGCTTCC3’ (SEQ ID NO:166)
[0190]仔细检查核苷酸序列数据的质量,并将所有序列经PHRED/PHRAP软件(University of Washington, Seattle, WA,美国)的协助而进行彼此比较。
[0191]基于所编码的蛋白与嗜热子囊菌GH61A蛋白(GeneSeqP登录号AEC05922)的相似性来构建用于烟曲霉序列的基因模型。烟曲霉GH61B多肽编码序列的核苷酸序列和推导的氨基酸序列示于SEQ IDN0:93 (DNA序列)和SEQ ID NO: 94 (推导的氨基酸序列)。基因组片段编码250个氨基酸的多肽,被2个53和56bp的内含子打断。编码序列和成熟编码序列的G+C含量百分比分别为53.9%和57%。使用SignalP软件程序(Nielsen等人,1997,ProteinEngineeringlO:1-6)预测21个残基的信号肽。预测的成熟蛋白含有221个氨基酸,其具有23.39kDa的预测分子量。
[0192]实施例2:用于表汰烟曲霍GH61B多狀的DSMai214的构律
[0193]使用如下所示的基因特异性的正向和反向引物从质粒pAG43 (实施例1)中扩增烟曲霉GH61B多肽编码序列。斜体的区域表示用于IN-FUSION?反应的与插入位点的载体同源性。[0194]正向引物:
[0195]5’-GGACTGCGCACCATGACTTTGTCCAAGATCACTTCCA-3’ (SEQ ID NO:167)
[0196]反向引物:
[0197]5’-GCCACGGAGCTTAATTAATTAAGCGTTGAACAGTGCAG-3’ (SEQ ID NO:168)
[0198]将五十皮摩尔的各上述引物用于PCR反应中,该反应由IOng的pAG43DNA,
1XPfx扩增缓冲液,1.5 μ I的dATP、dTTP、dGTP和dCTP的IOmM混合物,2.5个单位的PLATINUM? Pfx DNA聚合酶,和I μ I的50mM MgSO4构成,最终体积为50 μ I。扩增使州EPPENDORF'? MASTERCYCLER? 5333印gradient S 进行,其程序为:98°C 3 分钟,I个循环;和每循环98°C30秒、56°C30秒、和72°C I分钟,30个循环。然后将加热块维持在72V 15分钟。PCR产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳进行分离,其中将约0.9kb的片段从凝胶切出,并使用_ΜIΝΕΙΛΠ_--凝胶提取试剂盒根据生产商的操作指南进行提取。
[0199]将质粒pMJ09 (W02005/047499)用 Nco I 和 Pac I 消化,通过在 ImM EDTA 二钠盐-50mM Tris碱_50mM硼酸(TBE)缓冲液中的1.0%琼脂糖凝胶电泳来分离,从凝胶中切出,并根据生产商的说明使用QIAQUICK_t胶提取试剂盒(QIAGEN Inc.,Valencia, CA,美国)提取。
[0200]根据生产商的说明使用IN-FUSION? PCR克隆试剂盒将0.9kb的PCR产物插入到凝胶纯化的经Nco I/Pac I消化的PMJ09中。N-FIJSION?反应由I xIN-FUSION?.反应缓冲液、IOOng的凝胶纯化的经Nco I/Pac I消化的pMJ09、37ng的0.9kb PCR产物、
2μ I的500 μ g/mlBSA、和I μ I的IN-FUSION?酶构成,反应体积为20 μ I。将反应在37°C孵育15分钟并在50°C孵育15分钟。在孵育期后,将30μ I的TE缓冲液加入反应中。根据制造商的操作指南,将2.5 μ I等分试样用于转化SOLOPACK? Gold超级感受态细胞(Agilent Technologies, Inc.,CedarCreek, TX,美国)。通过测序来筛选转化体,鉴定出含有无PCR错误的插入的一个克隆并将其定名为pSMai214 (图2)。可以用Pme I消化质粒pSMai214,以产生用于里氏木霉转化的约5.4kb的片段。该5.4kb的片段包含由里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、和构巢曲霉乙酰胺酶(amdS)基因组成的表达盒。
[0201]实施例3:用于表达烟曲霉CEL3AP -葡糖苷酶和烟曲霉GH61B多肽的串联构建体PDM287的构律
[0202]使用如下所示的基因特异性的正向和反向引物从质粒pSMai214中扩增烟曲霉GH61B多肽表达盒。斜体的区域表示用于IN-FUSION?反应的与插入位点的载体同源性。
[0203]正向引物:
[0204]5’-CGCGGTAGTGGCGCGGTCGACCGAATGTAGGATTGTT-3’ (SEQ ID NO:169)
[0205]反向引物:
[0206]5’-TTACCAATTGGCGCGCCACTACCGCGTTCGAGAAGA-3’ (SEQID NO:170)
[0207]将五十皮摩尔的各上述引物用于PCR反应中,该反应由25ng的pSMai214DNA,I X PHUSI ON?高保真热启动DNA聚合酶缓冲液(Finnzymes 0y, Espoo,芬兰),I μ I的dATP、dTTP、dGTP和dCTP的IOmM混合物,以及I个单位的PHUS10N?高保真热启动DNA聚合酶(Finnzymes Oy, Espoo,芬兰)构成,最终体积为50 μ I。扩增使用EPPENDORF? MASTERCYCLER'? 5333印gradient S 进行,其程序为:98°C30 秒,I个循环;每循环98°C 10秒、60°C 30秒、和72°C I分30秒,35个循环;和72°C 10分钟,I个循环。PCR产物通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行分离,其中将约2.3kb的片段从凝胶中切出,并使用NUCLEOSPIN?提取II试剂盒(Macherey-NageI,Inc., Bethlehem, PA,美国)根据生产商的操作指南进行提取。
[0208]将约2.3kb 的PCR产物使用 IN-FUSION?.Advantage PCR克隆试剂盒(ClontechLaboratories, Inc., Mountain View, CA,美国)根据生产商的操作指南插入至经Asc I消化的PEJG107 (W02005/047499)。质粒pEJG107包含烟曲霉CEL3Aβ -葡糖苷酶编码序列(SEQ ID NO:53[DNA 序列]和 SEQ ID NO:54[推导的氨基酸序列])。该IN-FUSION ?反应由lxIN-FUSION?'反应缓冲液、125ng的经Asc I消化的pEJG107、90ng的2.33kb的PCR产物、和]μ I IN-FUSION?酶组成,反应体积为10 μ I。将反应在37°C孵育15分钟,接着在50 C鮮育15分钟。在鮮育期后,将40 μ I的TE加入反应中。根据制造商的?呆作指南,将2 μ I等分试样用于转化ONE SHOT?'T0P10感受态细胞(Invitrogen, Carlsbad, CA,美国)。将大肠杆菌转化反应物铺在2XYT加氨苄青霉素平板上。通过测序来筛选转化体,鉴定出含有无PCR错误的插入的一个克隆并将其定名为pDM287 (图3)。可以用Pme I消化质粒PDM287,产生用于里氏木霉转化的约9.9kb的片段。该9.9kb的片段包含由(I)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉CEL3A0 -葡糖苷酶编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子;以及(2)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH6IB多肽编码序列、和里氏木霉Ce 17A纤维二糖水解酶I基因终止子组成的两个表达盒。该9.9kb的片段也包含构巢曲霉乙酰胺酶(amdS)基因。
[0209]实施例4:単氐木霍原牛质体的产牛和转化
[0210]原生质体的制备和转化是使用Penttila等人,1987, Gene61:155-164的修改操作指南来进行。简要地,在27°C下于25ml的补充有2% (w/v)葡萄糖和IOmM尿苷的YP培养基中以90rpm的轻柔振荡来培养里氏木霉菌株981-0-8 (D4) 17小时。菌丝体使用真空驱动的一次性过滤系统(MiIlipore, Bedford, MA,美国)通过过滤来收集,并用去离子水洗涤两次和用1.2M山梨糖醇洗涤两次。通过在34°C下于20ml的1.2M山梨糖醇中以90rpm的轻柔振荡来悬浮所洗涤的菌丝体15~25分钟来产生原生质体,该20ml的1.2M山梨糖醇含有每 mll5mg 的GLUCANEX? 200G(Novozymes A/S, Bagsvaerd,丹麦)和每 ml0.36 个单位的几丁质酶(Sigma Chemical C0., St.Louis, MO,美国)。原生质体通过在400X g下离心7分钟而收集,用冷的1.2M山梨糖醇洗涤两次。将原生质体使用血球计数器来计数,并在STC中再悬浮至I X IO8原生质体/ml的最终浓度。将过量的原生质体储存在_80°C的Cryol°C冷冻容器(Nalgene, Rochester, NY,美国)中。
[0211]用Pme I消化约100 μ g的转化质粒(pSMai214、pDM287或pEJG107)。消化反应物通过TAE缓冲液中的0.8%琼脂糖凝胶电泳进行纯化。将含有pSMai214、pDM287或pEJG107的表达盒和构巢曲霉乙酰胺酶(amdS)基因的DNA条带从凝胶中切出,并根据制造商建议的操作指南使用NUCLEOSPIN?提取II试剂盒进行提取。
[0212]将所得纯化的DNA[1 μ g的9.9kb的经Pme I消化的pDM287 (串联转化)或I μ g的?.6kb的经Pme I消化的pEJG107加I μ g的5.4kb的经Pme I消化的pSMai214 (共转化)]加至100 μ I的原生质体溶液并轻柔地混合。加入PEG缓冲液(250 μ I),将反应物混合并在34°C下孵育30分钟。然后加入STC (3ml),并将反应物混合,然后涂布在用于amdS选择的COVE平板上。将平板在28°C下孵育6~11天。
[0213]实施例5:对表达烟曲霉CEL3A g -葡糖苷酶和烟曲霉GH61B多肽的早.氏木霉转化体的评价
[0214]使用接种环将里氏木霉转化体(实施例4)从COVE转化平板转移至补充了 IOmM尿苷的C0VE2平板,并在28°C下孵育5~7天。用接种环收集孢子,并将其转移至于125ml塑料摇瓶中的25ml的CIM培养基中。将摇瓶培养物在28°C、200rpm下孵育5天。将各个培养物的Iml等分试样在微量离心机中以13,400Xg离心,并回收培养物上清液。根据制造商的说明通过使用 CRITERION? 8 ~16%Tris_HCl 凝胶(Bio-Rad Laboratories, Hercules, CA,美国)的SDS-PAGE对5 μ I的各个培养物上清液进行分析。将所得凝胶用B10-SAFE?考马斯(Bio-RadLaboratories, Hercules, CA,美国)染色。图 4A ~4D 不出 45 个 pDM287 转化体的培养物的SDS-PAGE图谱(串联构建体;图4A和4B)和45个pEJG107+pSMai214转化体的培养物的SDS-PAGE图谱(共转化;4C和图4D)。该结果表明,转化体产生对应于烟曲霉CEL3A0 -葡糖苷酶的约130kDa和对应于烟曲霉GH61B多肽的约24kDa的主要蛋白条带。由未转化的里氏木霉菌株981-0-8 (D4)培养物上清液构成的阴性对照样品,未示出约130kDa和约24kDa的显著条带。
[0215]图4A~4D中的结果和以下的总结证明了,串联构建体pDM287的转化比pEJG107和pSMai214的共转化得到更 多的生产烟曲霉β -葡糖苷酶和烟曲霉GH61B多肽的阳性转化体。
[0216]
【权利要求】
1.一种获得丝状真菌宿主细胞的阳性转化体的方法,其包括: (a)向丝状真菌宿主细胞群转化串联构建体,所述串联构建体包含(i)一个或多个可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸; (b)基于所述一个或多个可选择性标记物来选择转化体,其中,与通过用于所述第一多核苷酸和所述第二多核苷酸中的每一种的单独构建体的共转化而获得的阳性转化体的数目相比,通过所述串联构建体的转化而获得的用于具有生物活性的所述第一多肽和所述第二多肽的阳性转化体的数目更高;以及 (c)分离包含所述串联构建体的丝状真菌宿主细胞的转化体,所述串联构建体表达具有生物活性的所述第一多肽和所述第二多肽。
2.如权利要求1所述的方法,其中,与通过用于所述第一多核苷酸和所述第二多核苷酸中的每一个的单独构建体的共转化而获得的阳性转化体的数目相比,通过所述串联构建体的转化而获得的用于具有生物活性的所述第一多肽和所述第二多肽的阳性转化体的数目增加至少1.1倍,例如,至少1.25倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、或至少10倍。
3.如权利要求1或2所述的方法,其中,所述串联构建体通过异位整合而整合到丝状真菌宿主细胞的染色体中。
4.如权利要求1~3中任一项所述的方法,其中,所述串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组来切除所述一个或多个可选择性标记物。
5.如权利要求4所述的方法,其中,所述第一同源重复和所述第二同源重复是相同的或彼此具有至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少97%、至少98%、或至少99%的序列同一性。
6.如权利要求4或5所述的方法,其中,在切除所述一个或多个可选择性标记物时,所述一个或多个可选择性标记物可以再用于将另一串联构建体导入至丝状真菌宿主细胞。
7.一种丝状真菌宿主细胞,其包含:串联构建体,所述串联构建体包含(i) 一个或多个可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸。
8.如权利要求7所述的丝状真菌宿主细胞,其中,所述串联构建体通过异位整合而整合到丝状真菌宿主细胞的染色体中。
9.如权利要求7或8所述的丝状真菌宿主细胞,其中,所述串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组来切除所述一个或多个可选择性标记物。
10.如权利要求9所述的丝状真菌宿主细胞,其中,所述第一同源重复和所述第二同源重复是相同的或彼此具有至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少97%、至少98%、或至少99%的序列同一性。
11.如权利要求9或10所述的丝状真菌宿主细胞,其中,在切除所述一个或多个可选择性标记物时,所述一个或多个选择性标记可以再用于将另一串联构建体导入至丝状真菌宿主细胞。
12.—种生产具有生物活性的多种重组多肽的方法,其包括:在有益于生产多肽的条件下,培养用串联构建体转化的丝状真菌宿主细胞,所述串联构建体包含(i )一个或多个可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸。
13.如权利要求12所述的方法,还包括回收具有生物活性的所述第一多肽和所述第二多肽。
14.如权利要求12或13所述的方法,其中,所述串联构建体通过异位整合而整合到丝状真菌宿主细胞的染色体中。
15.如权利要求12~14中任一项所述的方法,其中,所述串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组来切除所述一个或多个可选择性标记物。
16.如权利要求15所述的方法,其中,所述第一同源重复和所述第二同源重复是相同的或彼此具有至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少97%、至少98%、或至少99%的序列同一性。
17.如权利要求15或16所述的方法,其中,在切除所述一个或多个可选择性标记物时,所述一个或多个选择性标记可以再用于将另一串联构建体导入至丝状真菌宿主细胞。
18.—种串联构建体,其包含(i)一个或多个可选择性标记物、(ii)与第一启动子和第一终止子可操作地连接的编码具有生物活性的第一多肽的第一多核苷酸、以及(iii)与第二启动子和第二终止子可操作地连接的编码具有生物活性的第二多肽的第二多核苷酸。
19.如权利要求18所述的串联构建体,其中,所述串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组来切除所一个或多个可选择性标记物。
20.如权利要求19所述的串联构建体,其中,所述第一同源重复和所述第二同源重复是相同的或彼此具有至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少97%、至少98%、或至少99%的序列同一性。
【文档编号】C12N15/80GK103748226SQ201280041276
【公开日】2014年4月23日 申请日期:2012年8月23日 优先权日:2011年8月24日
【发明者】D·莫耶 申请人:诺维信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1