用于在真菌细胞中表达基因的真菌启动子的制作方法

文档序号:3583833阅读:1590来源:国知局
专利名称:用于在真菌细胞中表达基因的真菌启动子的制作方法
技术领域
本发明涉及DNA序列,具体而言,涉及经过分离的真菌启动子,并涉及包含这些启动子的DNA构建体、载体和真菌宿主细胞,其中,所述启动子与编码多肽的编码序列可操作地相连。本发明还涉及表达基因和/或生产多肽的方法。
背景技术
在真菌宿主细胞中生产重组多肽通常是通过下述方法完成的构建表达盒,其中编码多肽的DNA处于适用于该宿主细胞的启动子的表达控制下。可通过质粒或载体介导的转化将表达盒引入宿主细胞。然后可通过在表达盒所含有的启动子正确发挥功能所必要的诱导条件下培养经过转化的宿主细胞来生产多肽。对每种真菌宿主细胞而言,通过转化引入到真菌宿主中的编码序列的表达和该编码序列编码的重组多肽的生产需要获得功能性的启动子。已知有大量启动子在真菌宿主细胞中是有功能的。下面是启动子在物种间交叉使用的例子已知Aspergillus nidulans (A. nidulans) gpdA 基因的启动子在 Aspergillus niger (A. niger)中有功能(J Biotechnol. 1991 Jan ; 17 (1) :19-33. Intracellular and extracellular production of proteins in Aspergillus under the control of expression signals of the highly expressed A. nidulans gpdA gene. Punt PJ, Zegers ND, Busscher M, Pouwels PH, van den Hondel CA)。另一个例子是用于 A. niger 禾口 A. nidulans 的 A. niger beta-木糖昔
xlnD 启动子(Transcriptional regulation of the xylanolytic enzyme system of Aspergillus, van Peij, NNME, PhD—thesis Landbouwuniversiteit ffageningen, the Netherlands, ISBN 90-5808-154-0),以及 Escherichia coli beta-葡糖酸酸酶基因在 A. niger、A. nidulans 禾口 Cladosporium fulvum 中的表达,见 Curr Genet. 1989 Mar ; 15(3) :177-80 =Roberts IN, Oliver RP, Punt PJ, van den Hondel CA. “ Expression of the Escherichia coli beta-glucuronidase gene in industrial and phytopathogenic filamentous fungi “所述。但是,人们仍需要经过改进的启动子,用于控制被引入的基因的表达,用于控制内源基因的表达水平,用于对内源基因的表达加以调控或者用于介导内源基因的失活,或用于生产多肽,或用于前述应用的组合。上述经过改进的启动子可以,例如比以前已知的那些更强。它们也可以是可由特定的方便的底物或化合物诱导的。当需要在单种真菌宿主中同时过量表达多种不同的基因,知道若干种功能性启动子是有益的。为防止压制(特定转录因子的滴定(titration)),优选使用多种不同的启动子,对每种待表达基因使用一种特定的启动子。


图1描述了 pGBTOPGLA的质粒图谱,其是整合型葡糖淀粉酶表达载体。图2描述了 pGBTOPGLA-2的质粒图谱,其是具有多克隆位点的整合型葡糖淀粉酶表达载体。图3描述了 pGBTOPGLA-3的质粒图谱,其是一种整合型葡糖淀粉酶表达载体,其中含有与葡糖淀粉酶编码序列可操作地相连的本发明启动子。图4描述了通过单同源重组进行整合的示意图。图5 :WT1、WT2和多种pGBTOPGLA载体转化子的葡糖淀粉酶活性。显示的是标准化的活性,其中,WTl在第4天的活性被设置为100%。图6描述了 pGBDEL-PGGLAA的质粒图谱,其是置换型载体。图7描述了启动子置换的示意图。图8描述了通过同源重组的整合示意图。发明详述本发明涉及选自由如下物质所构成的组(a)DNA 序列,其中包含 SEQ ID NO =USEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4、 SEQ ID NO 5的核苷酸序列,(b) DNA序列,其能与(a)的DNA序列杂交,(c) DNA序列,其与(a)的DNA序列至少50%同源,(d) (a)至(c)的任何DNA序列的变体,以及(e) (a)至(d)的DNA序列中任何一种的亚序列(subsequence)。在本发明的上下文中,启动子DNA序列是当该启动子DNA序列与编码序列可操作地相连时,能控制该编码序列表达的DNA序列。术语“可操作地相连”在本文中被定义为下述结构,其中启动子DNA被放置于相对编码序列来说合适的位置,使得启动子DNA序列能指导被编码序列编码的多肽的生产。术语“编码序列”在本文中被定义为在合适的控制序列的控制下,能转录为 mRNA,能翻译为多肽的核酸序列。编码序列的边界通常是ATG起始密码子(通常是mRNA 5’ 末端的开放读码框的开始)和转录终止子序列(恰好处于mRNA 3’末端开放读码框的下游)界定的。编码序列可以包括但不限于,基因组DNA,cDNA,半合成、合成和重组核酸序列。更具体地,术语“启动子”在本文中被定义为下述DNA序列,其能与RNA聚合酶结合,指导聚合酶到编码多肽的编码序列正确的下游转录开始位点,来初始化转录。RNA聚合酶能有效地催化与编码区域适当DNA链互补的信使RNA的装配。术语“启动子”还将被理解为包括用于转录为mRNA之后进行翻译的5’非编码区域(启动子和翻译起始之间)、顺式作用的转录控制元件(例如增强子)以及其它能与转录因子反应的核苷酸序列。在一种优选的实施方式中,本发明的启动子DNA是根据SEQ ID NO=USEQ ID NO: 2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的序列。根据另一种优选的实施方式,本发明的启动子DNA序列是能与SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5杂交且仍然保持启动子活性的DNA 序列。优选通过测量与启动子可操作地相连的编码序列编码的蛋白的浓度来确定启动子活性。或者,通过测量与启动子可操作地相连的编码序列编码的蛋白的酶活来测定启动子浓度。根据一种优选的实施方式,通过测量IacZ报道基因(importer gene) 编码序列的表达来测定启动子活性(及长度)(见Luo (Gene 163(1995) 127-131.)根据另一种优选的实施方式,通过使用绿荧光蛋白作为编码序列来测定启动子活性(见 Microbiology. 1999Mar ; 145 (Pt 3) :729-34. Santerre Henriksen AL, Even S, Muller C, Punt PJ, van den Hondel CA, Nielsen J. Study)。此外,可以通过测量启动子控制下产生的转录子的mRNA水平来确定启动子活性。mRNA水平可以,例如,通过Northern杂交印记来测量(J. Sambrook, E. F. Fritsch, and Τ. Maniatus,1989, Molecular Cloning, A Laboratory Manual,2d edition, Cold Spring Harbor, N. Y.)。本发明包括能在非常低严谨度条件下、优选低严谨度条件下、更优选中等严谨度条件下、更优选中高严谨度条件下、进一步更优选高严谨度条件下以及最优选非常高严谨度条件下与相应于如下分子的核酸探针杂交的(经过分离的)启动子DNA序列,所述分子是(i)SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的第 1 至 2000位核苷酸,优选地,第100至1990位核苷酸,更优选地,第200至1980位核苷酸,进一步更优选地,第300至1970位核苷酸,进一步更优选地,第350至1950位核苷酸,最优选地,第 360至1900位核苷酸,(ii)是⑴的亚序列;或(iii)是⑴、(ii)互补链(J. Sambrook, E. F. Fritsch, and Τ. Maniatis,1989, Molecular Cloning, A Laboratory Manual, 2d edition,Cold Spri π g Harbor,N. Y.) SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO :5的亚序列可以是至少100个核苷酸,优选至少200个核苷酸,更优选至少300个核苷酸,进一步更优选至少400个核苷酸,以及最优选地,至少500个核苷酸。SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 或其亚序列的核酸序列可被用于设计核酸探针,以按照本领域公知的方法来鉴定和克隆来自不同属或种的菌株的DNA启动子。具体而言,此类探针可被用于按照标准Southern杂交印记流程与目标属或种的基因组或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可比全长序列短很多,但是长度应当有至少15个,优选至少25个,更优选至少35个核苷酸。此外, 此类探针可被用于通过PCR来扩增DNA启动子。通过PCR克隆启动子的例子在本文中有所描述(见实施例1. 3)。更长的探针也可以使用。DNA、RNA或肽核酸(PNA)探针可以使用。 典型地,对探针进行标记,用于探测相应的基因(例如,用032P、@33P、@3H、@35S、生物素或亲和素或荧光标记来标记)。此类探针被包括在本发明中。因此,可对从上述其它生物制得的基因组DNA或cDNA文库加以筛选,选出能与上述探针杂交并能编码多肽的DNA。可通过琼脂糖或聚丙烯酰胺凝胶电泳,或其它分离技术来分离来自此类其它生物的基因组或其它DNA。可将来自文库的DNA或分离的DNA转移并固定到硝酸纤维素或其它合适的载体物质上。为鉴定出与SEQ ID NO=U SEQ ID NO :2、SEQ ID NO 3, SEQ ID NO :4或SEQ ID NO :5或其亚序列同源的克隆或DNA,可将载体物质用于 Southern 杂交 £口记。就本发明的目的而言,杂交指核酸序列与相应于SEQ ID NO :1、SEQ ID NO :2、 SEQ ID NO 3, SEQ ID NO :4或SEQ ID NO :5示出的核酸序列、它们的互补链或其亚序列的经过标记的核酸探针在非常低至非常高严谨度条件下杂交。用例如X射线膜来探测上述条件下与核酸探针杂交的分子。其它杂交技术也可使用,例如,使用荧光来探测以及玻璃侧面(glass side)和/或DNA微阵列作为支持物的技术。FEMS Yeast Res. 2003 Dec ;4 (3) :259-69 (Daran-Lapujade P, Daran JM, Kotter P, Petit Τ, Piper MD, Pronk JT. " Comparative genotyping of the Saccharomyces cerevisiae laboratory strains S288C and CEN. PK113-7D using oligonucleotide microarrays “中给出了 DNA 微阵列杂交探测的例子。此外,PNA微阵列用于杂交的用途被描述于Nucleic Acids Res. 2003 Oct 1;31(19) :ell9 (Brandt 0, Feldner J,Stephan A,Schroder M,Schnolzer M, Arlinghaus HF, Hoheisel JD, Jacob A. PNA microarrays for hybridisation of unlabelled DNA samples 中。在一种优选的实施方式中,核酸探针是SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、 SEQ ID NO :4或SEQ ID NO :5的核酸序列。在另一种优选的实施方式中,核酸探针是具有 SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO :5 第 20 至 1980 位核苷酸,更优选地,SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO: 5 的第 500 至 1950 位核苷酸,进一步更优选地,SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、 SEQ ID NO :4或SEQ ID NO :5的第800至1920位核苷酸,以及最优选地,SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的第 900 至 1900 位核苷酸的序列。 另一种优选的探针是DNA序列转录位点前的部分。对于长度为至少100个核苷酸的长探针而言,非常低至非常高严谨度的条件被定义为按照标准Southern杂交印记流程,于42摄氏度进行预杂交和杂交,在下述物质中进行5倍SSPE,0. 3% SDS,200yg/ml经修剪和变性的鲑鱼精DNA,以及,对于非常低和低严谨度而言,25%甲酰胺;对于中等和中高严谨度而言,35%甲酰胺;或对于高和非常高严谨度而言,50%甲酰胺。对于长度为至少100个核苷酸的长探针而言,载体物质被洗三次,每次15分钟,其中使用2倍SSC,0. 2% SDS,优选在至少45摄氏度(非常低严谨度),更优选在至少50摄氏度(低严谨度),更优选在至少阳摄氏度(中等严谨度),更优选在至少60摄氏度(中高严谨度),进一步更优选在至少65度(高严谨度)以及最优选在70摄氏度(非常高严谨度)进行。对于长度为大约15个核苷酸至大约70个核苷酸的短探针而言,严谨度条件被定义为预杂交、杂交和杂交后洗涤在比根据Bolton and McCarthy (1962,Proceedings of the National Academy of Sciences USA 48 :1390)的算式计算得到的 Tm 低 5 摄氏度至 10 摄氏度的温度下,在 0. 9M NaCl、0. 09M Tris HCl pH 7. 6、6mM EDTA、0. 5% NP-40、1 倍 Denhardt’s溶液、ImM焦磷酸钠、ImM磷酸二氢钠、0. ImM ATP和每ml 0. 2mg酵母RNA中,按照标准Southern杂交印记流程来进行。对于长度为大约15个核苷酸至大约70个核苷酸的短探针而言,对载体物质的洗涤如下安排使用6倍SSC加0. 1 % SDS洗一次,15分钟,用6倍SSC洗两次,每次15分钟, 洗涤在比计算出的Tm低5至10摄氏度的温度下进行。根据另一种优选的实施方式,SEQID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO :4或SEQ ID NO :5首先被用于克隆与之可操作地相连的天然基因、编码序列或其部分。 这可以用 SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO :5 或前文定义的其亚序列来开始,用该序列作为探针。将探针与给定宿主(Aspergillus niger或本申请中定义的任何其它真菌宿主)的cDNA或基因组文库杂交。一旦天然基因或其部分已被克隆,随后就可以通过本文所述的杂交实验,用其自身作为探针去克隆来自其它真菌的其同源基因。在本发明的上下文中,同源基因指与天然基因至少50%同源(相同)的基因。优选地,同源基因与天然基因至少55%同源,更优选地,至少60%,更优选地,至少65%,更优选地,至少70 %,进一步更优选地,至少75 %,优选地,大约80 %,更优选地,大约90 %,进一步更优选地,大约95%,以及最优选地,大约97%同源。同源基因编码序列上游的序列是本发明所包括的启动子。或者,可以用SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、SEQ ID NO :4 或 SEQ ID NO :5 或前文定义的其亚序列去搜索基因组数据库,例如,使用本文所述的BLAST算法或比对方法,对与本发明启动子可操作地相连的天然基因的序列、编码序列或其部分加以鉴定。该鉴定出的序列可被用于鉴定本申请所定义的任何其它真菌宿主中的直向同源物或同源基因。鉴定出的直向同源物或同源基因编码序列上游的序列是本发明所包括的启动子。根据另一种优选的实施方式,本发明的启动子DNA序列是(经过分离的)DNA序列,其与SEQ ID N0:1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO :4或SEQ ID NO :5至少50% 同源(相同)。优选地,该 DNA 序列与 SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO :4或SEQ ID NO :5至少55%同源,更优选地,至少60%,更优选地,至少65%,更优选地, 至少70 %,进一步更优选地,至少75 %,优选地,大约80 %,更优选地,大约90 %,进一步更优选地,大约95 %,以及最优选地,大约97 %同源。就本发明的目的而言,两条核酸序列之间同源性(相同性)的程度优选通过 BLAST程序来确定。用于进行BLAST分析的软件是公众可通过National Center for Biotechnology Information (http: //www, ncbi. nlm. niR. rov/)获f导白勺。BLAST 算法参数 W、T和X确定了比对的灵敏度和速度。BLAST程序使用缺省值,字长(W)为11,BL0SUM62分数矩阵(见 Henikoff&HenikofT,Proc. Natl. Acad. ki. USA 89 :10915(1989))比对(B)为 50,期望(E)为10,M = 5,N = -4,以及对两条链都加以比对。在另一种优选的实施方式中,启动子是SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、 SEQ ID NO :4或SEQ ID NO :5的亚序列,该亚序列仍然具有启动子活性。该亚序列优选含有至少大约100个核苷酸,更优选地,至少大约200个核苷酸,以及最优选地,至少大约300 个核苷酸。在另一种优选的实施方式中,亚序列是SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、 SEQ ID NO 4或SEQ ID NO 5所包含的核酸序列(除了来自5,和/或3,末端的一个或多个核苷酸已缺失之外),所述DNA序列仍具有启动子活性。在另一种优选的实施方式中,启动子序列是“经修整的(trimmed),,序列,S卩,来自翻译起始处和/或转录起始处上游的序列片段。对启动子进行修整以及功能分析的例子 JALGene. 1994 Aug 5 ; 145 (2) :179-87 :the effect of multiple copies of the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene. Verdoes JC,Punt PJ,Stouthamer AH,van den Hondel CA 所述。在本发明的另一种实施方式中,启动子DNA序列是SEQ ID N0:1、SEQ ID NO :2、 SEQ ID NO :3、SEQ ID NO 4 或 SEQ ID NO 5 的变体。
术语“变体”或“变体启动子”在本文中被定义为具有下述核苷酸序列的启动子, 所述核苷酸序列包含对亲本启动子一个或多个核苷酸的取代、缺失和/或插入,其中,变体启动子较之相应的亲本启动子具有更多或更少的活性。术语“变体启动子”将包括天然变体和体外产生的变体,它们是用本领域公知的方法,例如经典诱变、定点诱变和DNA改组 (shuffling)获得的。变体启动子可以具有一处或多处突变。每处突变是独立的对核苷酸的取代、缺失和/或插入。根据一种优选的实施方式,变体启动子是较之最初鉴定出的启动子序列(SEQ ID NO =USEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO :5)具有至少一处经修饰的调控位点的启动子。此类调控位点可以被整体去除或按照上文的解释进行特定的突变。对此类启动子变体的调控由此被修饰,从而,例如,其不再被葡萄糖所诱导。此类启动子变体和如何获得它们的技术的例子被描述于EP 6734 或WO 94/04673中。这些专利通过引用并入本文。启动子变体可以是等位基因启动子。等位基因变体指,占据相同染色体基因座的基因的两种或多种替代性形式中的任何形式。等位基因变化是通过突变天然产生的,其能导致种群多态性。可通过下述方法来获得变体启动子(a)在非常低、低、中等、中高、高或非常高严谨度条件下,将 DNA 与(i)SEQ ID NO =USEQ ID N0:2、SEQ ID N0:3、SEQ ID NO: 4或SEQ ID NO :5, (ii) (i)的亚序列或(iii) (i)、(ii)的互补链杂交,以及(b)从DNA分离变体启动子。严谨度和洗涤条件如本文所述。本发明的启动子可以是随序列提供有接头的启动子,所述接头用于如下目的引入特定限制位点,协助启动子序列与编码多肽的核酸序列编码区域之间的连接。本文提供的序列信息不应被狭义理解为需要包括进被错误鉴定的碱基。本文公开的特定序列可容易地用于从有丝真菌,特别是Aspergillus niger分离原始DNA序列,再对其进行进一步的序列分析,由此鉴定出序列错误。除非另有指明,本文中通过对DNA分子进行测序测定的所有核苷酸序列都是用自动DNA测序仪测定的。因此,如本领域关于通过该自动方法测定的任何DNA序列所已知的, 本文测定的任何核苷酸序列可能含有一些错误。通过自动方法测定的核苷酸序列典型地与被测序DNA分子的实际核苷酸序列至少大约90%相同,更典型地,至少大约95%相同至至少大约99. 9%相同。可以通过其它方法,包括本领域公知的手动DNA测序方法对实际序列进行更为精确地测定。本领域技术人员能鉴定出此类被错误鉴定的碱基,并且知道如何更正此类错误。本发明包括启动子的功能等同物,其典型地含有不会改变目标启动子生物学功能的突变。术语“功能等同物”还包括A. niger DNA序列的直向同源物。A. nigerDNA序列的直向同源物是从其它菌株或物种中分离出来的,具有相似或相同生物活性的DNA序列。本发明的启动子可从任何属的微生物中获得。就本发明的目的而言,本文中所用的与一给定来源相关的术语“从……获得”将表示多肽是该来源生产的,或是被来自该来源的基因所插入的细胞生产的。启动子序列可从真菌来源获得,优选从酵母菌株获得,例如Candida、Hansenula, Kluyveromyces> Pichia、Saccharomyces> Schizosaccharomyces 或 Yarrowia 的菌株,更优选地,从 Saccharomyces carlsbergensis、Saccharomyces cerevisiae、Saccharomycesdiastaticus、Saccharomyces douglasii、Saccharomyces kluyveri> Saccharomyces norbensis 或 Saccharomyces oviformis 白勺菌株获得。在另一种优选的实施方式中,启动子序列从有丝真菌菌株获得,例如Acremonium、 Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、 Magnaportheλ Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、 Penicillium、 Piromyces、 Schizophyllum、 Talaromyces、 Thermoascus、 Thielavia、 Tolypocladium 或 Trichoderma 的菌株,更优选地,从 Aspergillus aculeatus、 Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、 A. niger、Aspergillus oryzae (A. oryzae)、Humicola insolens、Humicola lanuginosa、 Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicillium purpurogenum、 Trichoderma harzianum、 Trichoderma koningii、 Trichoderma longibrachiatum、Trichoderma reesei 或 Trichoderma viride 的菌株获得。在另一种优选的实施方式中,启动子序列从Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusarium graminearum、 Fusarium graminum、Fusarium heterosporum、Fusarium negundi、Fusarium oxysporum、 Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、 Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum 获得。应理解,对上述物种而言,本发明包括完美的和不完美的状态以及其它分类学等同物,例如,无性型(anamorph),而不管它们是作为什么名字被知道的。本领域技术人员容易对合适的等同物加以鉴定。这些物种的菌株是公众容易从大量的培养单位获得的,例如, American Type Culture Collection(ATCC) Λ Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures (CBS)禾口 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)0此外,可使用上文提到的探针,从其它来源(包括从自然界(例如,土壤、肥料、水等)分离的微生物)鉴定并获得根据本发明的启动子序列。用于从自然环境分离微生物的技术是本领域公知的。然后可以通过对其它微生物基因组DNA文库进行类似筛选来获得核酸序列。一旦用探针探测出了编码启动子的核酸序列,就可以利用本领域普通技术人员已知的技术来分离或克隆该序列(例如,见上述Sambrook et al.,1989)。在本发明中,启动子DNA序列还可以是杂交启动子,其中包含本发明的一种或多种启动子的一部分;本发明的启动子的一部分以及另外的已知启动子的一部分,例如,一种启动子的引导子(leader)序列和来自其它启动子的转录起始位点;或者本发明的一种或多种启动子的一部分以及一种或多种其它启动子的一部分。其它启动子可以是任何在选用的真菌宿主细胞中显示出转录活性的启动子序列,包括变体、截短的和杂交启动子,其可以从编码对于宿主细胞来说同源或异源的、细胞外或细胞内多肽的基因获得。其它启动子序列可以是对编码多肽的核酸序列来说天然的或外源的,并且对细胞来说可以是天然的或外源的。作为一种优选的实施方式,鉴定出的启动子的重要调控序列可以与其它“基础”启动子融合,以增强它们的启动子活性(例如,见MoI Microbiol. 1994 May ; 12 (3) :479-90. Regulation of the xylanase—encoding xlnA gene of Aspergillus tubigensis. de Graaff LH, van den Broeck HC, van Ooijen AJ, Visser J.所述)。可用于与本发明的启动子一起构建杂交启动子的其它启动子的例子包括从 A. oryzae TAKA U t)" Bi、 Rhizomucor mieheiS B|> A. niger ψ alpha U 粉酶、Α. niger酸稳定性alpha淀粉酶、A. niger或Aspergillus awamori葡糖淀粉酶 (glaA)、A. niger gpdA、A. niger 葡萄糖氧化酶 goxC、Rhizomucor miehei 月旨酶、A. oryzae 碱性蛋白酶、A. oryzae磷酸丙糖异构酶、A. nidulans乙酉先胺酶禾口 Fusarium oxysporum 类胰岛素蛋白酶(WO 96/00787)的基因获得的启动子,以及NA2_tpi启动子(来自用于 (A. niger中性alpha淀粉酶和A. oryzae磷酸丙糖异构酶的基因的启动子的杂交体)、 Saccharomyces cerevisiae 烯酉享酶(ENO-I)、Saccharomyces cerevisiae 半乳糖激酶 (GALl)、Saccharomyces cerevisiae 醇脱氢酶 / 甘油醛 _3_ 磷酸酯脱氢酶(ADH2/GAP)和 Saccharomyces cerevisiae 3_磷酸甘油酯激酶的基因获得的启动子以及它们的突变的、 截短的和杂交的启动子。其它可用于酵母宿主细胞的启动子见Romanoset al. , 1992,Yeast 8 :423-488 所述。在本发明中,启动子DNA序列还可以是“串联启动子”。“串联启动子”在本文中被定义为两个或多个启动子序列,它们中的每一个都与编码序列可操作地相连,并对编码序列向mRNA的转录加以调节。串联启动子包含本发明的两种或多种启动子或本发明的一种或多种启动子与一种或多种其它已知的启动子,例如,上文例示的用于构建杂交启动子的那些。串联启动子的两种或多种启动子序列可以同时促进核酸序列的转录。或者,串联启动子的一种或多种启动子序列可以促进核酸序列在细胞不同生长阶段或者菌丝体不同形态部位的转录。在本发明中,启动子对于编码目标多肽的编码序列和/或真菌宿主细胞来说可以是外源的。本发明的变体、杂交或串联启动子应当被理解为对于编码多肽的编码来说是外源的,即使野生型启动子是编码序列或真菌宿主细胞天然的。本发明的变体、杂交或串联启动子具有具有SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5的启动子的启动子活性的至少大约20%,优选至少大约40 %,更与选至少大约60 %,更优选至少大约80 %,更优选至少大约90 %,更优选至少大约100%,进一步更优选至少大约200%,最优选至少大约300%,以及进一步最优选至少大约 400%。本发明还涉及一种DNA构建体,其中包含至少一种上文定义的启动子DNA序列,以及与所述启动子DNA序列可操作地相连的编码序列,从而该编码序列可于给定的真菌宿主细胞中在启动子DNA序列的控制下被表达。编码序列编码多肽,其对于目标真菌宿主细胞来说可以是天然的或异源的。术语“多肽”在本文中并不代表被编码产物的特定长度,因此其包括肽、寡肽和蛋白。术语“异源多肽”在本文中被定义为并非真菌细胞天然的多肽,经过修饰改变了天然序列的天然多肽,或通过重组DNA技术对真菌细胞进行操作导致表达从数量上被改变的天然多肽。例如,天然多肽可以通过下述方法被重组生产,所述方法例如,将编码多肽的序列置于本发明启动子的控制之下,以增强多肽的表达,用信号序列加速目标天然多肽被运出细胞的过程,以及增加编码通常由该细胞产生的多肽的基因的拷贝数。真菌细胞可以含有一个或多个拷贝的、编码多肽的编码序列。优选地,编码序列编码肽激素或其变体、酶、细胞内蛋白、分泌过程涉及的蛋白、折叠过程涉及的蛋白、分子伴侣(chaperone)、肽氨基酸转运蛋白、糖基化因子、转录因子、受体或其一部分、抗体或其一部分或报道基因。在一种优选的实施方式中,多肽是细胞外分泌的。在一种更优选的实施方式中,多肽是酶。酶的例子是纤维素酶,例如,内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶;半纤维素酶或果胶水解 (pectinolytic)酶,例如,木聚糖酶、木糖苷酶、甘露聚糖酶、半乳糖酶、半乳糖苷酶、果胶甲酯酶、果胶裂解酶、果胶酸裂解酶、内切聚半乳糖醛酸酶、外切聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、阿拉伯木聚糖水解酶、半乳糖醛酸酶,裂解酶或淀粉水解酶;磷酸酶,例如,植酸酶,酯酶,例如脂酶,蛋白水解酶,例如蛋白酶,肽酶,氧化还原酶,例如氧化酶,转移酶或异构酶。或者,编码序列可以编码细胞内蛋白,例如,分子伴侣或转录因子。这方面的例子被描述于 Appl Microbiol Biotechnol. 1998 Oct ;50 (4) :447-54( “ Analysis of the role of the gene bipA, encoding the major endoplasmic reticulum chaperone protein in the secretion of homologous and heterologous proteins in black Aspergilli.Punt PJ, van Gemeren IA, Drint-Kuijvenhoven J, Hessing JG, van Muijlwijk-Harteveld GM, Beijersbergen A, Verrips CT, van den Hondel CA)中。这可用于例如,提高宿主细胞作为蛋白生产者的效率,如果该编码序列,例如分子伴侣或转录因子已知是蛋白生产限制因素的话。编码序列还可编码初级或次级代谢产物合成中涉及的酶,所述代谢产物例如,有机酸、类胡萝卜素,(beta-内酰胺)抗生素、维生素。编码目标多肽的编码序列可从任何原核生物、真核生物或其它来源获得。或者,编码序列可针对反义RNA和/或RNAi (RNA干扰)构建体的表达进行编码。编码反义-RNA 的例子见 Appl Environ Microbiol. 2000 Feb ;66 (2) :775-82. (Characterization of a foldase, protein disulfide isomerase A, in the protein secretory pathway of Aspergillus niger. Ngiam C, Jeenes DJ, Punt PJl Van Den Hondel CA, Archer DB)或(Zrenner R, Willmitzer L, Sonnewald U. Analysis of the expression of potato uridinediphosphate-glucose pyrophosphorylase and its inhibition by antisense RNA. Planta. (1993) ; 190 (2) :247-52)。对基因表达完全失活可用于,例如,用于对控制不想要的代谢途径支链的基因失活,例如,增加对特定次级代谢产物(例如(beta-内酰胺)抗生素或类胡萝卜素)的生产。完全失活还可用于减少毒性或不想要的化合物的产生(Penicillium中的黄青霉素、Aspergillus中的黄曲霉素=MacDonald KD et al, :heterokaryon studies and the genetic control of penicillin and chrysogenin production in Penicillium chrysogenum. J Gen Microbiol. (1963)33: 375-83)。完全失活还可用于改变生物的形态,从而改进发酵过程和下游加工。本发明的另一种实施方式涉及对真菌细胞进行广泛的代谢重构(!^programming) 或工程改造。将全新的途径引入和/或对不想要的途径的修饰将提供被特异性地改造过的细胞,所述改造针对特定化合物(例如蛋白质或代谢产物)的生产。在本发明的方法中,当编码序列编码多肽时,所述多肽还可以包括融合或杂交多肽,其中,另一种多肽融合到前述多肽或其片段的N-末端或C-末端上。融合的多肽可以通过将编码一种多肽的核酸序列(或其一部分)融合到编码另一种多肽的核酸序列(或其一部分)来生产。用于生产融合多肽的技术是本领域内已知的,其包括将编码多肽的编码序列相连,使得它们处于同一读码框内(in frame),并且融合多肽的表达处于同样的启动子和终止子的控制之下。杂交多肽可以包含从至少两种不同的多肽(其中,一种或多种可以是真菌细胞异源的)获得的部分或全部多肽序列的组合。除启动子DNA序列之外,DNA构建体还可以包含一种或多种控制序列,它们能在与控制序列兼容的条件下,指导编码序列在合适的宿主细胞中的表达。表达应被理解为包括 生产多肽所涉及的任何步骤,其包括但不限于,转录、转录后修饰、翻译、翻译后修饰以及分泌。一种或多种控制序列可以是编码序列或宿主天然的。或者,一种或多种控制序列可被对核酸序列来说外源的一种或多种控制序列置换,用于提高编码序列在宿主细胞中的表达。“DNA构建体”在本文中被定义为下述核酸分子,其是单链或双链的,是从天然存在的基因分离出来的,或已经过修饰,以便含有以非天然存在的方式结合及并置的核酸片断。 当DNA构建体含有编码序列以及表达该编码序列所需的所有控制序列时,术语“DNA构建体”与术语“表达盒”同义。术语“控制序列”在本文中被定义为包括对于表达编码序列来说必要或有益的所有组件,其中包括本发明的启动子。每种控制序列可以是编码多肽的核酸序列天然的或外源的。此类控制序列包括但不限于,引导子(leader)、优化的翻译初始化序列(如Kozak, 1991,J. Biol. Chem. 266 :19867-19870所述)、聚腺苷化序列、前肽序列、信号肽序列、上游活化序列、本发明的启动子(包括从其获得的变体、片段和杂交体,以及串联启动子)和转录终止子。至少,控制序列包括转录和翻译终止信号以及本发明的启动子(的一部分)。控制序列是可随接头提供,所述接头用于如下目的引入特定限制位点,协助控制序列与编码多肽的核酸序列编码区域之间的连接。控制序列可以是合适的终止子序列,即,可被宿主细胞识别以终止转录的序列。终止子序列与编码多肽的编码序列的3’末端可操作地相连。任何在宿主细胞中具有功能的终止子都可用于本发明。用于有丝真菌宿主细胞的优选终止子可从A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans氨基苯甲酸盐/酯合酶、A. niger alpha-葡糖苷酶、trpC基因以及 Fusarium oxysporum类胰岛素蛋白酶的基因获得。用于酵母宿主细胞的优选终止子可从&iccharomyces cerevisiae烯醇酶、 Saccharomyces cerevisiae细胞色素C(CYCl)禾口Saccharomyces cerevisiae甘油酸_3_憐酸酯脱氢酶的基因获得。其它可用于酵母宿主细胞的终止子如前述Romanos et al,1992 所述。控制序列可以是合适的引导子序列,S卩,对宿主细胞的翻译来说重要的mRNA 5’非翻译区域。引导子序列可与编码多肽的核酸序列的5’末端可操作地相连。在选用的宿主细胞中有功能的任何引导子序列可用于本发明。优选用于有丝真菌宿主细胞的引导子获得自A. oryzae TAKA淀粉酶、A. nidulans磷酸丙糖异构酶和A. niger glaA的基因。用于酵母宿主细胞的合适的引导子是从&iccharomyces cerevisiae烯醇酶 (EN0-1) > Saccharomyces cerevisiae 3_ 憐酸甘油酉旨激酶、Saccharomyces cerevisiae alpha-因子和Saccharomyces cerevisiae醇脱氢酶/甘油醛_3_磷酸酯脱氢酶(ADH2/ GAP)基因获得的。控制序列还可以是聚腺苷化序列,这是与核酸序列3’末端可操作地相连的序列, 当转录时,其可被宿主细胞作为信号识别,用于向转录的mRNA添加聚腺苷残基。在选用的宿主细胞中有功能的任何聚腺苷化序列可用于本发明。优选用于有丝真菌宿主细胞的聚腺苷化序列是从A. oryzae TAKA淀粉酶、A. niger 葡糖淀粉酶、A. nidulans氨基苯甲酸盐/酯合酶、Fusarium oxysporum类胰岛素蛋白酶和 A. niger alpha-葡糖苷酶的基因获得的。可用于酵母宿主细胞的聚腺苷化序列见Guo and Sherman, 1995, Molecular Cellular Biology 15 :5983-5990 所述。控制序列还可以是信号肽编码区域,其编码与多肽氨基末端相连的氨基酸序列, 并能指导编码的多肽向细胞中分泌的途径。核酸序列的编码序列的5’末端可以遗传性地含有下述信号肽编码区域,其天然就与编码被分泌多肽的编码区域片断以同一翻译读码框的方式相连。或者,编码序列的5’可以含有对编码序列来说是外源的信号肽编码区域。当编码区域天然不含信号肽编码区域的情况下,可能会需要外源信号肽编码区域。或者,外源信号肽编码区域可以简单地置换天然信号肽编码区域,以提高多肽的分泌。但是,能指导被表达的多肽进入选用的宿主细胞的分泌途径的任何信号肽编码区域都可用于本发明。对于有丝真菌宿主细胞而言,有效的信号肽编码区域是从A. oryzae TAKA淀粉酶、A. niger中性淀粉酶、A. ficuum植酸酶、A. niger葡糖淀粉酶、A. niger内切木聚糖酶、Rhizomucor miehei 天冬氨酸蛋白酶、Humicola insolens 纤维素酶禾口 Humicola lanuginosa脂酶基因获得的信号肽编码区域。可用于酵母宿主细胞的信号肽是从&iccharomyces cerevisiae alpha因子和 Saccharomyces cerevisiae转化酶的基因获得的。其它有用的信号肽区域见前述Romanos et al.,1992 所述。控制序列还可以是前肽编码区域,其编码位于多肽氨基末端的氨基酸序列。得到的多肽被称为酶原或前多肽(或者,某些情况下,酵素原(zymogen))。前多肽通常没有活性,可通过从前多肽上催化或自动催化切割下前肽,将其转化为成熟的活性多肽。前肽编码区域可从Bacillus subtilis碱性蛋白酶(aprE)、Bacillus subtilis中性蛋白酶 (nprT) > Saccharomyces cerevisiae alpha 因子、Rhizomucor miehei 天冬氨酸蛋白酶、 Mvceliophthora thermophila漆酶(WO 95/33836)和 A. niger 内切木聚糖酶(endol)的基因获得。当信号肽和前肽区域都存在于多肽氨基末端时,前肽区域位于多肽氨基末端邻侧,信号肽区域位于前肽区域氨基末端邻侧。添加允许对宿主细胞生长相关多肽的表达进行调控的调控序列也可能是人们需要的。调控系统的例子是,导致基因表达应答于化学或物理刺激(包括调控化合物的存在) 被打开或关闭的那些。原核细胞系统中的调控系统包括Iac和trp操纵子系统。酵母中,ADH2系统或GALl系统可以使用。有丝真菌中,TAKA alpha-淀粉酶启动子、A. niger葡糖淀粉酶启动子、A. oryzae葡糖淀粉酶启动子、A. tubingensis内切木聚糖酶(xlnA)启动子、A. niger硝酸盐还原酶(niaD)启动子、Trichoderma reesei纤维二糖水解酶启动子和 A. nidulans醇和醛脱氢酶(分别为alcA和aldA)启动子(如US 5,503,991所述)可用作为调控序列。调控序列的其它例子是允许基因扩增的那些。在真核系统中,它们包括二氢叶酸还原酶基因(在甲氨蝶呤存在的情况下被扩增)以及金属硫蛋白基因(在重金属存在的情况下被扩增)。在这些情况下,编码多肽的核酸序列将与可调控的序列可操作地相连。重要的可能是去除creA结合位点(如以前在EP 673429中所述,碳代谢物遏制), 改变pacC和areA (针对pH和氮调控)。本发明还涉及重组表达载体,其中包含本发明启动子、编码多肽的编码序列和转录和翻译终止信号。上文所述的多种编码和控制序列都可以一起加入,产生包括一种或多种方便的限制性位点的重组表达载体,所述位点用于允许启动子和/或编码多肽的编码序列在此类位点插入或取代。或者,编码序列和启动子的融合可通过,例如,使用PCR进行序列重叠延伸(SOE-PCR)来进行,如 Gene. 1989 Apr 15 ;77(1) :51-9. Ho SN, Hunt HD, Horton RM, Pullen JK, Pease LR“ Site-directed mutagenesis by overlap extension using the polymerase chain reaction"所述,或通过用 Gateway 克隆系统(Invitrogen)开展克隆来进行。或者,可以通过将编码序列或包含启动子和/或编码序列的DNA构建体插入到用于表达的合适载体中,来表达编码序列。在制造表达载体的过程中,编码序列被放置于载体中,使得编码序列与本发明的启动子和一种或多种用于表达的合适控制序列可操作地相连。重组表达载体可以是任何载体(例如,质粒或病毒),其可方便地经历重组DNA流程,并可使得编码序列表达。典型地,对载体的选择将依赖于载体与载体将被引入的宿主细胞之间的兼容性。载体可以是线性的或闭合环状质粒。载体可以是自主复制载体,S卩,作为染色体外的整体存在,其复制不依赖于染色体复制,例如,质粒、染色体外元件、微型染色体或人工染色体。对自主复制而言,载体可以包含能使载体在所用的宿主细胞中自主复制的复制原点(origin)。可用于酵母宿主细胞中的复制原点的例子是2微米复制原点、ARSU ARS4、ARSl和CEN3的组合以及ARS4和CEN6 的组合。复制原点可以是一种具有突变的原点,使得其在宿主细胞中的功能对温度敏感 (见,例如 Ehrlich,1978,Proceedings of the National Academy of Sciences USA 75: 1433)。在有丝真菌中自主保持的克隆载体的例子是包含AMAl序列的克隆载体。AMAl是从A. nidulans分离的6. 01Λ的基因组DNA片段,其能自主保持于Aspergillus中(见,例如 Aleksenko and Clutterbuck(1997), Fungal Genet. Biol. 21 :373-397)。或者,载体可以是如下载体当引入宿主细胞时,其能整合进基因组,并随着其被整合进的染色体一起复制。此外,可以使用单种载体或质粒,或者一起含有将被引入到宿主细胞基因组的完整DNA的两种或多种载体或质粒,或转座子。本发明的载体优选含有一种或多种选择性标记,其允许对转化的细胞加以容易的选择。宿主可以被至少两种载体共转化,其中一种包含选择标记。选择性标记是一种基因,其产物提供针对生物杀灭剂或病毒的抗性、对重金属的抗性、针对营养缺陷的原营养型等。用于酵母宿主细胞的合适标记是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于有丝真菌宿主细胞的选择性标记包括但不限于,amdS(乙酰胺酶)、argB (鸟氨酸氨基甲酰转移酶)、bar (草胺膦乙酰转移酶)、hygB (潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、 PyrG (乳清苷-5,-磷酸脱羧酶)、sC (硫酸盐腺苷转移酶)、trpC (氨基苯甲酸盐/酯合酶) 以及其等同物。赋予针对例如,腐草霉素、潮霉素B或G418抗性的标记也可使用。优选用于 Aspergillus 细胞的是 A. nidulans 或 A. oryzae 的 amdS 禾口 pyrG 基因,以及 Streptomyces hygroscopicus的bar基因。amdS标记优选按照EP 635574或WO 97/06 所描述的技术来使用。优选的选择标记基因是与A. nidulans gpdA启动子融合的A. nidulans amdS编码序列(EP 635574)。来自其它有丝真菌的amdS基因也可使用(W0 97/06261)。为整合进宿主细胞基因组,载体可以依赖于启动子序列和/或编码多肽的编码序列或载体的其它任何元件,用于通过同源或非同源重组将载体稳定整合进基因组。或者,载体可以含有额外的核酸序列,用于指导通过同源重组向宿主细胞基因组的整合。额外的核酸序列能使载体整合进宿主细胞基因组染色体上的精确位置。为增加在精确位置上整合的可能性,整合元件应当优选含有足够数量的、与相应目标序列高度同源的核酸,例如100至 1500个碱基对,优选地,400至1500个碱基对,更优选地,800至1500个碱基对,以及最优选地,至少21Λ,以增大同源重组的可能性。整合元件可以是与宿主细胞基因组中的目标基因铜元的任何序列。整合元件可以是非编码或编码的核酸序列。为促进定位整合,优选在转化宿主细胞之前对克隆载体进行线性化。线性化优选被进行至下述程度使得克隆载体的至少一端或优选全部两端的侧翼都有与目标基因座同源的序列。优选地,克隆载体中与目标基因座同源的整合元件来自高度表达的基因座,这意味着它们来自能在真菌宿主细胞中高水平表达的基因。能高水平表达的基因,即高度表达的基因,在本文中被定义为其mRNA占细胞总mRNA的至少0.5% (w/w)的基因,例如,在诱导条件下的,或者被定义为其基因产物占细胞总蛋白的至少(w/w)的基因,或者,在分泌出的基因产物的情况下,可分泌至至少0. lg/Ι的水平(如EP 357127B1所述)。下面举例给出了大量优选的高度表达的真菌基因来自Aspergilli或Trichoderma的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、甘油醛-磷酸酯脱氢酶或纤维二糖水解酶的基因。就上述目的而言,最优选的高度表达的基因是葡糖淀粉酶基因(优选地,A. niger葡糖淀粉酶基因), A. oryzae TAKA 淀粉酶基因,A. nidulans gpdA 基因,SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO 3,SEQ ID NO :4 或 SEQ ID NO :5 的基因座,SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、 SEQ ID NO :4 或 SEQ ID NO :5 的 A. niger 基因座,或 Trichoderma reesei 纤维二糖水解酶基因。另一方面,载体可通过非同源重组整合进宿主细胞的基因组。可以有超过一个拷贝的、编码多肽的核酸序列被插入到宿主细胞中,以增加基因产物的产生。这可以通过下述方法来实现优选地,将DNA序列的拷贝整合进其基因组,更优选地,将DNA序列整合到高度表达的基因座,优选地,整合到葡糖淀粉酶基因座或SEQ ID NO =USEQ ID N0:2、SEQ ID NO :3、SEQ ID NO :4 或 SEQ ID NO :5 的基因座。或者,这可以通过下述方法来实现将可扩增的选择性标记基因包括到核酸序列,在该处,含有选择标记基因扩增拷贝以及核酸序列的额外拷贝的细胞可被选择出来,这是通过在有合适的选择试剂存在的情况下对细胞加以培养来实现的。为进一步增加将被过量表达的DNA序列的拷贝数,如WO 98/46772中所述的基因转化技术可以使用。
用于将上述元件连接起来以构建本发明的重组表达载体的流程是本领域技术人员公知的(见,例如前述Sambrook et al.,1989)。本发明还涉及重组宿主细胞,其中包含与编码多肽的编码序列可操作地相连的本发明的启动子序列,所述细胞可有利地用于生产多肽。包含与编码多肽的编码序列可操作地相连的本发明的启动子的载体被引入宿主细胞,使得该载体被保持为染色体成分或如前文所述的自主复制型染色体外载体。术语“宿主细胞”包括由于复制期间发生的突变,故而与亲本细胞不相同的、亲本细胞的任何后代。对宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。本发明还涉及重组宿主细胞,其中包含多于一种本发明的启动子DNA序列,每种启动子都与编码多肽的编码序列可操作地相连。此类宿主细胞可以有利地用于对至少一种多肽的重组生产。优选地,载体中存在至少一种启动子及其相连的编码序列。载体被引入到宿主细胞中,使得其被保持为染色体成分或如前文所述的自主复制型染色体外载体。根据另一种优选的实施方式,宿主细胞被用于生产特定的初级或次级代谢产物, 例如,(beta-内酰胺)抗生素、维生素或类胡萝卜素。宿主细胞可以是有用于本发明的方法中的任何真菌细胞。本文中使用的“真菌” 包括 phyla Ascomycota、Basidiomycota、Chytridiomycota 禾口 Zygomycota (如 Hawksworth et al. , Ainsworth and Bisby ‘ s Dictionary of The Fungi,8th edition,1995, CAB International,University Press,Cambridge,UK 所定义的)以及 Oomycota(如 Hawksworth et al.,1995,supra,page 171中提到的)以及所有的有丝分裂孢子真菌(前述 Hawksworth et al. ,1995)0在一种优选的实施方式中,真菌宿主细胞是酵母细胞。用于本文中的“酵母”包 1 /^^ ^ (Endomycetales) ^ ^/^^ (basidiosporogenous) ##禾口Μ Fungi Imperfecti的酵母(Blastomycetes)。因为对酵母的分类未来可能会有改变,就本发明的目的而言,酵母将如 Biology and Activities of Yeast (Skinner, F. A. ,Passmore, S. Μ., and Davenport, R. R. , eds, Soc. App. Bacteriol. Symposium Series No. 9,1980)中所定义。在一种更优选的实施方式中,酵母宿主细胞是Candida、Hansenula, Kluyveromyces> Pichia、Saccharomyces> Schizosaccharomyces 或 Yarrowia 细胞。在一种最为优选的实施方式中,酵母宿主细胞是Saccharomyces car 1sbergensis、Saccharomyces cerevisiae> Saccharomyces diastaticus、 Saccharomyces douglasii、Saccharomyces kluyveri> Saccharomyces norbensis 或 Saccharomyces oviformis细胞。在另一种最为优选的实施方式中,酵母宿主细胞是 Kluyveromyces Iactis细胞。在另一种最为优选的实施方式中,酵母宿主细胞是Yarrowia Iipolytica 细胞。在另一种优选的实施方式中,真菌宿主细胞是有丝真菌细胞。“有丝真菌细胞”包括Eumycota和Oomycota亚门的所有有丝形式(如前述Hawksworth et al.,1995所定义的)。有丝真菌具有如下特征由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖构成的菌丝体壁。营养生长是通过菌丝伸长进行的,碳代谢是专性需氧的。与之相对,酵母,例如Saccharomyces cerevisiae的营养生长是通过单细胞原植体出芽来进行的,碳代谢可以是发酵的。
在一种优选的实施方式中,有丝真菌宿主细胞是下述物种的细胞,但不限于此 Acremonium、Aspergillus、Fusarium、Humicola、MucorΛ Myceliophthora、Neurospora、 Penicillium、Thielavia、Tolypocladium 或 Trichoderma。在一种最优选的实施方式中,有丝真菌细胞是Aspergillus awamori. Aspergillus foetidus、Aspergillus japonicus、A· nidulans、A· niger 或 A oryzae 的细胞。在另一种最优选的实施方式中,有丝真菌细胞是Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusarium graminearum、 Fusarium graminum、Fusarium heterosporum、Fusarium negundi、Fusarium oxysporum、 Fusarium reticulatun、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、 Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum的细胞。在另一种最优选的实施方式中,有丝真菌细胞是 Humicola insolens、Humicolalanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicillium purpurogenum、Thielavia terrestris、 Trichoderma harzianum、 Trichoderma koningii、 Trichoderma longibrachiatum、 Trichoderma reesei 或 Trichoderma viride 的细胞。可以用本身已知的技术,通过下述方法来转化真菌细胞,所述方法涉及到原生质体形成、原生质体转化以及细胞壁再生。合适的用于转化Aspergillus宿主细胞的方法被描述于 EP 238023 and Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81 :1470-1474 巾。☆ iS 白勺、ffi Agrobacterium tumefaciens 转 it Aspergillus和其它有丝真菌宿主细胞的方法被描述于,例如Nat Biotechnol. 1998 Sep ; 16(9) :839-42. Erratum in :Nat Biotechnol 1998 Nov; 16 (11) 1074. Agrobacterium tumefaciens-mediated transformation of filamentous fungi, de Groot MJ, Bundock P, Hooykaas PJ, Beijersbergen AG. Unilever Research Laboratory Vlaardingen, The Netherlands中。合适的用于转化Fusarium的种的方法被描述于Malardier et al.,1989, Gene 78 147-156 和 WO 96/00787 中。可以用 Becker and Guarente,In Abel son, J. N. and Simon, M. I. , editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, pp 182—187, Academic Press, Inc., New York、Ito et al., 1983, Journal of Bacteriology 153 :163 禾口 Hinnen et al. ,1978, Proceedings of the National Academy of Sciences USA 75 :1920 所述的流程来转化酵母。本发明还涉及在宿主细胞中表达编码序列的方法。所述方法包括如下步骤(a)提供一种DNA构建体,所述构建体包含本发明的启动子DNA序列以及上述编码序列,(b)用所述的DNA构建体去转化合适的宿主细胞,以及(c)在所述启动子DNA序列的控制下表达编码序列。本发明还涉及一种方法,用于在合适的真菌宿主中生产编码序列所编码的多肽, 所述编码序列处于本发明启动子的控制下。所述方法包括如下步骤(a)提供一种DNA构建体,所述构建体包含本发明的启动子DNA序列以及编码上述次级代谢产物的生产中所涉及的酶的序列,(b)用所述的DNA构建体去转化合适的真菌宿主细胞,以及
(c)在有益于表达所述多肽的合适培养条件下培养所述合适的真菌宿主,(d)从培养物中回收所述多肽。本发明还涉及一种方法,用于在合适的宿主中生产次级代谢产物,所述方法包括(a)提供一种DNA构建体,所述构建体包含本发明的启动子DNA序列以及编码上文定义的酶的序列,(b)用所述的DNA构建体去转化合适的真菌宿主细胞,以及(c)在有益于生产所述次级代谢产物的合适培养条件下培养所述合适的真菌宿主,(d)从培养物中回收所述多肽。在本发明的生产方法中,细胞被培养于适合用于用本领域已知的方法来生产多肽或代谢产物的营养培养基中。例如,可通过在合适的培养基中于允许编码序列得以表达和/ 或多肽得以被分离的条件下进行摇瓶培养、实验室或工业发酵罐中的小规模或大规模发酵 (包括连续、分批、补料分批或固态发酵)来培养细胞。培养发生于包含碳和氮源以及无机盐的合适营养培养基中,使用本领域已知的流程来进行培养。合适的培养基可以从厂商处购得,或者按照公开的组分配方来制备(例如,在American Type Culture Collection的目录中)。如果多肽或代谢产物被分泌到营养培养基中,可以直接从培养基中回收多肽或代谢产物。如果多肽或代谢产物不分泌,可以从细胞裂解物中对其进行回收。可以用本领域已知的、特定用于多肽的方法来探测多肽。这些探测方法可以包括 使用特异性抗体、酶产物的形成或酶底物的消失。可以用本领域已知的方法来回收得到的多肽或代谢产物。例如,可以通过传统流程,其包括但不限于,离心、过滤、萃取、喷雾干燥、蒸发或沉淀,从营养培养基中回收多肽或代谢产物。可以用本领域已知的多种流程来纯化多肽,其包括但不限于,色谱(例如,离子交换、亲和、疏水、层析聚焦和尺寸排除)、电泳流程(例如,制备性等电聚焦)、差异溶解(例如,硫酸铵沉淀)、SDS-PAGE 或萃取(见,例如 Protein Purification, J. -C. Janson and Lars Ryden, editors, VCH Publishers, New York,1989)。本发明还涉及DNA构建体,其用于改变真菌宿主细胞内源的、编码多肽的编码序列的表达。所述构建体可以含有用于改变内源基因表达所需的最小数量的组分。在一种实施方式中,核酸构建体优选含有(a)定位序列,(b)本发明的启动子DNA 序列,(c)外显子以及(d)剪接供体位点。将核酸构建体引入细胞后,该构建体通过同源重组整合进细胞基因组的内源基因位点。定位序列引导着元件(a)-(d)整合进内源基因,使得元件(b)-(d)与内源基因可操作地相连。在另一种实施方式中,核酸构建体优选含有(a)定位序列,(b)本发明的启动子 DNA序列,(c)外显子,(d)剪接供体位点,(e)内含子以及(f)剪接受体位点,其中,定位序列引导着元件(a)-(f)的整合,使得元件(b)-(f)与内源基因可操作地相连。但是,所述构建体还可以含有额外元件,例如选择性标记。前文已描述过可以使用的选择性标记。在两种实施方式中,这些元件的引入导致了新的转录单元的产生,其中,内源基因的表达被改变。大体上,新的转录单元是定位构建体引入的序列和内源基因的融合产物。在一种实施方式中,其中内源基因被改变,基因即被活化。在该实施方式中,通过插入调控序列,同源重组被用于置换、打断或失活在正常情况下与亲本细胞内源基因相连的调控区域, 这导致较之在相应亲本细菌中的情况,基因以更高的水平被表达。定位序列可以位于内源基因内,紧邻该基因,在上游基因中,或在内源基因上游并与其有一段距离。可以使用一种或多种定位序列。例如,环状质粒或DNA片段优选使用单种定位序列,而线状质粒或DNA片段优选使用两种定位序列。构建体还含有内源基因的一个或多个外显子。外显子被定义为下述DNA序列其会被拷贝为RNA,并存在于成熟mRNA分子中,使得外显子序列与内源基因的编码序列处于同一读码框。外显子可选地可以含有编码一个或多个氨基酸和/或部分编码氨基酸的DNA。 或者,外显子含有相应于5’非编码区域的DNA。当外源外显子或外显子编码一个多个氨基酸和/或氨基酸的一部分时,核酸构建体被设计为转录和剪接后,读码框与内源基因的编码区域处于同一读码框,使得从第二个外显子获得的mRNA的部分的合适读码框不被改变。 构建体的剪接供体位点指导从一个外显子到另一个外显子的剪接。典型地,第一个外显子处于第二个外显子的5’侧,重叠且侧翼于第一个外显子3’侧的剪接供体位点能识别在第二个外显子5’侧侧翼于第二个外显子的剪接受体位点。剪接受体位点,和剪接供体位点一样,都是能指导从一个外显子到另一个外显子的剪接的序列。剪接装置与剪接供体位点联合作用,使用剪接受体位点来实现内含子的去除。用于改变给定DNA序列表达的优选策略包括缺失给定的DNA序列和/或用经修饰的启动子DNA序列,例如本发明的启动子,去置换给定DNA序列的内源启动子序列。优选通过EP 0357127所述的基因置换技术来进行缺失和置换。优选使用amdS基因作为选择标记基因按照EP 635574所述来进行对基因和/或启动子序列的特异性缺失。通过EP 635574 所述的在氟乙酰胺培养基上进行的反向选择,得到的菌株是不含选择标记的,其可用于进一步的基因修饰。作为替代,或与上面提到的技术组合,还可以使用基于在E. coli中进行粘粒体内重组的技术,如 A rapid method for efficient gene replacement in the filamentous fungus A. nidulans(2000)Chaveroche, M-K. , Ghico, J-M. and d ' Enfert C;Nucleic acids Research, vol 28,no 22所述。该技术可用于其它有丝真菌,例如A. niger。本文中描述并要求保护的本发明不仅限于本文所公开的特定实施方式的范围,因为这些实施方式仅被用于对本发明的若干方面加以阐述。任何等同的实施方式都被包括在本发明的范围内。事实上,基于前述的说明书,除本文展示和描述过的之外,本发明的多种改良形式将是本领域技术人员显而易见的。此类改良形式也将在所附权利要求的范围内。在有争论的情况下,本发明的公开文本,包括定义,将起控制作用。本文提到的所有专利和出版物,包括这些专利和出版物内所公开的所有序列和方法,都通过引用被明确并入本文。这些专利和公开文本包括EP 357127、EP 673429、EP 635574、WO 97/06261、WO 98/46772、WO 94/04673。
实施例实验信息菌株
WTl 该A.niger菌株被用作为野生型菌株。该菌株被保藏于CBS研究所,保藏号为 CBS 513. 88。WT2 该A. niger菌株是包含编码葡糖淀粉酶的基因(glaA)缺失的WTl菌株。WT2 是按照EP 0635574所述使用“MARKER-GENE FREE”方法构建的。在该专利中,广泛地描述了如何在CBS 513. 88基因组中缺失glaA特异性DNA序列的方法。该流程产生了不含标记基因的glaA重组A. niger CBS 513. 88菌株,该菌株最终并不具有任何外源DNA序列。葡糖淀粉酶活件检骑按照WO 98/46772所述,使用对硝基苯a_D_吡喃葡糖苷(Sigma)来测定葡糖淀粉酶活性。棚列1 ^^ DNA伺触■■歹丨_藥舰紐辅王本实施例描述了对在本发明启动子控制下的表达构建体的构建。此处使用的编码序列或报道构建体是编码A. niger葡糖淀粉酶的glaA基因。葡糖淀粉酶被用作为能测量本发明启动子活性的报道酶。1. 1对整合型葡糖淀粉_表汰裁彳本(dGBTOPGLA)的描沭将葡糖淀粉酶启动子和来自A. niger的葡糖淀粉酶编码基因glaA克隆进表达载体pGBT0P-8(其被描述于WO 99/3沈17中)。按照已知流程和常规克隆技术来进行克隆,得到质粒pGBTOPGLA (见图1)。大体上,该表达载体包含葡糖淀粉酶启动子、编码序列和终止子区域,侧翼有E. coli载体中的3’和3” glaA定位序列。1. 2构建带有多克隆位点MCS的整合型葡糖淀粉酶表达载体(pGBTOPGLA-2)使用SEQ ID NO 6示出的寡核苷酸5,-ATgCggCCgCCTCgAgTTAATTAAggCCAggCCggCCggCgCgCCTCAgCAATgTCgTTCCgA-3,和SEQ ID NO 7 示出的5’ -AGCCATTGACTTCTTCCCAG-3,以及Ing pGBTOPGLA载体作为模板,产生了含有glaA编码序列一部分的PCR片段。 用B10I和BglII来消化该片段,将其引入到BioI和BglII消化过的载体pGBTOPGLA中,得到载体pGBTOPGLA-2 (见图2)。通过序列分析,证实了包含MCS和glaA编码序列一部分的、 引入的PCR片段的序列。1. 3构建带有本发明的启动子的整合型表达载体(pGBTOPGLA-3),所述启动子与葡糖淀粉酶编码序列可操作地相连对菌株CBS 513.88的基因组DNA进行测序和分析。使用下表展示的寡核苷酸组合物(寡核苷酸SEQ ID NO ),用菌株CBS 513. 88的基因组DNA作为模板,通过PCR扩增将合适的限制性位点连到本发明的启动子上。被示为SEQ ID NO=U SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5的序列包含大约21Λ的获得的片段序列,如下表所示。用AscI和B10I去消化全部五段得到的片段,将它们引入到用AscI和B10I消化过的载体 pGBTOPGLA-2 中,得到载体 pGBTOPGLA-4、pGBTOPGLA-5、pGBTOPGLA-7、pGBTOPGLA-9 或 pGBTOPGLA-10,如下表所示(载体名)。在图3中,可以找到用于说明全部五种载体的布局结构的图。通过序列分析,证实了多种包含本发明启动子的引入的PCR片段的序列。
权利要求
1.启动子DNA序列,选自由如下物质构成的组(a)DNA序列,其中包含SEQ ID NO :1的核苷酸序列,(b)DNA序列,其能与(a)的DNA序列杂交,(c)DNA序列,其与(a)的DNA序列至少50%同源,(d)(a)至(c)所述的任何DNA序列的变体,以及(e)(a)至(d)所述的DNA序列中任何一种的亚序列。
2.DNA构建体,其中包含如权利要求1所述的启动子DNA序列,以及与所述启动子DNA 序列可操作地相连的编码序列,从而所述编码序列可在所述启动子DNA序列控制下被表达。
3.宿主细胞,包含如权利要求2所述的DNA构建体。
4.如权利要求3所述的宿主细胞,其中,所述宿主细胞是Aspergilluslenicillium或 Trichoderma 的物种。
5.如权利要求4所述的宿主细胞,其中,所述Aspergillus是Aspergillusniger或 Aspergillus oryzae 的物禾中。
6.一种方法,用于在宿主细胞中表达基因,所述方法包括(a)提供如权利要求2所述的DNA构建体,(b)用所述DNA构建体去转化合适的宿主细胞,以及(c)在所述启动子DNA序列控制下表达所述基因。
7.一种方法,用于在合适的宿主中生产多肽,所述方法包括(a)提供如权利要求2所述的DNA构建体,其中包含编码所述多肽的编码序列,(b)用所述DNA构建体去转化合适的宿主细胞,(e)在有益于所述多肽表达的培养条件下培养所述合适的宿主,以及(f)从培养物中回收所述多肽。
8.一种方法,用于在合适的宿主中生产次级代谢产物(a)提供如权利要求2所述的DNA构建体,其中包含编码对次级代谢产物的生产中所涉及的酶的编码序列,(b)用所述DNA构建体去转化合适的宿主细胞,(c)在有益于所述次级代谢产物生产的培养条件下培养所述合适的宿主,以及(d)从培养物中回收所述次级代谢产物。
全文摘要
本发明提供了用于在真菌细胞中表达基因的真菌启动子。本发明涉及经过分离的真菌启动子DNA序列,涉及包含这些启动子的DNA构建体、载体和真菌宿主细胞,所述启动子与编码多肽的编码序列可操作地相连。本发明还涉及用经过分离的新启动子表达基因和/或生产多肽的方法。本发明还涉及用本发明的新启动子改变转录水平和/或对内源基因的调控的方法。
文档编号C07K14/38GK102286483SQ20111016654
公开日2011年12月21日 申请日期2005年4月18日 优先权日2004年4月16日
发明者蒂鲍特·乔斯·维恩策尔, 诺林·尼古拉斯·玛丽亚·艾里萨伯斯·佩伊·范, 阿恩·斯达姆 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1