用于在真菌细胞中表达基因的启动子的制作方法

文档序号:442403阅读:430来源:国知局
专利名称:用于在真菌细胞中表达基因的启动子的制作方法
背景技术
发明领域本发明涉及制备多肽的方法。本发明还涉及分离的启动子,以及含有与编码多肽的核酸序列可操作连接的该启动子的核酸结构、载体和宿主细胞。
相关领域的描述在真菌宿主细胞,尤其是丝状真菌细胞例如曲霉属(Aspergillus)中重组制备异源蛋白质可能为以商业上有意义的量生产蛋白质提供了更为理想的载体(vehicle)。
异源蛋白质的重组制备通过构建如下表达盒来实现,在该表达盒中编码该蛋白质的DNA被置于适用于该宿主细胞的从被调节的基因中切下的启动子的表达控制之下。通常通过质粒介导的转化,将该表达盒导入该宿主细胞中。然后在该表达盒所含启动子正常发挥功能所需的诱导条件下,通过培养该转化宿主细胞实现该异源蛋白质的产生。
开发用于蛋白质重组制备的新真菌宿主细胞通常要获得适于在该宿主细胞中控制蛋白质表达的启动子。已经显示,Fusarium venenatum可以作为一种新的宿主细胞用于该类表达(WO 96/00787,WO 97/26330)。而且,对于在Fusarium venenatum宿主细胞中表达异源基因有用的来自尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶基因的启动子,也已有过描述(US 5,837,847)。
然而,在本领域中仍然需要用于控制异源基因表达的新启动子。
本发明的目的是,提供用于在真菌宿主细胞中制备多肽的改良方法和用于该制备的新启动子。
发明概述本发明涉及制备多肽的方法,包括(a)在有利于产生该多肽的培养基中培养真菌宿主细胞,其中该真菌宿主细胞含有编码该多肽的第一核酸序列和与该第一核酸序列可操作地连接的、含有与第一核酸序列异源的启动子的第二核酸序列,其中该启动子含有选自下组的序列SEQ IDNO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ IDNO.3的第1-3060位核苷酸,及其子序列;和它们的突变、杂合及串联启动子;和(b)从该培养基分离该多肽。
本发明还涉及分离的启动子序列,以及含有与编码多肽的核酸序列可操作连接的一或多个该启动子的结构、载体和真菌宿主细胞。
本发明还涉及获得SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸的突变启动子的方法。
本发明还涉及分离的核酸序列,其选自(a)编码具有如下氨基酸序列的多肽的核酸序列,该氨基酸序列与SEQ ID NO.4第22-581位氨基酸有至少65%的一致性、与SEQ ID NO.5第19-200位氨基酸有至少65%的一致性、或与SEQ ID NO.6第1-187位氨基酸有至少65%的一致性;(b)与SEQ ID NO.1第4013-5743位核苷酸有至少65%的同源性、与SEQ ID NO.2第993-1593位核苷酸有至少65%的同源性、或与SEQ IDNO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)在极低、低、中等、中高、高或极高严紧条件下与以下序列杂交的核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100个核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互补链;(d)编码具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的变体的核酸序列,其中所述变体包含一或多个氨基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位变体;和(f)(a)、(b)、(c)或(e)的子序列。
本发明还涉及具有这些核酸序列的结构、载体、和重组宿主细胞。
附图简述

图1A-F显示Fusarium venenatum葡糖淀粉酶基因的基因组DNA序列和推导的氨基酸序列(分别是SEQ ID NOs.1和4)。
图2A-C显示命名为“Daria”的Fusarium venenatum基因的基因组DNA序列和推导的氨基酸序列(分别是SEQ ID NOs.2和5)。
图3A-D显示命名为“Quinn”的Fusarium venenatum基因的基因组DNA序列和推导的氨基酸序列(分别是SEQ ID NOs.3和6)。
图4显示pDM181的限制性图谱。
图5显示pSheB1的限制性图谱。
图6显示pDM194的限制性图谱。
图7显示pJRoy35的限制性图谱。
图8显示pDM218的限制性图谱。
图9显示pEJG25A的限制性图谱。
图10显示pMWR60的限制性图谱。
图11显示pRaMB62的限制性图谱。
图12显示pRaMB64的限制性图谱。
图13显示pRaMB66的限制性图谱。
图14显示在Fusarium Venenatum中处于Fusarium venenatum淀粉葡糖苷酶(pAMG)启动子和尖镰孢胰蛋白酶(pSP387)启动子控制下的Humicola lanuginosa脂酶报道基因表达的比较。
发明详述本发明涉及制备多肽的方法,包括(a)在有利于产生该多肽的培养基中培养真菌宿主细胞,其中该真菌宿主细胞含有编码该多肽的第一核酸序列和与该第一核酸序列可操作地连接的、含有与第一核酸序列异源的启动子的第二核酸序列,其中该启动子含有选自下组的序列SEQ IDNO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它们的突变、杂合及串联启动子;和(b)从该培养基分离该多肽。
在本发明的制备方法中,采用本领域已知的方法在适于所述多肽产生的营养培养基中培养所述细胞。例如,可以在适当培养基中、在允许该多肽表达和/或分离的条件下通过摇瓶培养、实验室或工业发酵罐中的小规模或大规模发酵(包括连续、批式、补料分批或固态发酵),来培养该细胞。该培养在含有碳和氮源以及无机盐的适合营养培养基中采用本领域已知的程序进行。适合的培养基可从商业厂家获得,也可根据(如美国典型培养物保藏中心目录中的)公开的组成制备。如果该多肽分泌至营养培养基中,则可以直接从该培养基中回收该多肽。如果该多肽是不分泌的,则可以从细胞裂解物中进行回收。
该多肽可采用特异针对该多肽的本领域已知方法来检测。这些检测方法可以包括特异性抗体的使用、酶产物的形成、或酶底物消失。
所获得的多肽可通过本领域已知的方法回收。例如,可通过传统方法,包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养培养基中回收所述多肽。
该多肽可以通过本领域已知的多种方法来纯化,这些方法包括但不限于层析(如离子交换、亲和、疏水、层析聚焦和大小排阻层析)、电泳方法(如制备型等电聚焦)、差异溶解度(如硫酸铵沉淀)、SDS-PAGE或抽提(见例如,蛋白质纯化(Protein Purification),J.-C.Janson和Lars Ryden编著,VCH Publishers,纽约,1989)。
启动子术语“启动子”在本文中定义为结合RNA聚合酶并指导该聚合酶到达编码多肽的核酸序列的正确下游转录起始位点以起始转录的DNA序列。RNA聚合酶有效地催化与编码区适当DNA链互补的信使RNA的组装。术语“启动子”也应理解为包括在转录成mRNA之后用于翻译的(启动子和翻译起始位点之间的)5’非编码区、顺式作用转录控制元件例如增强子、和其它能够与转录因子相互作用的核苷酸序列。
术语“突变启动子”在本文中定义为具有其中含有一或多个核苷酸替代、缺失和/或插入的亲本启动子核苷酸序列的启动子,其中该突变启动子比相应的亲本启动子具有较强或较弱的启动子活性。术语“突变启动子”也将包括自然变体,和采用经典诱变、定点诱变和DNA改组等本领域熟知的方法获得的体外制备变体。
术语“杂合启动子”在本文中定义为两个或多个启动子的部分,它们融合在一起形成两个或更多个启动子的融合物序列,该序列与编码序列可操作地连接并介导该编码序列转录成mRNA。
术语“串联启动子”在本文中定义为每一个均与一个编码序列可操作地连接并介导该编码序列转录成mRNA的两个或多个启动子序列。
术语“可操作地连接”在本文中定义为一种如下构象,在该构象中控制序列例如启动子序列被适当地置于相对于编码序列的一个位置上,以致该控制序列指导该编码序列所编码的多肽的产生。
术语“编码序列”在本文中定义为当被置于适当控制序列的控制之下时,可以转录为能翻译成多肽的mRNA的核酸序列。编码序列的边界一般由mRNA 5’端刚好位于该开放阅读框上游的ATG起始密码子,和mRNA 3’端刚好位于该开放阅读框下游的转录终止序列来确定。编码序列可以包括,但不限于基因组DNA、cDNA、半合成的、合成的、和重组的核酸序列。
在一个优选的实施方案中,所述启动子具有SEQ ID NO.1第1-3949位核苷酸的核酸序列,或其子序列。该子序列优选含有至少大约2100个核苷酸,更优选至少大约2400个核苷酸,最优选至少大约2700个核苷酸。
在另一个优选实施方案中,所述启动子具有SEQ ID NO.2第1-938位核苷酸的核酸序列,或其子序列。该子序列优选含有至少大约840个核苷酸,更优选至少大约870个核苷酸,最优选至少大约900个核苷酸。
在另一个优选实施方案中,所述启动子具有SEQ ID NO.3第1-3060位核苷酸的核酸序列,或其子序列。该子序列优选含有至少大约2100个核苷酸,更优选至少大约2400个核苷酸,最优选至少大约2700个核苷酸。
在另一个优选实施方案中,所述启动子是大肠杆菌(Escherichia coli)NRRL B-30067中的质粒pECO3所包含的核酸序列。在另一个优选实施方案中,该启动子是大肠杆菌NRRL B-30071中的质粒pFAMG所包含的核酸序列。在另一个优选实施方案中,该启动子是大肠杆菌NRRL B-30075中的质粒pQUINN所包含的核酸。
在本发明的方法中,所述启动子还可以是在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸、或SEQ ID NO.3第1-3060位核苷酸的核酸序列中含有一或多个核苷酸替代、缺失、和/或插入的上述启动子的突变体。
突变启动子可以含有一或多个突变。每个突变均是独立的核苷酸替代、缺失和/或插入。可以采用本领域已知的任何方法,例如经典诱变、定点诱变或DNA改组来实现向所述启动子中引入核苷酸替代、缺失和/或插入。尤其有用的一种方法是利用带有目的插入片段的超螺旋双链DNA载体和两个含有期望突变的合成引物来进行的。该寡核苷酸引物每一个均与该载体的相反链互补,在温度循环中通过pfu DNA聚合物的作用延伸。一旦这两个引物掺入后,就产生含有交错切口的突变质粒。在温度循环后,用对于甲基化和半甲基化DNA特异的DpnI处理该产物,以消化亲本DNA模板并选出含有突变的合成DNA。也可以采用本领域已知的其它方法。
在一个优选实施方案中,所述启动子是SEQ ID NO.1第1-3949位核苷酸的突变体。在另一个优选实施方案中,所述启动子是SEQ ID NO.2第1-938位核苷酸的突变体。在另一个优选实施方案中,所述启动子是SEQ ID NO.3第1-3060位核苷酸的突变体。
在本发明的方法中,所述启动子还可以是杂合启动子,其含有一或多个本发明启动子的部分;一个本发明启动子的部分和另一个启动子的部分,例如一个启动子的前导序列和来自另一个启动子的转录起始位点;或一或多个本发明启动子的部分和一或多个其它启动子的部分。所述其它启动子可以是在所选真菌宿主细胞中表现出转录活性的任何启动子序列,包括突变的、截短的和杂合的启动子,并且可以从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。该其它启动子对于编码所述多肽的核酸序列而言可以是自身的或外来的,并且对于该细胞而言也可以是自身的或外来的。
用于和本发明的启动子一起构建杂合启动子的其它启动子的例子包括从米曲霉(Aspergillus oryzae)TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)的基因获得的启动子,以及NA2-tpi启动子(黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶的基因启动子的杂合物),和从酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶的基因获得的启动子,及这些启动子的突变的、截短的和杂合的启动子。用于酵母宿主细胞的其它有用启动子描述于Romanos等,1992,酵母(Yeast)8423-488。
所述启动子还可以是含有两个或多个本发明启动子或者是含有一或多个本发明启动子和一或多个诸如以上所例举的其它启动子的串联启动子。该串联启动子的两个或多个启动子序列可以同时启动所述核酸序列的转录。或者,该串联启动子的一或多个启动子序列可以在细胞生长的不同阶段启动所述核酸序列的转录。
在本发明的方法中,该启动子对于编码目的多肽的核酸序列而言是异源的,但该启动子或核酸序列对于该真菌宿主细胞而言可以是天然的。即使野生型启动子对于编码多肽的核酸序列而言是自身的,本发明的突变、杂合、或串联启动子也应理解为与该核酸序列异源。
本发明的突变、杂合或串联启动子具有SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸启动子的启动子活性的至少大约20%、优选至少大约40%、更优选至少大约60%、更优选至少大约80%、更优选至少大约90%、更优选至少大约100%、甚至更优选至少大约200%、最优选至少大约300%、甚至最优选至少大约400%。
编码多肽的核酸序列由所述核酸序列编码的多肽对于目的真菌宿主细胞而言可以是自身的或异源的。
术语“多肽”在此并非旨在指特定长度的编码产物,因此包括肽、寡肽和蛋白质。术语“异源多肽”在本文中定义为非该真菌细胞天然的多肽,已经过修饰改变了天然序列的天然多肽,或其表达由于重组DNA技术对宿主细胞的操作而在数量上改变的天然多肽。例如,天然多肽可以通过例如将编码该多肽的基因置于本发明的启动子控制之下重组产生以增强该多肽的表达、借助信号序列促进目的天然多肽向细胞外运输,和增加编码细胞正常所产生的该多肽的基因的拷贝数。该真菌细胞可以含有一或多个拷贝的编码该多肽的核酸序列。
优选地,该多肽是激素或其变体、酶、受体或其部分、抗体或其部分、或报道分子。在一个优选的实施方案中,该多肽是向细胞外分泌的。在一个更优选的实施方案中,该多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。在一个甚至更优选的实施方案中,该多肽是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、转化酶(invertase)、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶溶酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶(transglutaminase)或木聚糖酶。
编码目的多肽的核酸序列可以从任何原核、真核或其它来源获得。为了本发明的目的,本文中与给定来源相连使用的术语“获自”是指该多肽是由该来源或已插入了该来源的基因的细胞产生的。
用于分离或克隆编码目的多肽的核酸序列的技术是本领域已知的,包括从基因组DNA分离,从cDNA制备,或它们的组合。从该基因组DNA克隆该核酸序列可以通过例如采用熟知的聚合酶链式反应(PCR)来实现。见例如,Innis等,1990,PCR操作方法和应用指南(PCR ProtocolsAGuide to Methods and Application),Academic Press,纽约。该克隆方法可能包括切割和分离含有编码该多肽的核酸序列的期望核酸片段,将该片段插入载体分子中,并将该重组载体掺入可以复制出多个拷贝或克隆的该核酸序列的突变真菌细胞中。该核酸序列可以是基因组、cDNA、RNA、半合成、合成来源的或它们的任意组合。
在本发明方法中,所述多肽还可以包括其中在该多肽或其片段的N端或C端融合了另一个多肽的融合或杂合多肽。融合多肽是通过将编码一个多肽的核酸序列(或其部分)与编码另一个多肽的核酸序列(或其部分)融合在一起产生的。产生融合多肽的技术是本领域已知的,包括连接编码这些多肽的编码序列以使它们符合阅读框,并且使该融合多肽的表达处于相同的一个或多个启动子和相同的终止子的控制之下。所述杂合多肽可以含有从至少两个不同多肽获得的部分或完整多肽序列的组合,其中的一或多个多肽对于该突变真菌细胞可以是异源的。
核酸结构本发明还涉及含有与本发明的启动子和一个或多个控制序列可操作地连接的编码多肽的核酸序列的核酸结构,其中所述控制序列可在适合的宿主细胞中在与该控制序列相容的条件下指导该编码序列的表达。表达将理解为包括多肽产生所涉及到的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
“核酸结构”在本文中定义为单链或双链核酸分子,该核酸分子可以是从天然存在的基因分离的,或是已被修饰而含有以天然不存在的方式组合和并置在一起的核酸片段。当核酸结构含有编码序列以及表达该编码序列所必需的所有控制序列时,术语核酸结构与术语表达盒同义。
可以通过多种方式进一步操作编码多肽的分离核酸序列,以为该多肽的表达作准备。依据表达载体,在核酸序列插入载体之前对其进行操作可能是期望的或是必需的。利用重组DNA方法修饰核酸序列的技术是本领域熟知的。
在本发明的方法中,核酸序列可以含有一个或多个天然控制序列,或可以用该核酸序列外源的一或多个控制序列来取代该一个或多个天然控制序列,以改善编码序列在宿主细胞中的表达。
术语“控制序列”在本文中定义为包括所有对本发明多肽的表达而言必需或有利的成分。每个控制序列对于编码该多肽的核酸序列而言可以是自身的或是外源的。这些控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、本发明的启动子、信号肽序列和转录终止子。最少地,控制序列包括本发明的启动子,以及转录和翻译终止信号。控制序列可与接头一起提供,以便引入特异的限制性位点,便于控制序列与编码多肽的核酸序列编码区连接。
控制序列可以是适合的转录终止子序列,即被宿主细胞识别以终止转录的序列。终止子序列与编码所述多肽的核酸序列的3’末端可操作地连接。任何在所选宿主细胞中起作用的终止子都可用于本发明。
用于丝状真菌宿主细胞的优选终止子可获自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶的基因。
用于酵母宿主细胞的优选终止子可获自酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。用于酵母宿主细胞的其它有用的终止子描述于Romanos等,1992,同上。
控制序列也可以是适当的前导序列,即一种对宿主细胞翻译重要的mRNA非翻译区。前导序列与编码所述多肽的核酸序列的5’端可操作地连接。任何在所选宿主细胞中有功能的前导序列都可用于本发明。
用于丝状真菌宿主细胞的优选前导序列可从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
适用于酵母宿主细胞的前导序列可从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得。
控制序列也可以是聚腺苷酸化序列,即一种与所述核酸序列3’末端可操作地连接的、转录时被宿主细胞作为向转录的mRNA添加聚腺苷酸残基(polyadenosine residues)的信号而识别的序列。任何在所选宿主细胞中有作用的聚腺苷酸化序列均可用于本发明。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列可从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因获得。
用于酵母宿主细胞的有用聚腺苷酸化序列描述于Guo和Sherman,1995,分子细胞生物学(Molecular Cellular Biology)155983-5990。
控制序列还可以是编码与多肽氨基末端连接的氨基酸序列、并指导该编码多肽进入细胞分泌途径的信号肽编码区。所述核酸序列编码区的5’末端本身可含有在翻译阅读框中天然与编码该分泌多肽的编码区片段连接的信号肽编码区。或者,编码序列的5’末端可含有对该编码序列而言外源的信号肽编码区。在编码序列并不天然含有信号肽编码区的时候可能需要外源信号肽编码区。或者,为了增强多肽的分泌,可以简单地用外源信号肽编码区替代天然信号肽编码区。然而,任何指导表达多肽进入所选宿主细胞分泌途径的信号肽编码区均可用于本发明。
用于丝状真菌宿主细胞的有效信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶的基因获得的信号肽编码区。
用于酵母宿主细胞的有用信号肽可从酿酒酵母α-因子和酿酒酵母转化酶(invertase)的基因获得。其它有用的信号肽编码区描述于Romanos等,1992,同上。
控制序列还可以是编码位于多肽氨基端的氨基酸序列的前肽编码区。所获得的多肽被称为酶原(proenzyme)和多肽原(有时也叫酶原(zymogen))。多肽原通常是无活性的,但能通过前肽的催化切割或自身催化切割从多肽原转化成成熟活性多肽。前肽编码区可从枯草芽孢杆菌(Bacillus subtilis)碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、Rhizomucor miehei天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO 95/33836)的基因获得。
当多肽的氨基端同时存在信号肽和前肽区时,前肽区紧接位于多肽的氨基端,而信号肽区紧接位于前肽区的氨基端。
也可以期望加入允许相对于宿主细胞生长调节所述多肽表达的调节序列。调节系统的例子是那些使基因表达响应化学或物理刺激包括调节化合物的存在而打开或关闭的系统。原核系统中的调节系统包括lac、tac和trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它例子是那些允许基因扩增的序列。在真核系统中,这些包括在氨甲蝶呤存在时扩增的二氢叶酸还原酶基因和在重金属存在时扩增的金属硫蛋白基因。在这些情况中,编码所述多肽的核酸序列将与调节序列可操作地连接。
本发明还涉及用于改变编码多肽的宿主细胞内源性基因的表达的核酸结构。这些结构可以含有改变该内源基因表达所必需的最少成分。在一个实施方案中,这些核酸结构优选含有(a)导向序列,(b)本发明的启动子,(c)外显子,和(d)剪接供体位点。一旦该核酸结构导入细胞后,该结构即通过同源重组在内源基因位点插入细胞的基因组中。导向序列指导元件(a)-(d)整合至内源基因中,以使元件(b)-(d)与该内源基因可操作地连接。在另一个实施方案中,这些核酸结构含有(a)导向序列,(b)本发明的启动子,(c)外显子,(d)剪接供体位点,(e)内含子,和(f)剪接受体位点,其中该导向序列指导元件(a)-(f)的整合,以使元件(b)-(f)与内源基因可操作地连接。然而,这些结构还可以含有其它成分如选择标记。
在这两个实施方案中,这些成分的引入导致产生了改变内源基因表达的新转录单元。大体上,此新转录单元是通过这些导向结构引入的序列和内源基因的融合产物。在一个改变内源基因的实施方案中,该基因被激活。在该实施方案中,采用同源重组,通过插入使内源基因以比在相应的亲本细胞中更高的水平表达的调节序列,替代、破坏或失效正常与亲代细胞的该内源基因有关的调节区。采用本领域熟知的方法(见例如,美国专利5,641,670),通过在该结构中包含可扩增的选择标记基因,可以进一步扩增该激活的基因。在另一个改变内源基因的实施方案中,该基因的表达被降低。
所述导向序列可位于所述内源基因内,紧邻该基因,在上游基因内,或在该内源基因的上游并相隔一段距离。可使用一个或多个导向序列。例如,环状质粒或DNA片段优选使用单个导向序列,而线性质粒或DNA片段优选使用两个导向序列。
这些结构还含有所述内源基因的一个或多个外显子。外显子定义为可以被复制成RNA并在成熟mRNA分子中存在以致该外显子序列与该内源基因的编码区在阅读框上相符合的DNA序列。外显子可以任选地含有编码一个或多个氨基酸和/或部分编码氨基酸的DNA。另一种情况是,外显子含有相应于5’非编码区的DNA。当一个或多个外源外显子编码一个或多个氨基酸和/或部分编码氨基酸时,设计该核酸结构,使得在转录和剪接后,该阅读框与内源基因的编码区在阅读框上相符合,以便来自第二外显子的mRNA部分的适当阅读框不改变。
这些结构的剪接供体位点指导一个外显子向另一个外显子的剪接。典型地,第一外显子位于第二外显子的5’,而位于第一外显子3’侧翼并与之重叠的剪接供体位点识别位于第二外显子5’侧翼的剪接受体位点。象剪接供体位点一样,剪接受体位点也是指导一个外显子向另一个外显子剪接的序列。剪接装置联合剪接供体位点一起作用,使用剪接受体位点实现内含子的去除。
本发明还涉及制备多肽的方法,包括(a)在有益于产生该多肽的条件下,培养其中已掺入了如下新转录单元的同源重组细胞,该新转录单元含有与编码该多肽的内源核酸序列第二外显子可操作地连接的本发明启动子、外显子和/或剪接供体位点;和(b)回收该多肽。该方法基于基因激活技术的使用,例如美国专利5,641,670所描述的技术。
表达载体本发明还涉及包含本发明启动子、编码多肽的核酸序列以及转录和翻译终止信号的重组表达载体。可将以上描述的各种核酸和控制序列连接在一起,产生可包括一个或多个方便的限制性位点以允许该启动子和编码多肽的核酸序列在这些位点插入或替代的重组表达载体。或者,可以通过将该核酸序列或含有该启动子和/或序列的核酸结构插入适当的表达载体中来表达该核酸序列。在建立该表达载体时,将该编码序列定位于该载体中,使得该编码序列与本发明的启动子和一或多个适当的表达控制序列可操作地连接。
重组表达载体可以是任何能方便地用于重组DNA程序并能使所述核酸序列表达的载体(如质粒或病毒)。典型地,载体的选择取决于载体和载体将要导入的宿主细胞之间的相容性。该载体可以是线性或闭合环状质粒。
该载体可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色体复制的载体,如质粒、染色体外因子、微型染色体或人工染色体。该载体可以含有任何保证自我复制的序列。或者,该载体可以是当导入宿主细胞后整合在基因组中并和它所整合的染色体一起复制的载体。而且,可使用单个载体或质粒,或一起含有待导入宿主细胞基因组的全部DNA的两个或多个载体或质粒,或转座子。
本发明的载体优选含有一个或多个允许方便地选择转化细胞的选择标记。选择标记是其产物提供杀生物剂或病毒抗性、重金属抗性、相对营养缺陷型的原养型等的基因。用于酵母宿主细胞的适当标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶(phosphinothricin acetyltransferase))、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))、trpC(邻氨基苯甲酸合成酶),以及它们的等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选包含允许该载体稳定整合至宿主细胞基因组中或允许该载体在该细胞中独立于基因组而自主复制的一个或多个元件。
为了整合至宿主细胞基因组中,该载体可以依赖于编码所述多肽的核酸序列或用于使该载体通过同源或非同源重组稳定整合至基因组中的任何其它载体元件。或者,该载体可含有用于通过同源重组指导向宿主细胞基因组中整合的额外核酸序列。这些额外核酸序列使得该载体可以在一条或多条染色体的一个或多个精确位置整合至宿主细胞基因组中。为了增加在精确位置整合的可能性,整合元件应优选含有足够数目的与相应靶序列同源的核酸,如100-1,500个碱基对,优选400-1,500个碱基对,最优选800-1,500个碱基对,以增强同源重组的可能性。整合元件可以是任何与宿主细胞基因组中的靶序列同源的序列。而且,该整合元件可以是非编码或编码核酸序列。另一方面,该载体可以通过非同源重组整合至宿主细胞的基因组中。
为了自主复制,该载体可进一步包含使载体能在所述宿主细胞中自主复制的复制起点。用于酵母宿主细胞中的复制起点的例子是2μ复制起点、ARS1、ARS4、ARS1和CEN3的组合以及ARS4和CEN6的组合。复制起点可以是含有使该复制起点功能在宿主细胞中具有温度敏感性的突变的复制起点(见例如,Ehrlich,1978,美国国家科学院院刊(Proceedingsof the National Academy of Sciences USA)751433)。
可在宿主细胞中插入一个拷贝以上的编码多肽的核酸序列,以增加基因产物的产量。该核酸序列拷贝数的增加可通过如下方法获得在宿主细胞基因组中至少再整合一个额外拷贝的该序列;或在细胞中包括带有该核酸序列的可扩增选择标记基因,在适当选择剂存在时培养这些细胞,能够选出含有扩增拷贝的选择标记基因、因此也含有额外拷贝的该核酸序列的细胞。
用于连接上述元件以构建本发明的重组表达载体的程序是本领域技术人员熟知的(见例如,Sambrook等,1989,同上)。
宿主细胞本发明还涉及含有与编码多肽的核酸序列可操作地连接的本发明启动子的重组宿主细胞,这些细胞可以有利地用于该多肽的重组制备。将含有与编码多肽的核酸序列可操作地连接的本发明启动子的载体导入宿主细胞,以使该载体作为前面描述的染色体整合体或自我复制的染色体外载体而存在。术语“宿主细胞”包括任何由于复制过程中发生的突变而与亲代细胞不同的亲代细胞后代。宿主细胞的选择在很大程度上取决于编码所述多肽的基因及其来源。
宿主细胞可以是任何在本发明方法中有用的真菌细胞。本文所用“真菌”包括phyla Ascomycota,Basidiomycota,Chytridiomycota和Zygomycota(定义在Hawksworth等,Ainsworth and Bisby’s Dictionaryof The Fungi,第8版,1995,CAB International,University Press,Cabridge,UK中)和以及Oomycota(见Hawksworth等,1995,同上,第171页)和所有有丝分裂孢子真菌(Hawksworth等,1995,见上)。
在一个优选的实施方案中,该真菌宿主细胞是酵母细胞。这里所用“酵母”包括产子囊酵母(内孢霉目(Endomycetales))、产担孢子(basidiosporogenous)酵母和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。因为酵母的分类将来可能改变,为了本发明的目的,酵母应按《酵母的生物学和活动》(Biology and Activitiesof Yeast)(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编著,Soc.App.Bacteriol.Symposium Series No.9,1980)中的描述来定义。
在一个更优选的实施方案中,酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或Yarrowia细胞。
在一个最优选的实施方案中,该酵母宿主细胞是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、Saccharomyces douglasii、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)或Saccharomycesoviformis细胞。在另一个最优选的实施方案中,该酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的实施方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个优选实施方案中,该真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和Oomycota的所有丝状类型(正如Hawksworth等,1995,见上,所定义的)。丝状真菌的特征在于由几丁质、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖和其它复合多糖构成的菌丝体壁。营养生长是通过菌丝延长来进行的,碳代谢为专性需氧的。相反,酵母如酿酒酵母的营养生长是通过单细胞菌体的出芽来进行的,而且碳代谢可以通过发酵进行。
在一个更优选的实施方案中,该丝状真菌宿主细胞是但不限于Acremonium、曲霉属(Aspergillus)、镰孢霉属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、Tolypocladium或木霉属(Trichoderma)的种的细胞。
在一个最优选的实施方案中,该丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae)细胞。在另一个最优选的实施方案中,该丝状真菌宿主细胞是杆孢状镰孢(Fusariumbactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum细胞。在另一个最优选的实施方案中,该丝状真菌宿主细胞是Humicola insolens、Humicolalanuginosa、米黑毛霉(Mucor miehei)、Myceliophthora thermophila、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、Thielavia terrestris、Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichodeerma viride)细胞。
在一个甚至最优选的实施方案中,Fusarium venenatum细胞是最初作为禾本科镰孢(Fusarium graminearum)ATCC 20334保藏,最近由Yoder与Christianson(1998,真菌遗传学和生物学(Fungal Genetics andBiology)2362-80)和O’Donnell等(1998,真菌遗传学和生物学2357-67)重新划分为Fusarium venenatum的Fusarium venenatum A3/5;以及Fusarium venenatum的分类学等同物,而无论它们目前被称为何种种名。在另一个优选实施方案中,正如WO 97/26330中所公开的,Fusariumvenenatum细胞是Fusarium venenatum A3/5或Fusarium venenatum ATCC20334的形态学突变体。
可以通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本质上已知的方式来转化真菌细胞。用于转化曲霉属宿主细胞的适当程序描述于EP 238 023和Yelton等,1984,美国国家科学院院刊811470-1474。用于转化镰孢霉属的种的适当方法描述于Malardier等,1989,基因(Gene)78147-156和WO 96/00787。酵母的转化可采用Becker和Guarente,由Abelson,J.N.和Simon,M.I.编,酵母遗传学和分子生物学指南(Guide to Yeast Genetics and Molecular Biology),酶学方法(Methods in Enzymology),第194卷,第182-187页,Academic Press,Inc.,纽约;Ito等,1983,细菌学杂志(Journal of Bacteriology)153163;和Hinnen等,1978,美国国家科学院院刊751920中描述方法来进行。
获得突变启动子的方法本发明还涉及获得突变启动子的方法,包括(a)在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的序列中引入至少一个突变,其中该突变启动子具有启动子活性;和(b)分离该突变启动子。
本发明还涉及通过以下步骤获得突变启动子的方法(a)在极低、低、中等、中高、高或极高的严紧条件下使DNA与(i)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3,(ii)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链杂交;和(b)从该DNA中分离出该突变启动子。本文中对严紧性和洗涤条件作了定义。
该突变启动子可以采用本领域已知的方法例如限制性酶消化或PCR扩增来分离。
核酸序列本发明还涉及选自下组的分离核酸序列(a)编码具有如下氨基酸序列的多肽的核酸序列,该氨基酸序列与SEQID NO.4第22-581位氨基酸有至少65%的一致性、与SEQ ID NO.5第19-200位氨基酸有至少65%的一致性、或与SEQ ID NO.6第1-187位氨基酸有至少65%的一致性;(b)与SEQ ID NO.1第4013-5743位核苷酸有至少65%的同源性、与SEQ ID NO.2第993-1593位核苷酸有至少65%的同源性、或与SEQ IDNO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)与(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100个核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互补链,在极低、低、中等、中高、高或极高严紧条件下杂交的核酸序列;(d)编码具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的变体的核酸序列,其中所述变体包含一或多个氨基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位变体;和(f)(a)、(b)、(c)或(e)的子序列。
本文所用术语“分离的核酸序列”是指基本不含有其它核酸序列的核酸序列,例如通过琼脂糖电泳确定具有至少约20%的纯度,优选至少约40%的纯度,更优选至少约60%的纯度,甚至更优选至少约80%的纯度,最优选至少约90%的纯度的核酸序列。例如,分离的核酸序列可以通过遗传工程中使用的标准克隆程序将该核酸序列从其天然位置重新置于其将进行复制的不同位置上来获得。该克隆程序可能涉及切割和分离包含编码该多肽的核酸序列的期望核酸片段,将此片段插入载体分子中,和将该重组载体掺入可以复制出多个拷贝或克隆的该核酸序列的宿主细胞中。该核酸序列可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。
在第一个实施方案中,本发明涉及编码具有与SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸(即成熟多肽)有至少约65%、优选至少约70%、更优选至少约80%、甚至更优选至少约90%、最优选至少约95%,甚至最优选至少约97%一致性程度的氨基酸序列的多肽(以下称为“同源多肽”)的分离核酸序列。在一个优选实施方案中,该同源多肽的氨基酸序列与SEQ IDNO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸有5个氨基酸不同,优选有4个氨基酸不同,更优选有3个氨基酸不同,甚至更优选有2个氨基酸不同,最优选有1个氨基酸不同。为了本发明的目的,两个氨基酸序列之间的一致性程度采用Clustal法(Higgins,1989,CABIOS 5151-153)和LASERGENETMMEGALIGNTM软件(DNASTAR公司,Madison,WI)并使用同一性表和下列多序列对比(multiple alignment)参数来确定空位罚分(gap penalty)为10,空位长度罚分为10。两两对比(Pairwise alignment)参数是Ktuple=1,空位罚分=3,窗口(windows)=5,对角线(diagonals)=5。
优选地,本发明多核苷酸序列编码含有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的氨基酸序列;或其等位变体;或它们的片段的多肽。在一个更优选的实施方案中,本发明核酸序列编码含有SEQ ID NO.4、SEQID NO.5或SEQ ID NO.6的氨基酸序列的多肽。在另一个优选实施方案中,本发明核酸序列编码含有SEQ ID NO.4第22-581位氨基酸、SEQ IDNO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸;或其等位变体;或它们的片段的多肽。在另一个优选实施方案中,本发明核酸序列编码含有SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸的多肽。在另一个优选实施方案中,本发明核酸序列编码由SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的氨基酸序列;或其等位变体;或它们的片段组成的多肽。在另一个优选实施方案中,本发明核酸序列编码由SEQ ID NO.4、SEQ ID NO.5或SEQID NO.6的氨基酸序列组成的多肽。在另一个优选实施方案中,本发明核酸序列编码由SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸;或其等位变体;或它们的片段组成的多肽。在另一个优选实施方案中,本发明核酸序列编码由SEQ IDNO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸组成的多肽。
本发明还包括编码具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的氨基酸序列的多肽、但由于遗传密码简并性的原因又分别不同于SEQ IDNO.1、SEQ ID NO.2或SEQ ID NO.3的核酸序列。本发明还涉及分别编码SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的片段的SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的子序列。
子序列是SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所包含的、已从5’和/或3’端缺失了一个或多个核苷酸的核酸序列。优选地,SEQ ID NO.1的子序列含有至少1410个核苷酸,更优选至少1500个核苷酸,最优选至少1590个核苷酸。优选地,SEQ ID NO.2的子序列含有至少450个核苷酸,更优选至少480个核苷酸,最优选至少510个核苷酸。优选地,SEQID NO.3的子序列含有至少465个核苷酸,更优选至少495个核苷酸,最优选至少525个核苷酸。SEQ ID NO.4、SEQ ID NO.6或SEQ ID NO.6的片段是从该氨基酸序列的氨基和/或羧基端缺失了一或多个氨基酸的多肽。优选地,SEQ ID NO.4的片段含有至少470个氨基酸残基,更优选至少500个氨基酸残基,最优选至少530个氨基酸残基。优选地,SEQ ID NO.5的片段含有至少150个氨基酸残基,更优选至少160个氨基酸残基,最优选至少170个氨基酸残基。优选地,SEQ ID NO.6的片段含有至少155个氨基酸残基,更优选至少165个氨基酸残基,最优选至少175个氨基酸残基。
等位变体是指占据相同染色体座位的一个基因的两种或多种不同形式中的任意一种。等位变异通过突变自然发生,并可导致种群内的多态现象。基因突变可以是沉默的(在编码的多肽中没有变化),也可编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
在第二个实施方案中,本发明涉及与SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第4013-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸(即成熟多肽编码区)有至少约65%、优选约70%、优选约80%、更优选约90%、甚至更优选约95%、最优选约97%同源性程度的、编码活性多肽的分离核酸序列;或其等位变体和子序列。为了本发明的目的,两个核酸序列之间的同源性程度通过Wilbur-Lipman方法(Wilbur和Lipman,1983,美国国家科学院院刊(Proceedings of theNational Academy of Science USA)80726-730)采用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)以及同一性表和下列多序列对比参数进行确定空位罚分10,空位长度罚分10。两两对比参数为Ktuple=3,空位罚分=3,窗口=20。
在第三个实施方案中,本发明涉及在极低严紧条件、优选低严紧条件、更优选中等严紧条件、更优选中高严紧条件、甚至更优选高严紧条件、最优选极高严紧条件下,和在相同条件下与下列序列杂交的核酸探针杂交的编码多肽的分离核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互补链(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,分子克隆实验室手册(Molecular Cloning,A Laboratory Manual),第二版,Cold Spring Harbor,纽约)。SEQ ID NO.1、SEQ ID NO.2或SEQID NO.3的子序列可以是至少100个核苷酸,优选至少200个核苷酸。而且,该子序列可以编码多肽片段。
根据本领域熟知的方法,可以利用SEQ ID NO.1、SEQ ID NO.2或SEQID NO.3的核酸序列或其子序列,以及SEQ ID NO.4、SEQ ID NO.5或SEQID NO.6的氨基酸序列或其片段,设计核酸探针以从不同属或种的株系中鉴定和克隆编码多肽的DNA。具体地,可以在标准Southern印迹程序之后,采用该探针与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中的相应基因。该探针可以比完整序列短得多,但应长至少15个,优选至少25个,更优选至少35个核苷酸。也可使用更长的探针。既可使用DNA探针,也可使用RNA探针。典型地,为了检测相应基因对该探针进行标记(例如用32P、3H、35S、生物素或抗生物素蛋白进行标记)。该探针包括在本发明的范围之内。
由此,可以筛选从这些其它生物制备的基因组DNA或cDNA文库,以寻找与上述探针杂交并编码多肽的DNA。来自这些其它生物的基因组或其它DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离。可以将来自这些文库的DNA或该分离的DNA转移并固定在硝酸纤维素或其它适当的载体材料上。为了鉴定与SEQ ID NO.1或其子序列同源的克隆或DNA,将该载体材料用于Southern印迹。为了本发明的目的,杂交是指核酸序列与相应于SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所示核酸序列、它们的互补序列或其子序列的标记核酸探针在极低到极高的严紧条件下杂交。在这些条件下与该核酸探针杂交的分子用X光胶片检测。
在一个优选实施方案中,该核酸探针是SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的核酸序列。在另一个优选实施方案中,该核酸探针是编码SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的多肽的核酸序列,或其子序列。在另一个优选实施方案中,该核酸探针是SEQ ID NO.1、SEQ IDNO.2或SEQ ID NO.3。在另一个优选实施方案中,该核酸探针是编码成熟多肽的SEQ ID NO.1第4013-5743位核苷酸。在另一个优选实施方案中,该核酸探针是编码成熟多肽的SEQ ID NO.2第993-5743位核苷酸。在另一个优选实施方案中,该核酸探针是编码成熟多肽的SEQ ID NO.3第3061-3678位核苷酸。在另一个优选实施方案中,该核酸探针是大肠杆菌NRRL B-30067中的质粒pECO3所包含的所述核酸序列。在另一个优选实施方案中,该核酸探针是大肠杆菌NRRL B-30071中的质粒pFAMG所包含的所述核酸序列。在另一个优选实施方案中,该核酸探针是大肠杆菌NRRL B-30076中的质粒pQUINN所包含的所述核酸序列。在另一个优选实施方案中,该核酸探针是大肠杆菌NRRL B-30067中的质粒pECO3所包含的所述成熟多肽编码区。在另一个优选实施方案中,该核酸探针是大肠杆菌NRRL B-30071中的质粒pFAMG所包含的所述成熟多肽编码区。在另一个优选实施方案中,该核酸探针是大肠杆菌NRRL B-30076中的质粒pQUINN所包含的所述成熟多肽编码区。
对于至少100个核苷酸长的长探针,极低到极高严紧条件定义为在标准Southern印迹程序之后,在5×SSPE、0.3% SDS、200μg/ml剪切的变性鲑精DNA和或者25%甲酰胺(对于极低和低严紧条件)或者35%甲酰胺(对于中等和中高严紧条件)或者50%甲酰胺(对于高和极高严紧条件)中于42℃进行预杂交和杂交。
对于至少100个核苷酸长的长探针,最后载体材料用2×SSC、0.2%SDS,优选至少在45℃(极低严紧条件),更优选至少在50℃(低严紧条件),更优选至少在55℃(中等严紧条件),更优选至少在60℃(中高严紧条件),甚至更优选至少在65℃(高严紧条件),最优选至少在70℃(极高严紧条件)洗涤三次,每次15分钟。
对于长约15个核苷酸到约70个核苷酸的短探针,严紧条件定义为在标准Southern印迹程序之后,在使用Bolton和McCarthy(1962,美国国家科学院院刊481390)的计算方法计算的Tm值以下5℃-10℃,于0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸二氢钠(sodium monobasic phosphate)、0.1mM ATP和0.2mg酵母RNA/ml中进行预杂交、杂交和杂交后的洗涤。
对于长约15个核苷酸到约70个核苷酸的短探针,载体材料在计算的Tm以下5℃-10℃用6×SCC加0.1%SDS洗涤一次,时间15分钟,用6×SSC洗涤两次,每次15分钟。
本发明还涉及通过如下步骤制备的分离核酸序列(a)在极低、低、中等、中高、高或极高的严紧条件下使DNA与(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸,(ii)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链杂交;和(b)从该DNA中分离出该核酸序列。该子序列优选是具有至少100个核苷酸的序列,例如编码多肽片段的序列。
在第四个实施方案中,本发明涉及编码具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的变体的分离核酸序列,其中所述变体包含了一或多个氨基酸的替代、缺失和/或插入。
该多肽变体的氨基酸序列与SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6,或其成熟多肽的氨基酸序列的差别可以是一个或多个氨基酸残基的插入或缺失和/或一个或多个氨基酸残基被不同的氨基酸残基替代。优选地,氨基酸的改变在性质上是较小的,即不显著影响该蛋白质的折叠和/或活性的保守氨基酸替换;小的缺失,典型的是1到约30个氨基酸的缺失;小的氨基或羧基末端突出,如氨基末端的甲硫氨酸残基;不超过约20-25个残基的小接头肽;或通过改变净电荷或其它功能便于纯化的小突出,如聚组氨酸片段、抗原表位或结合域。
保守替代的实例是以下各组内的替代碱性氨基酸组(精氨酸、赖氨酸和组氨酸),酸性氨基酸组(谷氨酸和天冬氨酸),极性氨基酸组(谷氨酰胺和天冬酰胺),疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸),芳香族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性的氨基酸替代是本领域已知的,并描述于例如H.Neurath和R.L.Hill,1979,蛋白质(The Proteins),Academic Press,纽约。最常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,以及它们的相反替代。
本发明的核酸序列可以获自任何属的微生物。为了本发明的目的,术语“获自”按本文中定义的方式使用。在一个优选实施方案中,由本发明核酸序列编码的多肽被分泌至细胞外。
本发明的核酸序列可以获自真菌来源,更优选获自酵母菌株,如假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或Yarrowia菌株;或更优选获自丝状真菌菌株如Acremonium、曲霉属、短梗霉属(Aureobasidium)、隐球酵母属(Cryptococcus)、Filibasidium、镰孢霉属、腐质霉属、Magnaporthe、毛霉属、毁丝霉属(Myceliophthora)、Neocallimastix、脉孢菌属、拟青霉属(Paecilomyces)、青霉属、Piromyces、裂褶菌属(Schizophyllum)、Talaromyces、嗜热子囊菌属(Thermoascus)、梭孢壳属、Tolypocladium或木霉属(Trichoderma)菌株。
在一个优选实施方案中,该核酸序列获自卡尔酵母、酿酒酵母、糖化酵母、Saccharomyces douglasii、克鲁弗酵母、诺地酵母或Saccharomyces oviformis菌株。
在另一个优选实施方案中,该核酸序列获自棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、Humicola insolens、Humicola lanuginosa、米黑毛霉、Myceliophthora thermophila、粗糙脉孢菌、产紫青霉、Trichodermaharzianum、康宁木霉、Trichoderma longibrachiatum、Trichodermareesei或绿色木霉菌株。
在另一个优选实施方案中,该核酸序列获自杆孢状镰孢、Fusariumcerealis、Fusarium crookwellense、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、Fusarium sulphureum、Fusariumtorulosum、Fusarium trichothecioides或Fusarium venenatum菌株。
在一个更优选的实施方案中,该核酸序列获自Fusarium venenatum,最优选获自Fusarium venenatum ATCC 20334,例如SEQ ID NO.1、SEQ IDNO.2或SEQ ID NO.3中所示的核酸序列。在另一个更优选的实施方案中,SEQ ID NO.1的核酸序列是大肠杆菌NRRL B-30067中的质粒pECO3所包含的序列。在另一个更优选的实施方案中,SEQ ID NO.2的核酸序列是大肠杆菌NRRL B-30071中的质粒pFAMG所包含的序列。在另一个更优选的实施方案中,SEQ ID NO.3的核酸序列是大肠杆菌NRRL B-30076中的质粒pQUINN所包含的序列。在另一个优选实施方案中,该核酸序列是编码成熟多肽的SEQ ID NO.1第4013-5743位核苷酸。在另一个优选实施方案中,该核酸序列是编码成熟多肽的SEQ ID NO.2第993-1593位核苷酸。在另一个优选实施方案中,该核酸序列是编码成熟多肽的SEQ ID NO.3第3061-3678位核苷酸。
应该理解,对于前面提及的种,本发明既包括完全和不完全阶段,及其它的分类学等同物,例如无性型,而不论它们被称为何种种名。本领域技术人员将容易识别出适合的等同物。
公众可容易地从许多培养物保藏中心获得这些种的菌株,这些培养物保藏中心例如美国典型培养物保藏中心(ATCC)、德意志微生物保藏中心(DSM)、真菌菌种保藏中心(CBS)和农业研究机构保藏中心(NRRL)。
而且,采用上述探针可从其它来源鉴定并获得这类核酸序列,这些来源包括从自然环境(如土壤、堆肥、水等)分离的微生物。从自然生活环境中分离微生物的技术是本领域熟知的。然后可以通过对另一种微生物的基因组或cDNA文库的相似筛选获得核酸序列。一旦用探针检测到编码多肽的核酸序列,即可利用本领域普通技术人员已知的技术(见例如Sambrook等,1989,同上)分离或克隆该序列。
本发明还涉及在SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的成熟多肽编码序列中含有至少一个突变的突变核酸序列,其中该突变核酸序列编码分别由SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸组成的多肽。
用于分离或克隆编码多肽的核酸序列的技术在本文中已有过描述。
本发明还涉及含有上述核苷酸序列的核酸结构、重组载体和宿主细胞。对于它们的构建可以采用前面描述的相同方法来进行。
本发明还涉及由上述核酸序列编码的多肽,以及采用本文描述的方法产生该多肽的方法。
本发明通过如下实施例作进一步描述,这些实施例不应理解为是对本发明范围的限制。
实施例用作缓冲液和底物的化学制品是至少试剂级别的商业产品。
培养基和溶液COVE痕量金属溶液每升由0.04g NaB4O7·10H2O、0.4g CuSO4·5H2O、1.2gFeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O组成。
50×COVE盐溶液每升由26g KCl、26g MgSO4·7H2O、76g KH2PO4和50mlCOVE痕量金属组成。
COVE培养基每升由342.3g蔗糖、20ml 50×COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl2和25g纯净琼脂组成。
50×Vogels培养基每升由150g柠檬酸钠、250g KH2PO4、10gMgSO4·7H2O、10g CaCl2·2H2O、2.5ml生物素贮存液和5.0ml AMG痕量金属溶液组成。
痕量金属溶液每升由14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5g NiCl2、13.8g FeSO4、8.5g MnSO4和3.0g柠檬酸组成。
COVE顶层琼脂每升由20ml 50×COVE盐、0.8M蔗糖、1.5M氯化铯、1.0M乙酰胺和10g低熔点琼脂糖组成,pH被调节至6.0。
BASTA顶层琼脂由补加了10mg/ml除草剂BastaTM(Hoechst Schering,Rodovre,丹麦)的COVE顶层琼脂组成。
RA孢子形成培养基每升由50g琥珀酸、12.1g NaNO3、1g蔗糖、20ml50×Vogels和0.5ml 10mg/ml NaMoSO4贮存液组成,pH被调节至6.0。
YEPG培养基每升由10g酵母提取物、20g蛋白胨和20g葡萄糖组成。
STC由0.8M山梨糖醇、25mM Tris pH 8、25mM CaCl2组成。
SPTC由40%PEG 4000、0.8M山梨糖醇、25mM Tris pH 8、25mM CaCl2组成。
M400Da培养基每升由50g麦芽糖糊精、2g MgSO4·7H2O、2g KH2PO4、4g柠檬酸、8g酵母提取物、2g尿素和1ml COVE痕量金属溶液组成。
实施例1Fusarium venenatum菌丝体组织的生产采用补料分批发酵方案,使用作为碳源的NUTRIOSETM(RoquetteFreres,S.A.,Beinheim,法国)和酵母提取物,将Fusarium venenatumATCC 20334的形态学突变体Fusarium venenatum CC1-3(Wiebe等,1991,Mycol.Research 951284-1288)培养在实验室规模的两升发酵罐中。pH维持在6-6.5,温度保持在30℃,并含有活性溶解氧(positivedissolved oxygen)。
在接种后第2、4、6和8天收获菌丝体样品,并在液氮中迅速冷冻。在将其破碎用于RNA提取之前,将这些样品保存在-80℃。
实施例2cDNA文库构建根据Timberlake和Barnard的方法(1981,细胞(Cell)2629-37)从实施例1中描述的菌丝体样品中提取总细胞RNA,从1%甲醛-琼脂糖凝胶上进行印迹之后通过Northern杂交分析该RNA样品(Davis等,1986,分子生物学基本方法(Basic Methods in Molecular Biology),ElsevierScience Publishing Co.,Inc.,纽约)。使用mRNA分离试剂盒(mRNASeparator KitTM)(Clontech Laboratories,Inc.,Palo Alto,CA)根据厂商说明从总RNA分离聚腺苷酸化mRNA部分。除了使用NotI-(dT)18引物(Pharmacia Biotech,Inc.,Piscataway,NJ)起始第一链合成之外,根据Gubler和Hoffman的方法(1983,基因(Gene)25263-269)使用大约5μg poly(A)+mRNA合成双链cDNA。用绿豆核酸酶(BoehringerMannheim Corporation,Indianapolis,IN)处理该cDNA,并用T4 DNA聚合酶(New England Biolabs,Beverly,MA)使末端平端化。
用NotI消化cDNA,通过琼脂糖凝胶电泳按大小选择片段(大约0.7-4.5kb),并与用NotI和EcoRV切割并经小牛小肠碱性磷酸酶(Boehringer Mannheim Corporation,Indianapolis,IN)去酸化的pZErO-2.1(Invitrogen Corporation,Carlsbad,CA)连接。使用该连接混合物转化大肠杆菌TOP10感受态细胞(Invitrogen Corporation,Carlsbad,CA)。在含有50μg/ml终浓度卡那霉素的2YT琼脂平板上筛选转化体(Miller,1992,细菌遗传学简短教程。关于大肠杆菌和相关细菌的实验室指南和手册(A Short Course in Bacterial Genetics.Alaboratory Manual and Handbook for Escherichia coli and RelatedBacteria),Cold Spring Harbor Press,Cold Spring Harbor,纽约)。
使用质粒克隆载体pZErO-2.1构建两个独立的定向(directional)cDNA文库。文库A使用第4天收获的菌丝体的mRNA制备,文库B使用从第6天时间点获得的mRNA构建。为了检验细胞中基因表达谱的代表性“瞬态图(snapshot)”,两个cDNA文库均没有扩增。相反地,将文库铺板,标定滴度,并通过DNA测序分析每个文库的独立克隆。
文库A(第4天的细胞)由大约7.5×104个独立克隆组成,文库B(第6天的细胞)由大约1.2×105个克隆组成。从每个文库中的40个菌落分离小量制备的DNA(Miniprep DNA),并检查cDNA插入片段的存在和大小。在该分析中,来自文库A的40个菌落中有39个(97.5%)含有大小在600bp至2200bp之间(平均=1050bp)的插入片段。相似地,来自文库B的40个菌落中39个(97.5%)含有大小在800bp至3600bp之间(平均=1380bp)的插入片段。
实施例3模板的制备和核苷酸序列测定从实施例2中描述的每个cDNA文库中,直接从转化平板挑取1192个转化体菌落至含有包含50μg/ml卡那霉素的200ul 2YT培养液(Miller,1992,见上)的96孔微量滴定板中。将微量滴定板在37℃不摇动孵育过夜。孵育之后,向每个孔加入100μl无菌的50%甘油。将转化体复制到第二个深盘型(deep dish)96孔微量培养板(Advanced GeneticTechnologies Corporation,Gaithersburg,MD)中,该微量培养板的每孔中含有1ml补充了50μg/ml卡那霉素的MagnificentBrothTM(MacConnell Research,San Diego,CA)。原始的微量滴定板冷冻储存在-80℃。第二个深盘型培养板于37℃旋转摇床上剧烈振荡(300rpm)孵育过夜。为防止溅出和交叉污染,以及允许充分的通气,用聚丙烯衬垫(Advanced Genetic Technologies Corporation,Gaithersburg,MD)和塑料微量滴定盘盖覆盖每个第二培养板。
使用Utterback等所修改的Advanced Genetic Technologies公司(Gaithersburg,MD)96孔小量制备试剂盒程序(1995,基因组科学技术(Genome Sci.Technol.)11-8),从每个孔分离DNA。使用Perkin-ElmerApplied Biosystems 377 XL型自动DNA测序仪(Perkin-Elmer AppliedBiosystems公司,Foster City,CA),采用染料终止物化学法(dye-terminator chemistry)(Giesecks等,1992,病毒学方法杂志(Journalof Virology Methods)3847-60)以及反向lac测序引物进行单侧(single-pass)DNA测序。
实施例4DNA序列数据分析仔细检查核苷酸序列数据的质量,给出少于或等于9.2的不适当间隔或超过3%的模糊水平的样品被丢弃或进行重新测序。借助于FACTURATM软件(Perkin Elmer Applied Biosystems,Inc.,Foster City,CA)修剪载体序列。此外,当模糊碱基信号数目增加时,在每个样品的末端截短序列。使用TIGR Assembler软件(Sutton,G.G.等,1995,基因组科学和技术(Genome Science and Technology)19019),将所有序列互相比较以构建重叠的毗连序列群,从而确定每个文库中提供的各种cDNA种类的多重性。最后,按三种框架翻译所有序列,并使用采用修改的Smith-Waterman算法的GeneAssistTM软件(Perkin Elmer AppliedBiosystems,Inc.,Foster City,CA)对非冗余数据库(NRDB)进行搜索,其中所述算法使用阈值为70的BLOSUM 62距阵。NRDB是由Genpept、Swiss-Prot和PIR数据库组合而来。
实施例5葡糖淀粉酶cDNA克隆的鉴定通过使用Applied Biosystems 377XL型自动DNA测序仪根据厂商说明进行随机cDNA克隆的部分测序,并按照实施例4所述将推导的氨基酸序列与NRDB中的序列进行比较,鉴定推测的葡糖淀粉酶克隆。从分析的2000多个cDNA序列中,来自文库A的2个克隆和来自文库B的9个克隆表现出与来自其它真菌和酵母的葡糖淀粉酶蛋白质具有氨基酸序列同源性。在以此方式发现的几个葡糖淀粉酶cDNA克隆中,基于其与粗糙脉孢菌(Geneseq蛋白质登录号R71034)和Humicola grisea(Trembl登录号Q12623)的葡糖淀粉酶氨基酸序列的比对,以及使用signal-P计算机程序(Nielsen等,1997,蛋白质工程(Protein Engineering)101-6)所检测到的可能信号肽的存在,推测一个克隆是全长的。选择含有质粒pFA0401、定名为大肠杆菌FA0401的克隆用作探针,以从Fusariumvenenatum克隆相应的葡糖淀粉酶基因组DNA序列(见实施例7)。
实施例6构建Fusarium venenatum的基因组DNA文库按照在Berka等(1998,Appl.Environ.Microbiol.64,4423-4427)的程序中详述的方法,在λZipLox中构建基因组文库。简单地说,用Tsp509I部分消化Fusarium venenatum的总细胞DNA,并在1%琼脂糖凝胶上进行大小分离。将在3-7kb大小范围内迁移的DNA片段切下,并采用Prep-a-Gene试剂(BioRad,Hercules,CA)将DNA从琼脂糖凝胶切块中洗脱出来。将洗脱的DNA片段与EcoRI切割并经去磷酸化的λZipLox载体臂(Life Technologies,Gaithersburg,MD)连接,连接混合物采用商业包装提取物(Stratagene,La Jolla,CA)进行包装。采用标准方法将该包装的DNA文库铺板,并在大肠杆菌Y1090ZL细胞上扩增,然后储存于4℃(Davis,R.W.,Botstein,D.,和Roth.J.R.,1980,高级细菌遗传学,遗传工程手册(Advanced Bacterial Genetics,A Manual for GeneticEngineering),Cold Spring Harbor Press,Cold Spring Harbor,NY)。
实施例7编码Fusarium venenatum葡糖淀粉酶的基因组DNA片段的分离,核苷酸测序和特性分析采用含有来自pFA0401(实施例5)的克隆cDNA插入片段的放射性标记探针片段,在高度严紧条件下(即,在50%甲酰胺、5×SSPE、0.3%SDS、200μg/ml剪切的变性鲑精DNA中45℃进行杂交;滤膜在含有0.1%SDS的0.2×SSPE中45℃洗涤一次,之后在无SDS的0.2×SSPE中于相同温度下洗涤两次),通过杂交(Davis等,1980,同上)筛选来自Fusariumvenenatum基因组DNA文库(实施例6)的大约50,000噬菌斑。在大肠杆菌Y1090ZL细胞上两次纯化给出杂交信号的噬菌斑,随后从λZipLox载体中切出单个克隆作为pZL1衍生物(D’Alessio等,1992,Focus1476)。DNA序列分析揭示,其中一个含有命名为pFAMG的质粒的克隆包含了完整的葡糖淀粉酶编码区以及分别包括了启动子和终止子区域的3.9kb 5’侧翼DNA和0.3kb 3’侧翼DNA(见图1)。
使用染料终止物化学法在Applied Biosystems 377 XL型自动DNA测序仪上对pFAMG中的克隆插入片段进行DNA序列测定。使用转座子插入策略(Primer Island Transposition试剂盒,Perkin-Elmer/AppliedBiosysytems,Inc.,Foster City,CA)产生连续序列。对来自pFAMG的葡糖淀粉酶基因组克隆进行测序,达到平均冗余4.2。
通过该基因组序列数据与葡糖淀粉酶cDNA序列的重叠群的比较,确定编码Fusarium venenatum葡糖淀粉酶的基因组DNA片段含有一个1743bp的开放阅读框,该阅读框被一个51bp的内含子中断并编码具有581个氨基酸的多肽。该核苷酸序列(SEQ ID NO.1)和推导的氨基酸序列(SEQ IDNO.4)显示在图1中。采用SignalP程序(Nielson等,1997,蛋白质工程101-6),预测了一个21个残基的信号肽,并经该葡糖淀粉酶蛋白质氨基端测序获得了证实(实施例8)。因此,成熟的葡糖淀粉酶由560个氨基酸组成。
使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)和Clustal方法(Higgins,1989,CABIOS 5151-153),采用同一性表和如下多序列比对参数进行真菌葡糖淀粉酶蛋白质序列的比较性对比空位罚分为10,空位长度罚分为10。两两对比参数是Ktuple=1、空位罚分=3、窗口=5和对角线=5。该对比显示,Fusarium venenatum的葡糖淀粉酶与下列其它真菌的葡糖淀粉酶具有一致性(括弧内为一致残基的百分数)粗糙脉孢霉[Swissprot P14804](47%)、黑曲霉[Swissprot P04064](46%)、Humicola grisea[Trembl Q12623](44%)、Hormoconis resinae[Swissprot Q03045](41%)、Corticium rolfsii[Q12596](41%)、Schizosaccharomyces pombe[Trembl 060087](31%)、和Rhizopus oryzae[Swissprot P07683](23%)。
实施例8Fusarium venenatum葡糖淀粉酶的氨基端序列分析通过8-16%Tris-甘氨酸SDS-PAGE(Novex,San Diego,CA)分离Fusarium venenatum发酵培养液(实施例1)样品中的蛋白质,然后采用10%甲醇(pH=11.0)中的10mM CAPS(3-[环己基氨基]-1-丙磺酸)25伏2小时将其电转印至PVDF膜上(Novex,San Diego,CA)。用40%甲醇/1%乙酸中的0.1%考马斯亮兰R250染色该PVDF膜20秒,并在50%乙醇中脱色以观察蛋白质条带。
切下迁移在大约65kDa的主要多肽种类,并在带有即时HPLC和液相三氟乙酸(TFA)递送的Applied Biosystems 476A蛋白质测序仪(PerkinElmer/Applied Biosystems Division,Foster City,CA)上对其进行N端测序。测序试剂来自Perkin Elmer/Applied Biosystems Division(Foster City,CA)。采用含有溶于水的3.5%四氢呋喃的A缓冲液以及18ml含有乙酸、乙酸钠和己磺酸钠的Premix浓缩物(Perkin Elmer/AppliedBiosystems Division,Foster City,CA)和含有乙腈的缓冲液B,通过即时HPLC检测乙内酰苯硫脲氨基酸。收集数据,并在Macintosh IIsi上采用Applied Biosystems 610数据分析软件进行分析。对着光源观察色谱以鉴定氨基酸,并由操作员确定。N-端分析产生蛋白质序列Ser-Pro-Ser-Lys-Asp-Asn-Ser-Leu-Glu-Arg-Phe-Ile-Asp-Lys-Gln-Ala-Asp-Ile-Ser(SEQ ID NO.4)。
实施例9鉴定编码推测的液泡相关蛋白质和未知的分泌基因产物的丰富cDNA克隆基于其在文库A和B(实施例2)的克隆中的相对丰度,再选择两种cDNA种类。
含有pFA0035的克隆FA0035编码具有18个氨基酸可能信号肽的200个氨基酸初级翻译产物,其中该可能信号肽是采用Signal-P计算机程序(Nielsen等,1997,同上)检测到的。克隆FA0035占文库A中cDNA克隆的大约1.9%,而占文库B中cDNA克隆的大约0.8%。按实施例4所述将克隆FA0035的推导氨基酸序列与NRDB中的序列进行比较,结果显示与任何已知的蛋白质序列均没有显著的同源性,因此将其划为未知开放阅读框(ORF)。该克隆被任意命名为“Daria”。
含有pFA0759的克隆FA0759编码与粗糙脉孢霉液泡相关蛋白质的推测亚基(Trembl登录号P87252)有72%氨基酸序列一致性的具有187个氨基酸的多肽。由于采用Signal-P软件没有检测到信号肽,所以该基因产物似乎并不是分泌蛋白。克隆FA0759占文库A中cDNA克隆的大约2.0%,而占文库B中cDNA克隆的大约1.5%。
实施例10编码未知基因“Daria”和推测的液泡相关蛋白质的基因组DNA片段的克隆和核苷酸序列分析通过筛选实施例6和7所述的λZipLox文库分离编码未知分泌蛋白质“Daria”和推测的液泡相关蛋白质的Fusarium venenatum基因组DNA片段。对来自质粒pFA0035和pFA0759的cDNA插入片段进行放射性标记,将其用作探针筛选文库。将在实施例7的相同条件下与任一探针强杂交的噬菌斑在大肠杆菌Y1090ZL细胞上进行两次纯化,随后从λZipLox载体中切下各个克隆作为pZL1衍生物(D’Alessio等,1992,同上)。
DNA序列分析揭示,其中一个含有命为pECO3的质粒的克隆含有完整的“Daria”编码区以及分别包括了启动子和终止子区域的0.9kb 5’侧翼和0.9kb 3’侧翼DNA。该核苷酸序列(SEQ ID NO.2)和推导的氨基酸序列(SEQID NO.5)显示于图2。该编码区被一个55bp内含子打断。
相似地,用来源于pFA0579 cDNA插入片段的放射性标记探针,通过筛选λZipLox文库分离基因组DNA克隆。命名为pQUINN的基因组克隆编码完整的液泡相关蛋白质亚基以及分别包含了启动子和终止子区域的3.0kb 5’侧翼和0.3kb 3’侧翼DNA。该核苷酸序列(SEQ ID NO.3)和推导的氨基酸序列(SEQ ID NO.6)显示于图3。该基因组克隆和cDNA克隆之间的序列比较揭示,在该推测的液泡相关蛋白质亚基的5’非翻译区中存在一个594bp的内含子。此外,该编码还含有一个77bp的内含子。
实施例11pDM181的构建采用拼接重叠延伸技术构建质粒pDM181,以将1.2kb尖镰孢胰蛋白酶启动子与1.1kb尖镰孢胰蛋白酶终止子融合在一起。作为重叠PCR策略的一部分,将含有SwaI、KpnI和PacI限制性位点的多位点接头插入该启动子和终止子之间。在启动子的5’末端添加一个XhoI位点,并保留天然的EcoRI位点。在终止子的3’末端,通过PCR反应引入EcoRI、HindIII和NsiI位点。
使用如下引物从质粒pJRoy20(Royer等,1995,生物技术(Biotechnology)131479-1483)产生含有尖镰孢胰蛋白酶启动子第-1208至-1位序列和25个碱基对多位点接头的PCR片段引物1(有义)5’-GAGCTCGAGGAATTCTTACAAACCTTCAAC-3’(SEQ ID NO.7)Xhol EcoRI引物2(反义)5’-TTAATTAAGGTACCTGAATTTAAATGGTGAAGAGATAGATATCCAAG-3’(SEQ ID NO.8PacI KpnI SwaI100μl PCR反应物含有10ng pJRoy20,每个引物各50pmol,1×Pwo缓冲液(Boehringer Mannheim,Indianapolis,IN),dATP、dCTP、dGTP和dTTP各200μM,和5单位Pwo DNA聚合酶(Boehringer Mannheim,Indianapolis,IN)。所用的PCR条件是95℃ 3分钟,之后25个循环,每个循环包括95℃ 30秒、50℃ 1分钟和72℃ 1分钟。最后的延伸循环是72℃ 5分钟。
使用相同的PCR条件和如下引物,从质粒pJRoy20产生含有尖镰孢胰蛋白酶启动子的第-5到-1位碱基对、25个碱基对的多位点接头和尖镰孢胰蛋白酶基因3’非翻译区的1060个碱基对(终止子区)的第二个PCR片段引物3(有义)5’-TCACCATTTAAATTCAGGTACCTTAATTAAATTCCTTGTTGGAAGCGTCGA-3’(SEQ IDNO.9)SwaI KpnIPacI引物4(反义)5’-TGGTATGCATAAGCTTGAATTCAGGTAAACAAGATATAATTT-3’(SEQ ID NO.10)NsiI HindIII EcoRI使用0.2μl第一次PCR(启动子)反应产物和3μl第二次(终止子)反应产物作为模板,以及引物1和4,获得含有尖镰孢胰蛋白酶启动子第-1208到-1位、25个碱基对的多位点接头和尖镰孢胰蛋白酶终止子的1060个碱基对的最终2.3kb重叠PCR片段。所用PCR条件是95℃ 3分钟,之后30个循环,每个循环包括95℃ 30秒、62℃ 1分钟和72℃ 3分钟。最后的延伸循环是72℃ 5分钟。该反应也使用Pwo DNA聚合酶。
将所获的含有胰蛋白酶启动子、多位点接头和胰蛋白酶终止子的2.3kb片段用EcoRI消化,并连入EcoRI消化的含有bar基因的载体pMT1612(WO 97/26330)中产生pDM181(图4)。
实施例12质粒pSheB1的构建通过修饰pDM181产生Fusarium venenatum表达载体pSheB1(图5)。修饰包括(a)去除pDM181序列中的两个NcoI位点,和(b)重新恢复尖镰孢胰蛋白酶启动子的天然翻译起始(在ATG起始密码子处重新构建一个NcoI位点)。
使用QuikChangeTM定点诱变试剂盒(Stratagene Cloning Systems,LaJolla,CA),根据厂商说明使用如下诱变引物对实现pDM181序列中两个NcoI位点的去除5’-dCAGTGAATTGGCCTCGATGGCCGCGGCCGCGAATT-3’(SEQ ID NO.11)和5’-dAATTCGCGGCCGCGGCCATCGAGGCCAATTCACTG-3’(SEQ ID NO.12)5’-dCACGAAGGAAAGACGATGGCTTTCACGGTGTCTG-3’(SEQ ID NO.13)和5’-dCAGACACCGTGAAAGCCATCGTCTTTCCTTCGTG-3’(SEQ ID NO.14)使用QuikChangeTM定点诱变试剂盒以及如下诱变引物对也实现了尖镰孢胰蛋白酶启动子天然翻译起始的重新恢复5’-dCTATCTCTTCACCATGGTACCTTAATTAAATACCTTGTTGGAAGCG-3’(SEQ IDNO.11)和5’-dCGCTTCCAACAAGGTATTTAATTAAGGTACCATGGTGAAGAGATAG-3’(SEQ IDNO.12)所有定点改变均通过合适载体区的DNA序列分析确证。
实施例13pDM194和pDM218的构建用于在Fusarium venenatum中获得Thermomyces lanuginosus(原称Humicola lanuginose)脂酶表达的7.8kb质粒pDM194(7.8kb)具有如下基因元件含有尖镰孢胰蛋白酶基因启动子(Royer等,1995,同上)的1.2kb DNA片段。
含有Thermomyces lanuginosus脂酶cDNA(EP 305 216)的0.9kb DNA片段。
含有尖镰孢胰蛋白酶基因终止子(Royer等,1995,同上)的1.1kb DNA片段。
来自pMT1612(WO 98/11203)的含有2.8kb大肠杆菌载体pUC19和一个1.8kb片段的4.7kb DNA片段,其中所述1.8kb片段含有构巢曲霉amdS基因启动子(Hynes等,1988,分子细胞生物学(Mol.Cell Biol.)82589-2596)、吸水链霉菌膦丝菌素乙酰转移酶(bar)基因(Thompson等,1987,EMBO Journal 62519-2514)、和黑曲霉AMG终止子。
通过PCR产生SwaI/PacI脂酶片段。采用含有Thermomyceslanuginosus脂酶基因(EP 305 216)cDNA的质粒pMHan37作为模板。以下显示的引物5和6用于在该脂酶编码区的5’末端引入一个SwaI位点和在3’末端引入一个PacI位点。
引物5(有义)5’-ATTTAAATGATGAGGAGCTCCCTTGTGCTG-3’(SEQ ID NO.17)SwaI引物6(反义)5’-TTAATTAACTAGAGTCGACCCAGCCGCGC-3’(SEQ ID NO.18)PacI100μl PCR反应物含有1ong pMHan37,每个引物各50pmol,1×PCR缓冲液(Perkin-Elmer Corp.,Branchburg,NJ),dATP、dCTP、dGTP和dTTP各250uM,和5单位Taq DNA聚合酶(Perkin-Elmer Corp.,Branchburg,NJ)。所用的PCR条件是95℃ 5分钟一个循环,之后30个循环,每个循环包括95℃ 1分钟、55℃ 1分钟和72℃ 2分钟。根据厂家说明将0.9kb PCR产物亚克隆在TA克隆试剂盒(Invitrogen,Carlsbad,CA)的pCRII中。采用Qiagen Maxiprep试剂盒(Qiagen,Santa Clarita,CA)分离质粒DNA,用SwaI和PacI消化,之后在1%琼脂糖凝胶上100伏电泳1小时。切下该0.9kb片段,采用SpinBind试剂盒(FMC,Rockland,ME)纯化,并克隆至pBANe6(WO 98/11203)中,产生pBANe8。
用SwaI和PacI消化pBANe8,并将该0.9kb脂酶片段与SwaI/PacI消化的pDM181连接,产生脂酶表达质粒pDM194(图6)。
从pJRoy35(图7)构建pDM218。通过PCR在尖镰孢胰蛋白酶启动子5’末端引入NotI和PmeI限制性位点。采用pDM181作为模板,利用如下引物,制备含有该启动子5’末端的362bp扩增子multi 15’-ATAAGAATGCGGCCGCTAGTTTAAACTTACAAACCTTCAACAGTG-3’(SEQID NO.19)multi 25’-TAGCATCTATCTCCGTCTT-3’(SEQ ID NO.20)100μl PCR反应物含有150ng 3kb EcoRI片段、每个引物各50pmol、1×Pwo缓冲液,dATP、dCTP、dGTP和dTTP各200uM,和5单位Pwo DNA聚合酶。所用的PCR条件是95℃ 3分钟一个循环;之后30个循环,每个循环包括95℃ 1分钟、50℃ 1分钟和72℃ 1.5分钟;之后72℃延伸5分钟。将该扩增子亚克隆至pCR-Blunt载体(Invitrogen,Carlsbad,CA)中。在1%琼脂糖凝胶上100伏电泳0.25kb NotI/BcuI片段1小时,将其切下并采用QIAquick凝胶提取试剂盒(Qiagen,Santa Clarita,CA)进行纯化。
通过PCR在尖镰孢胰蛋白酶终止子3’末端引入HpaI、SnaBI和PpuMI位点。采用该3kb EcoRI片段作为模板,利用如下引物,制备含有该胰蛋白酶终止子3’末端的714bp扩增子multi35’-GTGTGCAGTGACCCAGAAT-3’(SEQ ID NO.21),multi45’-GATTGGGTCCCTACGTAGTTAACACTATAGGCCATCGTTTAC-3’(SEQ IDNO.22)100μl PCR反应物含有每个引物各50pmol、150ng 3kb EcoRI片段、1×Pwo缓冲液,dATP、dCTP、dGTP和dTTP各200uM,和5单位Pwo DNA聚合酶。所用的PCR条件与上面列出的条件相同。将该扩增子亚克隆至pCR-Blunt载体中。按以上所述分离0.62kb NheI/PpuMI片段。
从pDM194分离含有尖镰孢胰蛋白酶启动子3’末端、Humicolalanuginosa脂酶基因(Geneseq核苷酸登录号N91076)、和尖镰孢胰蛋白酶终止子5’末端的2.3kb BcuI/NheI片段。
将该0.25kb NotI/BcuI片段、2.3kb BcuI/NheI片段和0.62kbNheI/PpuMI片段一起克隆在用NotI部分消化和用PpuMI完全消化的pDM194中,产生pDM218(图8)。
实施例14质粒pMWR60的构建质粒pMWR60来源于pEJG25A表达载体。pEJG25A是按如下步骤通过在pDM181(实施例11)中插入一段来自Peniophora lycii的肌醇六磷酸酶编码序列(WO 98/28408)构建的首先,设计了两个合成的寡核苷酸引物(显示于下),从质粒pAlphy2(WO 98/28408)模板通过PCR扩增Peniophora lyci肌醇六磷酸酶编码序列。
正向引物5’-ATTTAAATATGGTTTCTTCGGCATTCGC-3’(SEQ ID NO.23)反向引物5’-TTAATTAACTATTCCGACGGAACAAAGC-3’(SEQ ID NO.24)(粗体字母表示编码序列)每个100μl Pwo聚合酶反应含有每个引物各50pmol、1ng模板DNA、2μl 10mM dNTPs,1×Pwo聚合酶缓冲液,和2.5单位Pwo聚合酶。在PerkinElmer 9600型热循环仪中按如下程序孵育这些反应物94℃ 2分钟、55℃ 30秒和72℃ 1分钟,1个循环;94℃ 15秒、55℃ 30秒和72℃ 1分钟,9个循环;94℃ 15秒、55℃ 30秒和72℃ 1分钟,15个循环,每个循环延长20秒;最后一个循环,94℃ 15秒、55℃ 30秒和72℃ 7分钟;之后为一个4℃保温循环。在1%琼脂糖凝胶上100伏电泳该反应产物1小时。切下1.3kb条带,并采用Qiaex II纯化。随后将该纯化的PCR产物克隆在质粒pCR2.1(Invitrogen,Carlsbad,CA)中,用于转化大肠杆菌TOP10细菌(Invitrogen,Carlsbad,CA)。从几个转化菌落中分离质粒DNA,并通过DNA序列测定进行分析以确保在PCR期间没有引入突变。随后用限制性内切酶SwaI和PacI消化一个肌醇六磷酸酶克隆。在1%琼脂糖凝胶上100伏电泳这些片段1小时,将其切下并采用QiaexII纯化。将1.3kb肌醇六磷酸酶基因片段与预先经SwaI和PacI切割的pDM181(实施例11)连接,产生表达质粒pEJG25A(图9)。
为了除去5’侧翼DNA中的外源接头序列,采用Quick-ChangeTM定点诱变试剂盒以及下列寡核苷酸引物诱变pEJG25A,获得载体pMWR60-Int2引物A5’-CTCTTGGATATCTATCTCTTCACCATGGTTTCTTCGGCATTCGC-3’(SEQ IDNO.25)引物B5’-GCGAATGCCGAAGAAACCATGGTGAAGAGTAGATATCCAAGAG-3’(SEQ IDNO.26)
通过DNA序列分析验证了这些设计的核苷酸变化。
然后用SfuI和NheI消化pMWR60-Int2,在1%琼脂糖凝胶上100伏电泳该1.8kb片段1小时,将其切下并采用QiaexII纯化。将该分离的片段与pDM218的SfuI-NheI载体片段连接,产生一个新的中间物,称为pMWR60-Int3。用NotI切割该中间物,按以上所述纯化5.35kb片段。将该纯化片段与预先经NotI消化过的pSheB1(描述于实施例12)连接。所获中间物命名为pMWR60-Int4a。然后用BspLU11I和NheI切割pMWR60-Int4a,并按以上所述纯化5.25kb片段。该分离的片段与也经BspLU11I和NheI消化、并按上述纯化的pSheB1连接。所获载体产物命名为pMWR60(图10)。
实施例15脂酶报道基因的制备为了构建称为LIPOLASETM的Humicola lanuginosa脂酶(Novo NordiskA/S,Bagsvard,丹麦)的变体,根据厂家说明使用Chameleon双链定点诱变试剂盒。
从pAHL(WO 92/05249)获得编码该LIPOLASETM酶的基因。根据厂家说明,利用引物7258将pAHL氨苄青霉素基因的ScaI位点改变为MluI位点,由此改变氨苄青霉素抗性基因中ScaI位点并换为MluI切割位点。
引物72585’-GAATGACTTGGTTGACGGGTCACCAGTCAC-3’(SEQ ID NO.27)然后将含有LIPOLASETM基因的pAHL载体作为模板,和寡聚物7258和7770一起用于DNA聚合酶扩增,由此改变LIPOLASETM基因中的ScaI位点,而又不改变氨基酸序列位置。
引物77705’-TCTAGCCCAGAATACTGGATCAAATC-3’(SEQ ID NO.28)通过加入含有期望突变的适合寡聚物,在LIPOLASETM基因中引入期望突变(例如半胱氨酸的引入)。
使用上述的定点诱变和以下引物构建含有编码LIPOLASETM变体1S,E239C,Q249R的基因的质粒以下显示的引物106659用于引入E99N,N101S。
引物107581
5’-CTTAACTTTGACTTGAAAAACATATCTGACATTTGCTCC-3’(SEQ ID NO.29)以下显示的引物101782用于引入SPPCGRRP(-E)。
引物1017825’-GGACGGCCTTGGCTAGCCCTCCGTGCGGCCGCCGGCCGGTCTCGCAGGATCTGTTTAAC-3’(SEQ ID NO.30)以下显示的引物9639用于引入E239C。
引物96395’-ATATCGTGAAGATATGCGGCATTGATGCCACC-3’(SEQ ID NO.31)以下显示的引物8829用于引入Q249R。
引物88295’-GGCGGCAATAACCGGCCGAACATTCCGGATATCCC-3’(SEQ ID NO.32)通过对该完整基因测序验证了这些突变。所获质粒命名为pEVi1163。
实施例16pRaMB60的构建通过来自pMWR60的6.5kb SfuI-NheI载体片段与来自pSheB1的0.5kbSfuI-NheI片段连接,构建质粒pRaMB60。通过琼脂糖凝胶电泳分离所有片段,然后采用BioRad Prep-a-Gene试剂(BioRad Laboratories,Hercules,CA)从凝胶切块中将其纯化出来。
实施例17含有葡糖淀粉酶启动子的表达载体pRaMB62的构建采用以下引物和Quick-ChangeTM诱变试剂盒,通过质粒pFAMG的定点诱变产生单一BspLU11I位点引物15’-dCACTGCTATACCCAACATGTTTACTCAAGTCC-3’(SEQ ID NO.33)引物25’-dGGACTTGAGTAAACATGTTGGTGATAGCAGTG-3’(SEQ ID NO.34)通过DNA序列测定验证该定点改变,所获质粒衍生物命名为pMWR62-Int1。
接着,采用质粒pEVi1163作为模板并利用下列引物,通过PCR扩增实施例15中所述的脂酶报道基因,所述引物在该脂酶编码区的起始密码子附近引入一个BspHI位点,在终止密码子之后引入一个PacI位点
正向引物5’-GACTCATGAGGAGCTCCCTTGTGCTGTTC-3’(SEQ ID NO.35)反向引物5’-TGATTAATTAACCTAAAGACATGTCCCAATTAAC-3’(SEQ IDNO.36)该PCR反应物由1μl模板DNA(10ng)、1μl正向引物(77pmol)、1μl反向引物(81pmol)、10μl 10×Pwo聚合酶缓冲液、16μl 1.25mM dNTP混合物、和1μl(2.5个单位)Pwo聚合酶组成。采用以下温度设置在Perkin-Elmer 480型热循环仪中孵育该反应物94℃ 5分钟1个循环;95℃ 1分钟、47℃ 1分钟和68℃ 2分钟,30个循环;以及4℃保温循环。
然后用BspHI和PacI消化该扩增产物,通过琼脂糖凝胶电泳纯化(实施例16),之后和pRaMB60的5.8kb PmeI-NcoI片段以及pMWR62-Int1的2.1kb StuI-BspLU11I片段一起用于三部分连接。所获载体命名为pRaMB62(图11),含有处于Fusarium venenatum葡糖淀粉酶启动子控制下的脂酶报道基因。
实施例18含有“Daria”启动子的表达载体pRaMB64质粒的构建采用PCR和以下设计分别在启动子片段的5’和3’末端引入SwaI和BspLU11I位点的引物对,扩增称为“Daria”启动子的pECO3启动子区域(实施例10)引物15’-GCATTTAAATTACTACTGTGATGTG-3’(SEQ ID NO.37)引物25’-GATTGATTGGAAACACATGTTGATG-3’(SEQ ID NO.38)该PCR反应物由1μl pECO3(10ng)、1μl正向引物(50pmol)、1μl反向引物(50pmol)、10μl 10×Pwo聚合酶缓冲液、16μl 1.25mM dNTP混合物、和1μl(2.5个单位)Pwo聚合酶组成。采用以下温度设置在Perkin-Elmer 480型热循环仪中孵育该反应物95℃ 5分钟1个循环;95℃ 1分钟、47℃ 1分钟和68℃ 2分钟,30个循环;以及4℃保温循环。
该0.9kb PCR产物在1%琼脂糖凝胶上100伏电泳1小时,切下并采用Qiaex II纯化。
将该扩增DNA片段亚克隆至pCR2.1(Invitrogen,Carlsbad,CA)中,然后通过SwaI、BspLU11I、EcoRI和XhoI限制性酶切割进行分析以验证其正确性。以此方式产生的质粒命名为pECO4,用SwaI和BspLU11I消化之,并按实施例16所述方法通过凝胶电泳纯化该0.9kb启动子片段。将该纯化片段与pRaMB60的5.8kb PmeI-NcoI片段以及编码该脂酶报道基因的0.9kb BspHI-PacI片段混合进行三部分连接。该连接产物pRaMB64(图12)含有指导该脂酶报道基因表达的“Daria”启动子。
实施例19含有来源于液泡相关蛋白质基因的启动子的表达载体pRaMB66质粒的构建采用下列引物通过PCR扩增来自编码推测的液泡相关蛋白质的pQUINN(实施例10)的启动子片段,所述引物在该启动子的5’和3’末端分别引入SmaI位点和NcoI位点引物15’-dCGACCCGGGAATTAGAGAGGTTAGG-3’(SEQ ID NO.39)引物25’-dCGTATAACCCATGGTGGACTTGTCGGAC-3’(SEQ ID NO.40)该PCR反应物由1μl pQUINN(10ng)、1μl正向引物(50pmol)、1μl反向引物(50pmol)、10μl 10×Pwo聚合酶缓冲液、16μl 1.25mM dNTP混合物、和1μl(2.5个单位)Pwo聚合酶组成。采用以下温度设置在Perkin-Elmer 480型热循环仪中孵育该反应物95℃ 5分钟1个循环;95℃ 1分钟、47℃ 1分钟和68℃ 2分钟,30个循环;以及4℃保温循环。
该3.1kb扩增DNA片段在1%琼脂糖凝胶上100伏电泳1小时,切下并采用Qiaex II纯化。
将该3.1kb扩增DNA片段亚克隆至pCR-Script(Stratagene,La Jolla,CA)中,产生中间质粒pQUINN-启动子A。从该质粒分离两个限制性片段一个2.4kb SmaI-NdeI片段,和一个0.7kb NdeI-NcoI片段(这两个片段一起包括了该完整启动子区域)。将该分离片段与pRaMB60的8kbPmeI-NcoI片段和前面实施例中所述编码脂酶报道基因的0.9kb BspHI-PacI片段混合进行四部分连接。该连接产物pRaMB66(图13)含有处于推测的液泡相关蛋白质基因启动子转录控制之下的脂酶报道基因。
实施例20在Fusarium venenatum中表达位于AMG、“Daria”和液泡相关蛋白质的启动子控制下的脂酶报道基因通过用从添加了2.5%葡萄糖和2.5mM硝酸钠的1×Vogels培养基平板(2.5%纯净琼脂)获得的10个孢塞(plug)接种一个含有500ml RA孢子形成培养基的三角瓶中,28℃、150rpm孵育2-3天,产生Fusariumvenenatum CC1-3(MLY-3)的孢子。通过Miracloth(Calbiochem,San Diego,CA)收获孢子,并在Sorvall RC-5B离心机(E.I.DuPont De Nemours andCo.,Wilmington,DE)内以7000rpm离心20分钟。用无菌蒸馏水洗涤沉淀的孢子两次,重悬在少量水中,然后采用血细胞计数器计数。
通过将4×107个Fusarium venenatum CC1-3孢子接种在100ml YEPG培养基中,于24℃、150rpm孵育16小时,制备原生质体。培养物在SorvallRT 6000D(E.I.DuPont De Nemours and Co.,Wilmington,DE)中以3500rpm离心7分钟。用30ml 1M MgSO4洗涤沉淀两次,并重悬在15ml含有5mg/mlNOVOZYME 234TM(batch PPM 4356,Novo Nordisk A/S,Bagsvrd,丹麦)的1M MgSO4中。培养物于24℃、150rpm孵育,直到原生质体形成。向原生质体消化物中加入35ml体积的2M山梨糖醇,该混合物以2500rpm离心10分钟。重悬沉淀,用STC洗涤两次,并以2000rpm离心10分钟沉淀原生质体。用血细胞计数器计数原生质体,并将其重悬在8∶2∶0.1的STC∶SPTC∶DMSO溶液中至终浓度1.25×107个原生质体/ml。在NalgeneCryo 1℃冷冻箱(VWR Scientific,Inc.,San Francisco,CA)中控制速率地进行冷冻后,将该原生质体保存在-80℃。
在冰上融解冷冻的Fusarium venenatum CC1-3原生质体。在各个50ml无菌聚丙烯管中加入5-10μg pRaMB62、pRaMB64和pRaMB64(描述于实施例17-19中)以及5μl肝素(每ml STC含5mg)。每管加入100μl原生质体,轻柔混合,并在冰上孵育30分钟。加入1ml SPTC并在室温孵育20分钟。加入25ml 40℃ COVE顶层琼脂糖后,将每管中的混合物铺在空的150mm直径平板上,并于室温孵育过夜。大约24小时后,在平板顶部再铺上含有10mg BASTATM/ml的另外25ml 40℃ COVE顶层琼脂糖,并在室温孵育长达14天。除草剂BASTATM中的活性成分是膦丝菌素。BASTATM从AgrEvo(Hoechst Schering,Rodovre,丹麦)获得,并在使用前用酚∶氯仿∶异戊醇(25∶24∶1)抽提两次,用氯仿∶异戊醇(24∶1)抽提一次。
从筛选平板(COVE底层,COVE-BASTATM覆盖层)直接挑取转化体至含有25ml添加了1mM CaCl2和100μg/ml氨苄青霉素(防止细菌污染)的M400Da培养基的125ml摇瓶中,并于28℃、200rpm在平台摇床上孵育7天。还包括未转化受体株作为阴性对照。
在第7天从摇瓶取样。通过离心除去细胞,然后将每个上清样品10μl与等体积Tris-甘氨酸样品缓冲液(Novex Experimental Technology,San Diego,CA)一起加热至95℃ 5分钟。在10-20%Tris-甘氨酸梯度凝胶(Novex Experimental Technology,San Diego,CA)上分离变性的上清液蛋白,并用考马斯兰染色。SDS-PAGE分析显示,产生脂酶的转化体分泌一种表观分子量为大约43kDa的主要多肽。
相似地,采用对硝基苯丁酸作为底物分析来自每个转化体的无细胞培养液的脂酶活性(Royer等,1995,同上)。
结果显示于表1,这些结果表明,采用存在于pRaMB62、pRaMB64和pRaMB66中的Fusarium venenatum启动子元件表达并分泌了活性脂酶。
表1
实施例21比较处于Fusarium venenatum淀粉葡萄糖苷酶启动子和尖镰孢胰蛋白酶启动子控制之下的Humicola lanuginosa脂酶报道基因的表达将按实施例20所述制备的含有pRamB64(实施例17)或pDM218(实施例18)的Fusarium venenatum CC1-3转化体,于pH6.25含有适合碳源、氮源和痕量金属源并补加了尿素或磷酸铵作为饲料的2升发酵罐中,29℃、1200rpm培养180小时。采用对硝基苯丁酸作为底物(Royer等,1995,同上)在180个小时内每隔18-24个小时分析每个发酵物的无细胞培养液的脂酶活性。
图14显示了在Fusarium venenatum中处于Fusarium venenatum淀粉葡萄糖苷酶(pAMG)启动子或尖镰孢胰蛋白酶(pSP387)启动子控制下的Humicola lanuginosa脂酶报道基因表达的比较。结果说明,无论在饲料中采用尿素还是磷酸铵作为氮源,采用Fusarium venenatum淀粉葡萄糖苷酶启动子比采用尖镰孢胰蛋白酶启动子可以获得更高水平的脂酶活性。而且,当在饲料中采用磷酸铵时,观察到更高的脂酶活性水平。
生物材料的保藏如下生物材料已根据布达佩斯条约保藏在农业研究机构保藏中心,1815 University Street,Peoria,Illinois,61640,并给予了如下保藏号保藏物 保藏号 保藏日期大肠杆菌TOP10(pECO3)NRRL B-300671998年10月27日大肠杆菌DH10B(pFAMG)NRRL B-300711998年10月27日大肠杆菌DH10B(pQUINN) NRRL B-300751998年10月27日大肠杆菌TOP10(pFB0346) NRRL B-300731998年10月27日这些菌株在如下条件下保藏,即确保在本专利申请未决期间由专利和商标局局长依照37C.F.R.§1.14和35U.S.C.§122授权的人可获得该培养物。该保藏物代表该保藏菌株基本上纯的培养物。如果在本主题申请的等同申请或其派生申请提出的国家该外国专利法要求,可以获得该保藏物。但是,应当理解,可获得保藏物并不构成以损失政府法令所授予专利权利而实施本主题发明的许可。
本文描述和要求保护的本发明的范围并不被本文公开的具体实施方案限制,因为这些实施方案旨在用作本发明几个方面的举例说明。任何等同的实施方案都包括在本发明的范围中。实际上,从前面的描述来看,除了本文给出和描述的之外本发明的各种修改将为本领域技术人员所明了。这些修改也包括在所附权利要求的范围内。在冲突的情况下,包括定义在内的本公开将优先。
本文引用了各种参考文献,它们的公开以参考文献的方式完整地并入本文。
序列表<110>Berka,RandyRey,MichaelBrown,Kimberly<120>用于在真菌细胞中表达基因的启动子<130>5611.204-WO<140>PCT/US00/07815<141>2000-03-22<150>09/274,449<151>1999-03-22<160>40<170>FastSEQ for Windows Version 4.0<210>1<211>6050<212>DNA<213>镰孢霉属<400>1aatttcgtcg atagcgaggg actcctggcc ctcgaattta gttagcgtat cagtgtaaag60tgctgggttc tccaggcgta agtaaattga accagatgtt agctcccaga tttcgccccg120aagccggttg ggcagaccaa cgcggataag tttatggaaa gttggttggc ggatcaatgt180aaagttcctg ccattgtcac gcagatactc ggcccaaaga cgcatctttg ccctatcgcg240caactttttt gggtccccag gatatcggaa gagcattcct aagccagcat ctggtgggag300atcgttcttc ttatcttcgg ttcttaaaag atgttcagag taacactcag cagcaactcg360acgcaacttg gctacgttgc caacgcctgc tctaagaccc ttcttgaggc cgtcacagaa420acgttcgcag gactgtctgg ttccagcgag atggattgtt atgcgttgtt ctcgggggtc480tctcttgtct ttagaggtat cggcaagaag gccattccac gtagtcagag cgagtgcgaa540ctataaccag gcaacgtcag aatttgtacc atgcaagatt tttataccac atacctggaa600gttctggcta ttcaagcgct ctacccttcg tatagcacat aaaggaaatg tgaatccatt660gccactgggt cctcctccgt gtgtctggcc ggtaaaagcg gtcgaggttg aaaggctagc720agattgcaca aagctagtgg gtgttgttga gaagcacatg taatgctctg acaggtgtag780cttgccagca taatgccatc ctcgatcgtg atccttatca ccgtgagtag cgttggaggg840cgggatagta agctcggcgt tgatctcgta gaggggcgcc tgagaggcgg gcaagcgaaa900ttggctctga aatagcgatg actttgaggg attccgatct gaactggata gattgagccc960ctgggtagga tcgataagct gctgggcttt ttgaacgatg ttggtgaagt tcgaaaacat1020gatttcggtc agcggcgcat gacgaggggg gttccggtcc aggagggagg tcgcggctga1080gcttgaagga gatgcaagac acgaagcgaa agacacgaag agagcgcaag agtctgagta1140tgtgcaacca ggctcgaata agtgcaaggc aggcagaagt acggaataga cgatagaatt1200gagtatagaa aggctgaatg gaagatggag acgagttata ggacggtgga gatagagtgg1260agttgaagtt gaacgaagct gcgtcaggtc cagatacggg agactggcca tcaactactg1320gccaggtagc cagggcgcga tgggcgggtg ggcagggtcg cgggggggac ctcagggcat1380tcctttctcc aagggccgct ggggctatgg acggggctgg ctgaactcca gccgtcatgg1440gatagcggtg caagagatca ggtactaagt ctaccatgat aatttagggg gcagagaaaa1500atgatatatt tgtttagtag taagcgggtt tttacagttg aggaaccaac cttcttcatt1560tatttattct ttctttctct gcaattcagt cctttttctt aaatagaata tctaccaatg1620gaacggcgtg gctgaagtgg ctgaagaata tagctcgagc tgtcaaaccg ctcatcctac1680taccctaggt ataaagctgg gaactaagac tcatttctat ccaactcatc atattgggag1740
ttagtgtaga cctgtcggcc tagagaatat gtgtatctgc atactttcaa ataccctacg1800tatacccact atgtttagca caatcattga cctctcaagg cctcacccat ctcaacacct1860gtcgtgtgct cacttgacta cttctttgaa ccagctcgcc atcggactag tcgaacaagc1920ttgtcgcccc catacagatg aatgtatgtt taaagctaca tgatcagcct gaaccgagca1980taactcgagt gccgagactc ctctgatgta tatcgagatg aatgacaaac ctacgggtcc2040gttcttgaga agtggcctga gatttctcac ttggtgagaa aaaggacggg cgagcgggag2100cctgagtcag aagaaatacc tgtctccttg gatctcacat gacggtgttg tggaagagtg2160catctattgt cattgctgga gtgacggcag agtaggggtc taaagaaacc catactgagt2220agagatggag aagacaacaa aagcccaaga cgacagagac gacagaagat taaagctatc2280agagcgagac tatatcacta ttcgaaacct gcgagtaatt taacaagaag tacacatcat2340cattgttatc aattcgacga agacatggtc gaaaattctt gcggtgtata tgtctgttgt2400atatgggcct gggcattgtt atttttcgcc gtctttatgt gtactaacac ttccattgat2460accccagaac aaaagatgaa cgcttaaaca gcaccaaaat caggagaaga atggcgctgc2520tctaggtatg cttctgggat aaaaagcgat gttgatacct ctcagaaaag aagtgatttg2580aagttgaatc aaacaaatag ccgatggagc gatctgaagg ggtggcagac ctgctacgcg2640catttaggca aggcatcaac tcggcagatg attaagaaag gttttgtagg ttcacgtgtt2700gtgttgtgtt ccattataag tttataacct tgctaagatg caacgactct gacctcaggg2760tgttagaaaa attgaccact aggagcataa gtgacgaaat tcggggatca agacaataga2820tagtttcatt ttcatgtgct cctacgtctt ttcacgtaat gtttcttata aaaaaaaaga2880tagcattgtc tctttggtga aaagagaaaa aaagatgtta cgacgtggcc ttgattcgaa2940cagacgcctc cgaagagaat agatttctag tctatcgcgt tagaccactc cgccaccacg3000ccttacgtaa tctgtgattg ttgaaagtta ctctcgtgtt acggtctata cgtgaagaat3060ctacacttga cgagtctcga ggtctggggt cagttagacg gaaatgggag aacaaagaga3120cttggtgaca ttgcaggcaa ccgggtagat gttgaggtca ttgatcggac aagattgttg3180cttcaaaagt aacaggtatt ctttttttta atcaacagaa acgttccatg ttcatttgtt3240aatccaatct atttgtgata gcgtttgatg acaaacaata ataatgatgg tctggcggct3300agtgatcgtt tgtaatgacg tcgtcatata tcctatcact atacagttgc tttgcacacg3360cactcacgtc cttcattcgt tgtcttcact atttgatggt gatttggttc aacaacctac3420agaaataatg acctgtggtg ttctccgaat atggctagac caacacaagc ttgtaccgcg3480gcattcaaat caccatgtga tgcccatcat cagatcatcc accaacccaa aaacagacca3540actactcaca aaaaggcatc tcatcaagaa aaaacggcca actaacgtcc aaaaggcccg3600aaaaacgtcc atcacgccgc agccgagact tcaatagact gcacaagaag gaccgatgag3660atcgaccaga ctaaacccgg gagagtgtca aatatgcggg ggattgggga acttacccca3720gaaaagagaa ggaggataaa ttccatgtct ggggttgacg tctctattgg ttagacacga3780acgcctgctc tcggcgtaat ttataccata gcgccaatga gggcggaaac tcctgttttg3840tcaagtcgtc attgttggtt gggtcatgat atatagccag taggtatccg tcttggtgat3900tgaccagaca tatcgctcat cacagatcaa catcactgct atcaccaaca tgcttactca3960agtcctttat ggcttggtag ccagtgccct ttggcaaggc caagtcgttg catcaccaag4020caaggacaat tcactggagc gcttcattga caaacaagct gatatttcta tcaagggtgt4080ccttgctaat attggcgctg atggaaaaag ggcacagggt gcagcgcctg gtgctgttgt4140ggcaagtcca tcgaaagaag atcctgattg taagccagca tcctaccttg tccttgtccg4200catgctaatg atggtctcag attggtacac ttggactcgt gactctgctt taacgtacaa4260agtgctcgtt gagagattca tccacggcga caaatctctc caacgaaaga tagatgaata4320tgtctccgca caagcgaaac tgcaagggac cacaaatcca tcgggcagcc cagagtcggg4380cggtctcggc gagccaaagt tccatgtgaa tctcactgct ttcactggat cttggggtcg4440gcctcagcgc gacggccctc cgcttcgggc taccgccttg actctgtatg cagaatggct4500catttcccac ggcgaaagat ccaaggcttt gaacaaagtc tggccagtca tcgagaagga4560ccttgcgtat actaccaagt tctggaatcg cactggctat gatctatggg aggaggttaa4620tggatcttct ttctttacac tttcggcttc gcatcgtgct cttgtcgaag gtgccgctct4680ggctaagaaa cttggcaaat cttgtcctga ctgtgtcacc aacgctcctc gcgttctgtg4740cttccttcag actttctgga ctggtggcta cgttgactcc aacattaacg tcaaggatgg4800tcgcaagggt ctcgatgtca actccatcct ctcgtccatt catacattcg atcccaactc4860caagtgcacc gactcgacgt tccagccttg ttcacccaga gctcttgcga accacaaggc4920ggtcgtcgat tctttcaggt caatctatgg tgtcaacaag aatagaggtc aaggcaaggc4980cgcggctgtt ggtcgatata gcgaggacgt gtactatgat ggcaaccctt ggtacctggc5040cactcttgct gctgcagaac aactctacgc tgcggtctac cagtgggata agcttggcgc5100tgttactgtt gacgatgtat ctttgtcttt cttcaaggat atcgttccca aggtctccaa5160
aggcacttat gccaagaaga ccaagacata caaggagatc atcaaagcag ccaagactta5220cgccgacggc tttgtcgctg tcgtgcagac atacactccc aaggacggct cactagctga5280gcaatttgac aagtcaactg gagcccccaa gtccgctgtt cacctcacct ggtcctacgc5340cgcctttgtc gccacaactg aacgtcgcga cggcatcatc tctccctcct ggggcgaaag5400cagcgccaac aaggtccccg ccgtgtgtca agctgcccca gcatgtgaca caaccatcac5460cttcagtgtc aagaacgtgc aagtttcatc cgaccaaaag gtttacgtgg ttggctcagt5520gactgagctt tctaactggt cacctgatga tggcattgcg cttacgccat ctagttccgg5580agtgtggagc gtcaaggtta agattccttc tgatacaagc tttgagtaca agtatatcaa5640gaagactagc agtggggatg ttacgtggtt gagtgatccc aacaaccggg ctattacggg5700tagcaagtgt ggaagtacaa gtactcttga tgatgagtgg aggtagtgga tgacagattt5760atcaagctat gtagttttgt gaatatataa ttatccaaat tatcagggtt cggtaagaat5820ataattcagt tcagcagtct gtacaagcaa gccatgattc acgcttcctt cgtttggaag5880ataagggttc ctcgccaccg tcaagataat tttctcgtgc taatatcacg taatccatct5940gcattaaacc cttgccggga aggtttcttc aacccagcaa ccccagagta actcggagat6000agggaagtct atttgcctta tcctccgtga cgaattccct gaacccaatt 6050<210>2<211>2517<212>DNA<213>镰孢霉属<400>2aattactact gtgatgtgat cacacctaac taaataccta actcacccga tggatcgaca60aggaaatctc acgcccttgt cgagtctcct ctttcgtctg tctcctgggc tcgctactgt120ccgattgtaa ctctcgctct ccaacttgtt caactctaat aagtggtggc acaacgtgaa180gatgtattgt tgtgtgaggc ggggggttgc gtggcattac caaagagacc aaaagtcccc240ctatgtcgat ttgatggtgt tgcgttgcca tgatacggga ccccgaatat gttgtatgca300tcatgcgtac agaaagctac tgttcaaaac gaacggcaaa gcggattgat caacccgtga360aagaccatgg gtctctctca gtccacaatc ttctcttcct gatcaaattt atggatccaa420gcggccacaa ttctagcgcc atcatgggtc cctttcctct tttcgctcac cccatgttcc480ctgtcccacc tcattcagtg gacctgatgg atccctatcc cccgatgagc cggggggtgc540agccttggcg ctctcttctt gttagtgtga cctactgttg atttcactca gcagtcctag600agtccattta gttgggcctg gggtgatggg gtctgagact ttgcttcttg cctggtcttg660tctagctcga atctgtgggt tgcctggcct ggcctggcct gacctgacct gaggggggtg720cccctttgct ctgttctgca tatgttgcta ttagctacct actcgagaat tcataaaagg780actgtccagc cccgtctctt actgacttct ttcctttccc tcttcaccct cgttgtcata840tcaaatctgt cactcgttag accagactac cattcccact ttcgctttta aactacttta900ctcaactaat tctaatacca actccaaaaa ccatcaacat gcgtttcaca tcaatcctcg960ctgccggcgc tttcgccacc atggccgctg cccagagcaa gaccgtctcc ctcgaccctg1020ctcagcagtc tcaggccgac tgcctctccg actgtgagcc tggcgatgtc aagtgccagt1080cttactgcat cactgtatgt tacaacaacg attcccctgt catgtgtaga aaactaacaa1140tcccaatagg ttccctctcc tgacgagaag aacatcgagg aaaccaccaa gtgttgtttg1200ccgcctgccc caagggcaag ggctccgaag gccgacactg agaagtacac cgtttgcatg1260aacgagtgta tcgccgacaa ctactggaag tccgttgatg gtaccccccg tggcaccgac1320gtccccgatg tcaagagcaa ggcctccgag gctgcctcct ccgctgctga gaaggccacc1380gccaccggta ctgctgctga gtctgatgct accgccactg gtgcctccgc tactgagtcc1440gagtccggct ccgactccag ctccgaggag accggctctg cctctggcac tgccactggt1500accgctgctg aggtctccga gactggtaac gccgcctctt ccctcgttgg tggtgtctcc1560ttcctcggtc tcgttgccgc tatcttcgct ctgtaaattg ggtttcctgc tttaggataa1620tctgatttgg catgacggag aaggatttaa tgggttttat tacagcggta atgattggag1680tttggatttc aagatgtgac acgttggaca gcatgataag gcctacgggt ctgatcaatt1740tcatggacaa attttgtttt tttgggtaat catttcgcgt tcacatatgg ctcggcatat1800gagcatgaat acaatacctc ttttttgcgc ctcaattcat tccaatttct tgtgatctca1860cagtgattca acttacaagt tgcggcgcga ccactgaggt cgtgtctgat gtgggtcttc1920tgtttgtgat tggctcatga ttcccaatcg ggtgcttcaa acgttagttt gtaaacaagc1980
gaaatgaggg tcttaggatg catgttcaaa gcgcaaaacc caattgaatt caaatgttaa2040agaatcatcg agaagagcga gttactgagg tgaatttgtg ctttcaactg tcaatacctc2100cctcagaaca aatgaattga attattattc acactcaatg cccaatattc taaacatgtt2160cgttgtaaca gagttttaat tccttgacgc cacaatgttc cttggtaatt atcgcgcctg2220tcacatgaac tggctcctga acttaaacgt tggtgaccca gcaactcgtt tatcaggctt2280agggtagctg tcatacaaca aacaaacttg tacaattgat gttattgatg aatcatgtat2340agaagagcac aattgattta aacacagata aactggtcga accgatttta tcaggttgtg2400tgaacatgca ttgccgaatc agaaaccaga gtaagactat ctacagttcc atgaagacaa2460ttcacagact gccagaaagc aaggtactgg aagcacgaga gacaaaatta ttgaatt 2517<210>3<211>4047<212>DNA<213>镰孢霉属<400>3aattagagag gttagggatt tcacatggcc accaatggga aggaggcaac catctgcacg60agcccaccaa gtcatctcct caaactgtgc tgcgactaag aatttgattc cggttctggc120ctggcctttg tatcagctag gtcattctcg actaccggag gccaggctga agcagtcagt180cacgcattgt cactttatcg gtcctgtcct catacggata cactaggcgt caatgggctt240caaacggaga tccagagatc tcatgaagag catcgacgat aaagtgagtg gttggggata300ctgtgcggtg ccgaccccag cggcagccag gttccaccct tgattacatg gttgaaaagt360ggcgttactg ggcgagatca aatttggcat gtatgttcgt ccaatgacgc gagctctcca420tgttgctgcg agggtcagga acggaccagc atgggatcag tgaggtgaaa tccaaccgag480ggagagcgag atctttgtgc tcatatccat gctgccatgc tacgtgccga acaggccaga540tggcgttcaa ctcagtcgac caggtccgat gaacgcggag cggtgacgag atcgaagctt600catctatcgc ttacggggtt atgttccact ttccattaac gtttgcgagt tgctgtttga660gagccatgtc gaaagcatgg accgtgtcac atctttcaag gtaaatctgg aggtgggaag720aagaattgcg aggaacagga tgggaggata gcaggctgac gcggaaagct aggtagctac780ctggctgatt actggctaaa gctggagagc aactaggtaa tatcaggcaa agagctccaa840gagctattgg gaggctggct gattgtctct ggctgagacg caggaggaag ggttaaaatg900gccggcaggc caagaagggg ctgcaaaaca cggagtggat ggtggggcct cccacatacg960ggattcgggc tgcggatcta acctcaattt ggcaagaggt aaataggacg acatgcaggc1020cccctgacat gtaaacaaga caagtggtaa acaagccatc aacatcaaca agagcgaaca1080atcgacacac ccatgggggt gagatatggt agtaaggcag agagagatca gggcagcata1140cgtgggaaag ggctgggcaa gaaaggacac aacggatcaa cagaacgcag cgctaccgag1200ggagcaacac aagtacagta accgctcaca gaggcacaac tcgtccaatc ctgcccccgt1260cttcaaaagc ccagtttcgt tctgagtcct gtccggtccc tcttctcctc ctactccctc1320caattatcgc catccacatc gacatcgtca attcacaacc tcacccagac aagaagaaaa1380gaacgactga aggccttcgc tcgccatcac ccgattcttt tccattctct tcgacttttg1440tttcgtagga acaagagcca gagaacttct tgtcatcctt tcgaatttcg gaaggttgta1500tgagaagctt ctctcgcgcc agcaaaagtc gcaaatctgg actttgaggc acgcgtcccc1560gttcccttca gcatcttccc atcgacatat cgggaatccg aatcccacac acagaccgtt1620accgaaacaa agatacacga agaggttgag atcaaacccc aacagcccga agccggacgg1680gaaggtgaaa tatcttctgt ctccgtcacc gccgaacagg tccctcctcc tcgtcaagag1740caagagttta tcgaagaaga ggtccatatt acgcgtgaag aagaacatta ccaccgtccc1800ggtgtccaaa aattcgagca cgaagacttt actatccgtg aagactcccg acggtacgtt1860cgattttaca tttcctttca tctccattta ggtcgcatct ttttcgttac ttttttggtc1920aattacacgg gggatacgat tttcccacgg tcggagaaag ccctgcttgc tctctatgcc1980taggtctgta ttctctcatc cctctgcgct gatctggcca tggagacgtg tgagaacaag2040actacaattc atcacatcat ttttcgctag gcgaaagcaa ttaccgttgt ccccgacctt2100ctcccaacca tcagttttca ctttcccttt tcttggtctg gcttgccttg accattaccc2160accgcgcacg gagcgcttca gtccccagcc atcccattct cacatcactt ctcatatcct2220ctcttcacac gcctcacaca cccaccccct gcatgctacc atgccaaccc acttcagctt2280ggctggatac ccaatttgct ttgcttcctc cccggctcac tagcgcctct aagcctgctg2340gcctgagcaa ggcggtggag ctatctcagg ggccgccgcc tcccgttgcc atatgatacg2400caaacgactt actatagaca tccatcagct aacccagaca aatctagacc tcaacctccc2460
tctcaatacc aaccttccca gtaccaccaa ccttcccact accaaccacc tcccaaattc2520caaacttctc acactcacgt agagatcgac acccaccgtc atccctacta ctccaccccc2580attgatctcg ctgaacgtga ataccgccag cgttaccgcc ctgcccaagc tttttccaca2640gaagaccctt cttcccactc tcatcctcac taccaacctc aagacaactt caaagccaac2700aactacaccg ttgaaggccg acccgctccc caattccatt cctctgagaa gactgaaatc2760aacaagttta ctgttgacga acactcctct cgccctcagt acaaccacac cgagaagacc2820gaattcaaca actacactgt tgacagccga tcttcccgtc ctcaatacaa cacctgtgag2880aagactgaga tcaacaattt cactgttgac gcccgctctt cccagccacg gtaccgcgac2940accaagacaa ctcaagtcaa cagctacgcc gttgacaagc ccgtttctcg tccatcttac3000aagaaggacg tgagatttac tgaacaaacc gtcgaagctt caaagtccga caagtccaag3060atgggttact acgacgacga gggtaagtga aatctgtcac ccagcgagcg ccatcaagct3120ctctattcgt gacgcaattc aagctaaccc agtcaccagg ttctttccgc aacggcggca3180tccacaagct cggtgacaag tcccgcgaca ttgaggttga cattcgcgag acttctcgtc3240ctgccaatga ctgcgctccc aacaccgtca gcatcccctg ccaccacatc cgtctgggtg3300atttcctcat gctccagggc cgcccctgcc aggtcatccg catctccacc tcctctgcca3360ctggccagta ccgctacctt ggtgtcgacc tcttcaccaa gcagcttcat gaggagtctt3420ctttcatctc caaccctgcc cccagcgttg tcgttcagtc catgctcggc cctgtcttca3480agcagtaccg tgtcctcgat atgcaggagg gtcagatcgt tgccatgacc gagactggcg3540acgtcaagca gggtctccct gtcattgacc agtccaacct ctactctcgc ctccacaacg3600ctttcgagtc cggtcgtggc tctgttcgcg tcctcgtcct caacgacggt ggccgtgagc3660ttgccgttga catgaaggtc atccacggct ctcgcctgta agcgtgttca actgttttct3720gaattcgggc agccgcttgc aatgcgactt cttcccaatg tttaattgag tgaagggaca3780gcactaccag tctcacctca actgtgggga gcgggtctgg gctgtctcta atcttacctg3840tacaatgtca agtttcatag gggacctgtt gtgtcaagat ggttcgagtt ttgtttgtgt3900caagattgga taaatgatat tggctagctg gaaatactgg agtcttttgt gtagatggga3960gagttctgta catgaactat agtaattgac aattgattcc gcatctactt agcttttcat4020tggtgctcta tgcccaacat gtgaatt4047<210>4<211>581<212>PRT<213>镰孢霉属<400>4Met Leu Thr Gln Val Leu Tyr Gly Leu Val Ala Ser Ala Leu Trp Gln1 5 10 15Gly Gln Val Val Ala Ser Pro Ser Lys Asp Asn Ser Leu Glu Arg Phe20 25 30Ile Asp Lys Gln Ala Asp Ile Ser Ile Lys Gly Val Leu Ala Asn Ile35 40 45Gly Ala Asp Gly Lys Arg Ala Gln Gly Ala Ala Pro Gly Ala Val Val50 55 60Ala Ser Pro Ser Lys Glu Asp Pro Asp Tyr Trp Tyr Thr Trp Thr Arg65 70 75 80Asp Ser Ala Leu Thr Tyr Lys Val Leu Val Glu Arg Phe Ile His Gly85 90 95Asp Lys Ser Leu Gln Arg Lys Ile Asp Glu Tyr Val Ser Ala Gln Ala100 105 110Lys Leu Gln Gly Thr Thr Asn Pro Ser Gly Ser Pro Glu Ser Gly Gly115 120 125Leu Gly Glu Pro Lys Phe His Val Asn Leu Thr Ala Phe Thr Gly Ser130 135 140Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala Thr Ala Leu145 150 155 160Thr Leu Tyr Ala Glu Trp Leu Ile Ser His Gly Glu Arg Ser Lys Ala165 170 175Leu Asn Lys Val Trp Pro Val Ile Glu Lys Asp Leu Ala Tyr Thr Thr
180 185 190Lys Phe Trp Asn Arg Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly195 200 205Ser Ser Phe Phe Thr Leu Ser Ala Ser His Arg Ala Leu Val Glu Gly210 215 220Ala Ala Leu Ala Lys Lys Leu Gly Lys Ser Cys Pro Asp Cys Val Thr225 230 235 240Asn Ala Pro Arg Val Leu Cys Phe Leu Gln Thr Phe Trp Thr Gly Gly245 250 255Tyr Val Asp Ser Asn Ile Asn Val Lys Asp Gly Arg Lys Gly Leu Asp260 265 270Val Asn Ser Ile Leu Ser Ser Ile His Thr Phe Asp Pro Asn Ser Lys275 280 285Cys Thr Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala Asn290 295 300His Lys Ala Val Val Asp Ser Phe Arg Ser Ile Tyr Gly Val Asn Lys305 310 315 320Asn Arg Gly Gln Gly Lys Ala Ala Ala Val Gly Arg Tyr Ser Glu Asp325 330 335Val Tyr Tyr Asp Gly Asn Pro Trp Tyr Leu Ala Thr Leu Ala Ala Ala340 345 350Glu Gln Leu Tyr Ala Ala Val Tyr Gln Trp Asp Lys Leu Gly Ala Val355 360 365Thr Val Asp Asp Val Ser Leu Ser Phe Phe Lys Asp Ile Val Pro Lys370 375 380Val Ser Lys Gly Thr Tyr Ala Lys Lys Thr Lys Thr Tyr Lys Glu Ile385 390 395 400Ile Lys Ala Ala Lys Thr Tyr Ala Asp Gly Phe Val Ala Val Val Gln405 410 415Thr Tyr Thr Pro Lys Asp Gly Ser Leu Ala Glu Gln Phe Asp Lys Ser420 425 430Thr Gly Ala Pro Lys Ser Ala Val His Leu Thr Trp Ser Tyr Ala Ala435 440 445Phe Val Ala Thr Thr Glu Arg Arg Asp Gly Ile Ile Ser Pro Ser Trp450 455 460Gly Glu Ser Ser Ala Asn Lys Val Pro Ala Val Cys Gln Ala Ala Pro465 470 475 480Ala Cys Asp Thr Thr Ile Thr Phe Ser Val Lys Asn Val Gln Val Ser485 490 495Ser Asp Gln Lys Val Tyr Val Val Gly Ser Val Thr Glu Leu Ser Asn500 505 510Trp Ser Pro Asp Asp Gly Ile Ala Leu Thr Pro Ser Ser Ser Gly Val515 520 525Trp Ser Val Lys Val Lys Ile Pro Ser Asp Thr Ser Phe Glu Tyr Lys530 535 540Tyr Ile Lys Lys Thr Ser Ser Gly Asp Val Thr Trp Leu Ser Asp Pro545 550 555 560Asn Asn Arg Ala Ile Thr Gly Ser Lys Cys Gly Ser Thr Ser Thr Leu565 570 575Asp Asp Glu Trp Arg580<210>5<211>200<212>PRT<213>镰孢霉属
<400>5Met Arg Phe Thr Ser Ile Leu Ala Ala Gly Ala Phe Ala Thr Met Ala1 5 10 15Ala Ala Gln Ser Lys Thr Val Ser Leu Asp Pro Ala Gln Gln Ser Gln20 25 30Ala Asp Cys Leu Ser Asp Cys Glu Pro Gly Asp Val Lys Cys Gln Ser35 40 45Tyr Cys Ile Thr Val Pro Ser Pro Asp Glu Lys Asn Ile Glu Glu Thr50 55 60Thr Lys Cys Cys Leu Pro Pro Ala Pro Arg Ala Arg Ala Pro Lys Ala65 70 75 80Asp Thr Glu Lys Tyr Thr Val Cys Met Asn Glu Cys Ile Ala Asp Asn85 90 95Tyr Trp Lys Ser Val Asp Gly Thr Pro Arg Gly Thr Asp Val Pro Asp100 105 110Val Lys Ser Lys Ala Ser Glu Ala Ala Ser Ser Ala Ala Glu Lys Ala115 120 125Thr Ala Thr Gly Thr Ala Ala Glu Ser Asp Ala Thr Ala Thr Gly Ala130 135 140Ser Ala Thr Glu Ser Glu Ser Gly Ser Asp Ser Ser Ser Glu Glu Thr145 150 155 160Gly Ser Ala Ser Gly Thr Ala Thr Gly Thr Ala Ala Glu Val Ser Glu165 170 175Thr Gly Asn Ala Ala Ser Ser Leu Val Gly Gly Val Ser Phe Leu Gly180 185 190Leu Val Ala Ala Ile Phe Ala Leu195 200<210>6<211>187<212>PRT<213>镰孢霉属<400>6Met Gly Tyr Tyr Asp Asp Glu Gly Ser Phe Arg Asn Gly Gly Ile His1 5 10 15Lys Leu Gly Asp Lys Ser Arg Asp Ile Glu Val Asp Ile Arg Glu Thr20 25 30Ser Arg Pro Ala Asn Asp Cys Ala Pro Asn Thr Val Ser Ile Pro Cys35 40 45His His Ile Arg Leu Gly Asp Phe Leu Met Leu Gln Gly Arg Pro Cys50 55 60Gln Val Ile Arg Ile Ser Thr Ser Ser Ala Thr Gly Gln Tyr Arg Tyr65 70 75 80Leu Gly Val Asp Leu Phe Thr Lys Gln Leu His Glu Glu Ser Ser Phe85 90 95Ile Ser Asn Pro Ala Pro Ser Val Val Val Gln Ser Met Leu Gly Pro100 105 110Val Phe Lys Gln Tyr Arg Val Leu Asp Met Gln Glu Gly Gln Ile Val115 120 125Ala Met Thr Glu Thr Gly Asp Val Lys Gln Gly Leu Pro Val Ile Asp130 135 140Gln Ser Asn Leu Tyr Ser Arg Leu His Asn Ala Phe Glu Ser Gly Arg145 150 155 160Gly Ser Val Arg Val Leu Val Leu Asn Asp Gly Gly Arg Glu Leu Ala165 170 175Val Asp Met Lys Val Ile His Gly Ser Arg Leu
180 185<210>7<211>30<212>DNA<213>镰孢霉属<400>7gagctcgagg aattcttaca aaccttcaac 30<210>8<211>47<212>DNA<213>镰孢霉属<400>8ttaattaagg tacctgaatt taaatggtga agagatagatatccaag 47<210>9<211>51<212>DNA<213>镰孢霉属<400>9tcaccattta aattcaggta ccttaattaa attccttgtt ggaagcgtcg a 51<210>10<211>42<212>DNA<213>镰孢霉属<400>10tggtatgcat aagcttgaat tcaggtaaac aagatataat tt 42<210>11<211>35<212>DNA<213>镰孢霉属<400>11cagtgaattg gcctcgatgg ccgcggccgc gaatt 35<210>12<211>35<212>DNA<213>镰孢霉属<400>12aattcgcggc cgcggccatc gaggccaatt cactg 35<210>13<211>34<212>DNA<213>镰孢霉属<400>13cacgaaggaa agaogatggc tttcacggtg tctg 34
<210>14<211>34<212>DNA<213>镰孢霉属<400>14cagacaccgt gaaagccatc gtctttcctt cgtg 34<210>15<211>46<212>DNA<213>镰孢霉属<400>15ctatctcttc accatggtac cttaattaaa taccttgttg gaagcg 46<210>16<211>46<212>DNA<213>镰孢霉属<400>16cgcttccaac aaggtattta attaaggtac catggtgaag agatag 46<210>17<211>30<212>DNA<213>镰孢霉属<400>17atttaaatga tgaggagctc ccttgtgctg 30<210>18<211>29<212>DNA<213>镰孢霉属<400>18ttaattaact agagtcgacc cagccgcgc29<210>19<211>45<212>DNA<213>镰孢霉属<400>19ataagaatgc ggccgctagt ttaaacttac aaaccttcaa cagtg 45<210>20<211>19<212>DNA<213>镰孢霉属<400>20tagcatctat ctccgtctt 19
<210>21<211>19<212>DNA<213>镰孢霉属<400>21gtgtgcagtg acccagaat 19<210>22<211>42<212>DNA<213>镰孢霉属<400>22gattgggtcc ctacgtagtt aacactatag gccatcgttt ac 42<210>23<211>28<212>DNA<213>镰孢霉属<400>23atttaaatat ggtttcttcg gcattcgc 28<210>24<211>28<212>DNA<213>镰孢霉属<400>24ttaattaact attccgacgg aacaaagc 28<210>25<211>44<212>DNA<213>镰孢霉属<400>25ctcttggata tctatctctt caccatggtt tcttcggcat tcgc 44<210>26<211>43<212>DNA<213>镰孢霉属<400>26gcgaatgccg aagaaaccat ggtgaagagt agatatccaa gag43<210>27<211>30<212>DNA<213>镰孢霉属<400>27gaatgacttg gttgacgcgt caccagtcac 30<210>28
<211>26<212>DNA<213>镰孢霉属<400>28tctagcccag aatactggat caaatc 26<210>29<211>39<212>DNA<213>镰孢霉属<400>29cttaactttg acttgaaaaa catatctgac atttgctcc 39<210>30<211>59<212>DNA<213>镰孢霉属<400>30ggacggcctt ggctagccct ccgtgcggcc gccggccggt ctcgcaggat ctgtttaac 59<210>31<211>32<212>DNA<213>镰孢霉属<400>31atatcgtgaa gatatgcggc attgatgcca cc32<210>32<211>35<212>DNA<213>镰孢霉属<400>32ggcggcaata accggccgaa cattccggat atccc 35<210>33<211>32<212>DNA<213>镰孢霉属<400>33cactgctatc accaacatgt ttactcaagt cc32<210>34<211>32<212>DNA<213>镰孢霉属<400>34ggacttgagt aaacatgttg gtgatagcag tg32<210>35<211>29
<212>DNA<213>镰孢霉属<400>35gactcatgag gagctccctt gtgctgttc29<210>36<211>34<212>DNA<213>镰孢霉属<400>36tgattaatta acctaaagac atgtcccaat taac 34<210>37<211>25<212>DNA<213>镰孢霉属<400>37gcatttaaat tactactgtg atgtg25<210>38<211>25<212>DNA<213>镰孢霉属<400>38gattgatgtg aaacacatgt tgatg25<210>39<211>25<212>DNA<213>镰孢霉属<400>39cgacccggga attagagagg ttagg25<210>40<211>28<212>DNA<213>镰孢霉属<400>40cgtataaccc atggtggact tgtcggac 28
权利要求
1.制备多肽的方法,包括(a)在有利于该多肽产生的培养基中培养真菌宿主细胞,其中该真菌宿主细胞含有编码该多肽的第一核酸序列和与该第一核酸序列可操作地连接的、含有与第一核酸序列异源的启动子的第二核酸序列,其中该启动子含有选自下组的序列SEQ ID NO.1的第1-3949位核苷酸、SEQID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸,及其子序列;和它们的突变、杂合及串联启动子;和(b)从该培养基分离该多肽。
2.权利要求1的方法,其中该启动子含有SEQ ID NO.1第1-3949位核苷酸或其突变、杂合或串联启动子的核酸序列。
3.权利要求2的方法,其中该启动子含有SEQ ID NO.1第1-3949位核苷酸的核酸序列。
4.权利要求3的方法,其中该启动子含有大肠杆菌NRRL B-30067中的质粒pECO3所包含的核酸序列。
5.权利要求1的方法,其中该启动子含有SEQ ID NO.2第1-938位核苷酸或其突变、杂合或串联启动子的核酸序列。
6.权利要求5的方法,其中该启动子含有SEQ ID NO.2第1-938位核苷酸的核酸序列。
7.权利要求6的方法,其中该启动子含有大肠杆菌NRRL B-30071中的质粒pFAMG所包含的核酸序列。
8.权利要求1的方法,其中该启动子含有SEQ ID NO.3第1-3060位核苷酸,其子序列;或其突变、杂合或串联启动子的核酸序列。
9.权利要求8的方法,其中该启动子含有SEQ ID NO.3第1-3060位核苷酸的核酸序列。
10.权利要求9的方法,其中该启动子含有大肠杆菌NRRL B-30075中的质粒pQUINN所包含的核酸序列。
11.权利要求1、2、5和8之任意一项的方法,其中该突变启动子由含有一或多个核苷酸替代、缺失和/或插入的选自下组的启动子组成SEQ IDNO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ IDNO.3的第1-3060位核苷酸,其中该突变启动子比相应的启动子具有较强或较弱的启动子活性。
12.权利要求1、2、5和8之任意一项的方法,其中该杂合启动子由两个或更多个启动子的部分组成。
13.权利要求12的方法,其中该杂合启动子含有一或多个选自下组的部分SEQ ID NO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸。
14.权利要求13的方法,其中该杂合启动子还含有另一启动子的部分。
15.权利要求1的方法,其中该串联启动子由两个或多个启动子组成。
16.权利要求15的方法,其中该串联启动子含有两个或更多个选自下组的启动子SEQ ID NO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸。
17.权利要求16的方法,其中该串联启动子还含有另一启动子。
18.权利要求15的方法,其中该串联启动子的两个或更多个启动子同时启动所述核酸序列的转录。
19.权利要求15的方法,其中该串联启动子的两个或更多个启动子中的一或多个在所述真菌宿主细胞的不同生长阶段启动所述核酸序列的转录。
20.权利要求1-19之任意一项的方法,其中该真菌宿主细胞含有一或多个拷贝的所述核酸序列。
21.权利要求1-19之任意一项的方法,其中该真菌宿主细胞含有一个拷贝的所述核酸序列。
22.权利要求1-21之任意一项的方法,其中所述核酸序列编码与该真菌宿主细胞异源的多肽。
23.权利要求1-22之任意一项的方法,其中该多肽是激素或激素变体、酶、受体或其部分、抗体或其部分、或报道分子。
24.权利要求23的方法,其中该酶是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。
25.权利要求23的方法,其中该酶是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶溶酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶或木聚糖酶。
26.权利要求1-25之任意一项的方法,其中该核酸序列包含在该真菌宿主细胞的染色体中。
27.权利要求1-25之任意一项的方法,其中该核酸序列包含在染色体外因子上。
28.权利要求1-27之任意一项的方法,其中该真菌宿主细胞是丝状真菌或酵母细胞。
29.权利要求28的方法,其中该丝状真菌细胞是Acremonium、曲霉属、镰孢霉属、腐质霉属、毛霉属、毁丝霉属、脉孢菌属、青霉属、梭孢壳属、Tolypocladium或木霉属的细胞。
30.权利要求28的方法,其中该酵母细胞是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或Yarrowia的细胞。
31.权利要求28的方法,其中该丝状真菌宿主细胞是曲霉属细胞。
32.权利要求28的方法,其中该丝状真菌宿主细胞是镰孢霉属细胞。
33.分离的启动子序列,其含有选自下组的核酸序列SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它们的突变、杂合和串联启动子。
34.权利要求33的启动子序列,其含有SEQ ID NO.1第1-3949位核苷酸或其子序列;或其突变、杂合或串联启动子的核酸序列。
35.权利要求34的分离启动子序列,其含有SEQ ID NO.1第1-3949位核苷酸的核酸序列。
36.权利要求35的分离启动子序列,其含有大肠杆菌NRRL B-30067中的质粒pECO3所包含的核酸序列。
37.权利要求33的分离启动子序列,其含有SEQ ID NO.2第1-938位核苷酸或其子序列;或其突变、杂合或串联启动子序列的核酸序列。
38.权利要求37的分离启动子序列,其含有SEQ ID NO.2第1-938位核苷酸的核酸序列。
39.权利要求38的分离启动子序列,其含有大肠杆菌NRRL B-30071中的质粒pFAMG所包含的核酸序列。
40.权利要求33的分离启动子序列,其含有SEQ ID NO.3第1-3060位核苷酸或其子序列;或其突变、杂合或串联启动子序列的核酸序列。
41.权利要求40的分离启动子序列,其含有SEQ ID NO.3第1-3060位核苷酸的核酸序列。
42.权利要求41的分离启动子序列,其含有大肠杆菌NRRL B-30075中的质粒pQUINN所包含的核酸序列。
43.权利要求33-42之任意一项的分离启动子序列,其具有SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸之序列的至少20%的启动子活性。
44.与权利要求33-43之任意一项的启动子序列具有相同启动子活性的分离启动子序列。
45.分离的启动子序列,其含有在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的序列中具有至少一个突变的核酸序列或其子序列;其中该突变启动子具有启动子活性。
46.核酸结构,其含有与权利要求33-45之任意一项的启动子可操作地连接的编码多肽的核酸序列。
47.含有权利要求46的核酸结构的重组表达载体。
48.含有权利要求46的核酸结构的重组宿主细胞。
49.制备多肽的方法,包括(a)在有利于该多肽产生的条件下,培养其中已掺入了如下新转录单元的同源重组细胞,该新转录单元含有与编码该多肽的内源核酸序列第二外显子可操作地连接的权利要求33-45之任意一项的启动子、外显子、和/或剪接供体位点;和(b)回收该多肽。
50.获得突变启动子的方法,包括(a)在低严紧条件下使DNA与含有如下序列的核酸序列杂交(i)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3,(ii)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链;和(b)从该DNA中分离该突变启动子。
51.获得突变启动子的方法,包括(a)将至少一个突变引入SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的启动子中,其中该突变启动子具有启动子活性;和(b)分离该突变启动子。
52.分离的核酸序列,其选自(a)编码具有如下氨基酸序列的多肽的核酸序列,该氨基酸序列与SEQ ID NO.4第22-581位氨基酸、SEQ ID NO.5第19-200位氨基酸或SEQ ID NO.6第1-187位氨基酸有至少65%的一致性;(b)与SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)在极低、低、中等、中高、高或极高严紧条件下与以下序列杂交的核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100个核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互补链;(d)编码具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之氨基酸序列的多肽的变体的核酸序列,其中所述变体包含一或多个氨基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位变体;和(f)(a)、(b)、(c)或(e)的子序列。
53.核酸结构,其含有与一或多个在适合表达宿主中指导所述多肽产生的控制序列可操作地连接的权利要求52的核酸序列。
54.含有权利要求53的核酸结构、启动子、和转录及翻译终止信号的重组表达载体。
55.含有权利要求53的核酸结构的重组宿主细胞。
56.由权利要求52的核酸序列编码的多肽。
全文摘要
本发明涉及制备多肽的方法,包括(a)在有利于产生该多肽的培养基中培养真菌宿主细胞,其中该真菌宿主细胞含有编码该多肽的第一核酸序列和与该第一核酸序列可操作地连接的、含有与第一核酸序列异源的启动子的第二核酸序列,其中该启动子含有选自下组的序列SEQ IDNO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它们的突变、杂合及串联启动子;和(b)从该培养基分离该多肽。本发明还涉及该分离的启动子序列、以及含有与编码多肽的核酸序列可操作地连接的该启动子序列的结构、载体和真菌宿主细胞。
文档编号C12N15/80GK1940067SQ20061009992
公开日2007年4月4日 申请日期2000年3月22日 优先权日1999年3月22日
发明者R·M·伯卡, M·W·雷伊, K·布朗, S·H·布朗 申请人:诺沃奇梅兹有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1