用于在细胞中表达基因的启动子的制作方法

文档序号:467480阅读:587来源:国知局
用于在细胞中表达基因的启动子的制作方法
【专利摘要】本发明涉及经分离的Rasamsonia启动子DNA序列,涉及包含与编码序列可操作相连的这些启动子的DNA构建体、载体和宿主细胞。本发明也涉及使用经分离的新启动子来表达基因和/或生产生物化合物的方法。本发明也涉及使用本发明的新启动子来改变转录水平和/或调节内源基因的方法。
CBS 124902
20090701
【专利说明】用于在细胞中表达基因的启动子

【技术领域】
[0001] 本发明涉及DNA序列,特别是经分离的启动子,以及涉及包含与编码序列可操作 相连(inoperativeassociation)的这些启动子的DNA构建体、载体和宿主细胞。本发明 还涉及表达基因和/或生产生物化合物的方法。

【背景技术】
[0002] 在宿主细胞中生产重组生物化合物通常是通过构建表达盒来完成的,其中编码生 物化合物的DNA可操作地连接适合于宿主细胞的启动子。可通过质粒或者载体介导的转化 将表达盒引入宿主细胞内。然后可通过在表达盒中含有的启动子正常发挥功能所必需的诱 导条件下培养经转化的宿主细胞来完成生物化合物的生产。
[0003] 对于各宿主细胞而言,已通过转化引入宿主内的编码序列的表达和通过该编码 序列编码的重组生物化合物的生产需要获得功能性启动子。已知大量启动子在多种宿主 细胞中具备功能性。以下为真菌宿主细胞中跨物种使用的启动子的例子:Aspergillus nidulans的启动子(已知A.nidulansgpdA基因在Aspergillusniger(A.niger)中有功能 (JBiotechnol. 1991Jan;17 (1):19-33.Intracellularandextracellularproduction ofproteinsinAspergillusunderthecontrolofexpressionsignalsofthehighly expressedA.nidulansgpdAgene.PuntPJ,ZegersND,BusscherM,PouwelsPH,vanden HondelCA)。另一个例子是用于A.niger和A.nidulans的A.niger0 -木糖苷酶xlnD启动 子(TranscriptionalregulationofthexylanolyticenzymesystemofAspergillus, vanPeij,NNME,PhD-thesisLandbouwuniversiteitffageningen,theNetherlands,ISBN 90-5808-154-0)以及Escherichiacoli@-葡糖醒酸酶基因在A.niger、A.nidulans 和Cladosporiumfulvum中的表达,如CurrGenet. 1989Mar; 15(3):177-80:Roberts IN,OliverRP,PuntPJ,vandenHondelCA."ExpressionoftheEscherichiacoli beta-glucuronidasegeneinindustrialandphytopathogenicfilamentousfungi"中 所述。
[0004] 迄今为止,没有Rasamsoniaemersonii启动子用于形成重组产品,而仅仅使用跨 物种使用的启动子。
[0005] 仍然需要以下的启动子:其用于控制经引入基因的表达,用于控制内源基因的表 达水平,用于控制内源基因的表达调节或者用于介导内源基因的失活,或者用于生产多肽, 或者用于前述应用的组合。这些启动子,优选为经改进的启动子,可以例如比之前已知的启 动子更强。它们也可被特定便利的底物或者化合物诱导。当期望在单种宿主中同时过表达 多种基因时,知道若干种功能性启动子也是有利的。为了防止压制(squelching)(特定转 录因子的滴定(titration)),优选使用多种不同的启动子,例如每个待表达的基因使用一 个特定的启动子。
[0006] 发明简沭
[0007] 根据第一方面,本发明提供Rasamsonia启动子DNA序列,优选Rasamsonia emersonii启动子DNA序列,更优选地,其连接可被过表达的编码序列。本发明的Rasamsonia启动子DNA优选连接可被过表达的编码序列。有利地,本发明的Rasamsonia启 动子对应于强启动子和/或诱导型启动子。
[0008]根据另一方面,本发明提供启动子DNA序列,例如:
[0009] (a)以下列表中所示的DNA序列:SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQ IDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQ IDNO: 16 或者SEQIDNO: 17 ;
[0010] (b)能够与(a)中DNA序列的互补体(complement)杂交的DNA序列;或者
[0011] (c)与(a)中DNA序列至少50%同源的DNA序列。
[0012] 另一方面,本发明提供DNA构建体,其包含本发明的启动子DNA序列以及与该启动 子DNA序列可操作相连的编码序列,从而编码序列可在启动子DNA序列的控制下被表达。
[0013] 又一方面,本发明提供宿主细胞,优选为真菌宿主细胞,其包含本发明的DNA 构建体。该宿主细胞优选为经转化的宿主细胞,例如经转化的真菌宿主细胞,并且有 利地使用重组技术生产。宿主细胞优选为来自以下属的细胞:Acremonium、Agaricus、 Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filobasidium、 Fusarium、Geosmithia、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、 Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、 Rasamsonia、Schizophyllum、Talaromyces、Thermoascus、Thermomyces、Thielavia、 Tolypocladium或者Trichoderma,优选来自Rasamsonia、Aspergillus、Penicillium、 Chrysosporium或者Trichoderma属,优选为Rasamsoniaemersonii〇
[0014] 再一方面,本发明提供在合适的宿主细胞中表达编码序列的方法,其包括:
[0015] (a)提供本发明的DNA构建体;
[0016] (b)使用所述DNA构建体来转化合适的宿主细胞;以及
[0017] (c)在有助于编码序列表达的培养条件下培养所述合适的宿主细胞。
[0018] 而且,本发明提供在合适的宿主细胞中生产生物化合物的方法,其包括:
[0019] (a)提供本发明的DNA构建体;
[0020] (b)使用所述DNA构建体来转化合适的宿主细胞;以及
[0021] (c)在有助于编码序列表达的培养条件下培养合适的宿主细胞;以及任选地,
[0022] (d)从培养液中回收生物化合物。
[0023] 有利地,生产的生物化合物为多肽或者代谢产物。
[0024] 在本发明的方法中,生产的多肽优选通过本发明的DNA构建体中存在的编码序列 来编码。
[0025] 有利地,在本发明的方法中,存在于DNA构建体中的编码序列编码任选地参与代 谢产物生产的酶。
[0026] 而且,本发明提供编码葡糖淀粉酶的DNA序列,其包含:
[0027] (a)SEQIDN0:23 所示的DNA序列;
[0028] (b)能够与(a)中DNA序列的互补体杂交的DNA序列;
[0029] (c)与(a)中DNA序列至少50%、优选至少60%、更优选至少70%、甚至更优选至 少80%、还更优选至少90%和最优选至少95%同源的DNA序列;或者
[0030] (d)编码葡糖淀粉酶并且与SEQIDNO:24至少50%、优选至少60%、更优选至少 70%、甚至更优选至少80%、还更优选至少90%和最优选至少95%同源的DNA序列。
[0031] 本发明的又一实施方式提供葡糖淀粉酶,其具有与SEQIDN0:24至少50%、优选 至少60%、更优选至少70%、甚至更优选至少80%、还更优选至少90%和最优选至少95% 同源的DNA序列。

【专利附图】

【附图说明】
[0032] 图 1 显不质粒pENTRY-P6bleTtrpC_Pxeba7flagTgla的不意图,其为R.emersonii 中启动子测试构建体的基础。启动子测试构建体包含ble表达盒,该ble表达盒由以下组 成:A.nidulansgpdA启动子(P6)、ble编码区(ble)和A.nidulansTrpC终止子(TtrpC)、 目标启动子(Px)、EBA7-FLAG报告子编码区(eba7flag)和A.niger葡糖淀粉酶终止子。
[0033] 图2显示如使用FLAG-特异性抗体通过Western印迹法检测的FLAG标记的 R.emersoniiP-葡聚糖酶CEB蛋白(EBA7-FLAG)的表达,其通过在R.emersonii培养物的 上清液中表达的5种不同的R.emersonii启动子来驱动。泳道1 :CbhI启动子,100倍稀 释的上清液;泳道2 :CbhI启动子,未经稀释的上清液;泳道3和4 :AXE启动子;泳道5 :空 菌株;泳道6 :空泳道;泳道7 :A.nidulansgpdA启动子;泳道8 :BG启动子;泳道9和10 : Cbhll启动子;泳道11 :EG启动子,未经稀释的上清液;泳道12 :EG启动子,10倍稀释的上 清液;泳道13 :空菌株。
[0034] 图3显示质粒Tepep.bbn的示意图,其为革巴向RePepA基因座(locus)的 R.emersonii中启动子测试构建体的基础。载体包含靶向ReP印A基因座的ReP印A0RF 1. 5kb上游的1500bp的5'侧翼区、lox66位点、通过A.nidulansgpdA启动子驱动的无功 能的ble编码区5'部分(5,ble)、以及ccdB基因。
[0035] 图4显不在二分基因革巴向方法(bipartitegene-targetingmethod)中结合 pEBA528、pEBA529、pEBA530、pEBA531、pEBA532 和pEBA533 载体使用的质粒pEBA1006 的示意 图,其目标为在Rasamsoniaemersonii中通过启动子-报告子子表达盒替换RePepA0RF和 起始ATG密码子的约1500个核苷酸上游。载体包含ble编码区的3'部分、A.nidulanstrpC 终止子、l〇x71 位点、ReP印A0RF的 2500bp3'侧翼区和pUC19骨架(Invitrogen,fceda,The Netherlands)〇
[0036] 图5显示在二分基因靶向方法中结合pEBA1006载体使用的质粒pEBA528的示意 图,其目标为在Rasamsoniaemersonii中通过启动子-报告子子表达盒替换RePepA0RF 和起始ATG密码子的约1500个核苷酸上游。载体包含靶向ReP印A基因座的ReP印A0RF 1. 5kb上游的1500bp5'侧翼区;由R.emersonii启动子1、FLAG标记的R.emersonii葡糖 淀粉酶(AG-FLAG)和A.nidulansamdS终止子(TamdS)组成的启动子-报告子子表达盒; lox66位点;通过A.nidulansgpdA启动子(5'ble)驱动的ble编码区的无功能5'部分。 在R.emersonii菌株的转化之前,通过使用限制性酶Notl的消化来去除E.coliDNA。
[0037] 图6显示质粒pEBAlOOl的示意图。在二分基因靶向方法中结合pEBA1002载体使 用一部分载体片段,其目标为使在Rasamsoniaemersonii中的ReKu800RF缺失。载体包含 2500bp5'上游侧翼区、lox66位点、通过A.nidulansgpdA启动子驱动的ble编码序列的 5' 部分以及pUC19 的骨架(Invitrogen,Breda,TheNetherlands)。在R.emersonii菌株 的转化之前,通过使用限制性酶Notl的消化来去除E.coliDNA。
[0038] 图7显示质粒pEBA1002的示意图。在二分基因靶向方法中结合pEBAlOOl载体使 用一部分载体片段,其目标为使在Rasamsoniaemersonii中的ReKu800RF缺失。载体包含 ble编码区的 3' 部分、A.nidulanstrpC终止子、lox71 位点、ReKu800RF的 2500bp3' 下 游侧翼区以及pUC19 的骨架(Invitrogen,Breda,TheNetherlands)。在R.emersonii菌株 的转化之前,通过使用限制性酶Notl的消化来去除E.coliDNA。
[0039] 图8显示用于使R.emersonii的ReKu80基因缺失的策略。用于使ReKu80缺失的 载体包含重叠的无功能的ble选择标记物片段(分开的标记物(splitmarker)),其侧翼是 loxP位点以及ReKu80基因的5'和3'同源区来用于靶向(1)。构建体在基因组的ReKu80 基因座处和在重叠的同源非功能性ble选择标记物片段处通过三重同源重组(X)来整合 (2)并替换基因组的ReKu80基因拷贝(3)。随后,通过导致lox66和lox71位点之间重组 的ere重组酶的瞬时表达来去除选择标记物,从而以在基因组内剩下的剩余双突变lox72 位点缺失ble基因(4)。使用该整体策略将ReKu800RF从基因组中去除。
[0040] 图9显示用于在真菌中瞬时表达ere重组酶的质粒pEBA513的示意图。pEBA513 是含有AMA1区和CAT氯霉素抗性基因的pAMPF21衍生载体。示出了ere重组酶基因(ere) 表达盒,其含有A.nigerglaA启动子(Pgla)、ere重组酶编码区和niaD终止子。此外,示 出了由A.nidulansgpdA启动子(PgpdA)、hygB编码区和P.chrysogenumpenDE终止子 (TpenDE)组成的潮霉素抗性盒。
[0041] 图10显示如使用FLAG-特异性抗体通过Western印迹法检测的FLAG标记的 R.emersonii葡糖淀粉酶(AG-FLAG)的表达,该表达通过在R.emersonii培养物的上清液 中表达的6种不同R.emersonii启动子来驱动。不同的泳道显示在表达以下启动子-报告 子子表达构建体的转化体的上清液中AG-FLAG的表达:泳道1 :pEBA540 (携带A.nidulans gpdA启动子);泳道2 :pEBA528 (携带R.emersonii启动子1);泳道3 :pEBA529 (携带 R.emersonii启动子2);泳道4:pEBA530(携带R.emersonii启动子3);泳道5 :pEBA531(携 带R.emersonii启动子 4);泳道 6 :pEBA532 (携带R.emersonii启动子 5);泳道 7 : PEBA533 (携带R.emersonii启动子6);以及泳道8 :空菌株。
[0042] 序列表
[0043] SEQIDNO: 1R.emersonii纤维二糖水解酶-I启动子
[0044] SEQIDNO:2R.emersonii乙酰木聚糖酯酶启动子
[0045] SEQIDNO:3R.emersonii内切葡聚糖酶启动子
[0046] SEQIDNO:4R.emersonii纤维二糖水解酶-II启动子
[0047] SEQIDNO: 5R.emersoniiP-葡糖苷酶启动子
[0048] SEQIDNO:6A.nidulansgpdA启动子
[0049] SEQIDNO:7R.emersoniiRePepA(包括侧翼的基因组序列)
[0050] SEQIDNO:8R.emersoniiRePepA(cDNA)
[0051] SEQIDNO:9R.emersoniiRePepA(蛋白质)
[0052] SEQIDNO: 10A.nidulansgpdA启动子和ble编码区的 5' 部分
[0053] SEQIDNO:llble编码区的 3' 部分和A.nidulansTrpC终止子
[0054] SEQIDNO: 12R.emersonii启动子 1
[0055] SEQIDNO: 13R. emersonii 启动子 2
[0056] SEQIDNO: 14R. emersonii 启动子 3
[0057] SEQIDNO: 15R. emersonii 启动子 4
[0058] SEQIDNO: 16R. emersonii 启动子 5
[0059] SEQIDNO: 17R. emersonii 启动子 6
[0060] SEQIDNO: 1SFLAG标记的R.emersonii葡糖淀粉酶(蛋白质)
[0061] SEQIDNO: 19FLAG标记的R.emersonii葡糖淀粉酶(DNA,编码区)和A.nidulans AmdS终止子
[0062] SEQIDN0:20ReKu80基因组序列,具有侧翼的编码区
[0063] SEQIDN0:21ReKu80cDNA序列
[0064] SEQIDN0:22ReKu80 蛋白序列
[0065] SEQIDN0:23ReGlacDNA序列
[0066] SEQIDN0:24ReGla蛋白序列
[0067] 发明详沭
[0068] 当今,基因组学项目使用功能性基因组学方法以确定用于工业和环境应用的新的 真菌酶。基于公知的序列来注释基因组DNA序列。许多酶在起源微生物进化过程中看起来 高度保守。然而,对于启动子而言,很难观察到任何保守,即使在密切相关的物种中,同一性 也普遍少于5%。因此,必须开发其他的策略以寻找到新的和有效的启动子。
[0069] 在本发明的上下文中,启动子DNA序列是:当该启动子DNA序列与编码序列可 操作相连时,能够控制该编码序列表达的DNA序列。术语"可操作相连(inoperative association) "在本文中被定义为下述结构,其中启动子DNA序列被放置于相对编码序列 来说合适的位置,使得启动子DNA序列指导被编码序列编码的产物的生产。
[0070] 术语"编码序列"在本文中被定义为:当放置在合适的控制序列的控制下时,被转 录为mRNA、mRNA被翻译为多肽的核酸序列。编码序列的边界通常通过ATG起始密码子(其 通常是mRNA5'端的开放阅读框的开始)和转录终止子序列(处于紧邻mRNA3'端开放阅 读框的下游)界定。编码序列可以包括但不限于基因组DNA,cDNA,半合成、合成和重组核 酸序列。
[0071] 更具体而言,术语"启动子"在本文中被定义为下述DNA序列,其与RNA聚合酶结 合,并指导聚合酶到编码多肽的编码序列的正确下游转录开始位点以起始转录。RNA聚合酶 有效地催化与编码区的合适DNA链互补的信使RNA的组装。术语"启动子"还将被理解为 包括转录为mRNA之后用于翻译的5'非编码区(介于启动子和翻译起始之间)、顺式作用转 录控制元件(例如增强子)以及能与转录因子相互作用的其它核苷酸序列。
[0072] 术语"强启动子"在本文中被定义为:在合适生长条件下,在含有作为碳源的 2. 4%葡萄糖或者2 %纤维素的合适的营养培养基中,与A.nidulansgpdA启动子相比, 给予报告蛋白更多表达的启动子。合适的报告蛋白的例子为FLAG标记的内切葡聚糖酶 (在实施例2中描述)和FLAG标记的葡糖淀粉酶(在实施例5中描述)。优选地,将启动 子-报告子构建体的一个拷贝整合至特定基因座,从而防止由于拷贝数或者整合至基因 组的位置造成的表达差异(在实施例5中描述)。用于比较启动子活性的合适的营养培养 基和生长条件取决于宿主。例如,细胞可在实验室或者工业发酵器中通过摇瓶培养、小规 模或者大规模发酵(包括连续、分批、分批补料(fed-batch)或者固态发酵)来培养,其在 合适培养基和使得启动子-报告子基因被表达的条件下进行。在包含碳源和氮源以及无 机盐的合适的营养培养基中使用本领域已知的工序进行培养(对于丝状真菌宿主而言,参 见例如,Bennett,J.W.和LaSure,L.编,MoreGeneManipulationsinFungi,Academic Press,CA,1991)。测定Rasamsonia中启动子活性的具体条件的例子在实施例2和实施 例5中描述。Trichoderma中合适的营养培养基和生长条件的例子在Zou等人,2012. Constructionofacellulasehyper-expressionsysteminTrichodermareeseiby promoterandenzymeengineering.MicrobCellFact. , 2012Feb8 ;11 (1) : 21 中描述;以 及用于Aspergillus情况下的合适营养培养基和生长条件的例子在EP635574中描述。
[0073] 术语"诱导型启动子"定义为:活性通过存在或者不存在生物或者非生物因素(例 如木质纤维素的酶促水解衍生的化合物、金属、温度或者光)诱导的启动子。木质纤维素的 酶促水解衍生的化合物的例子为槐糖(sophorose)、龙胆二糖、纤维二糖和木糖。
[0074] 编码序列或者目标基因的过表达是指目标蛋白的表达和/或分泌与之前情况相 比(例如在连同使能在亲本细胞中表达的编码序列引入启动子之前)是新的或者增加的。
[0075] 能高水平表达的基因(即高表达的基因)在本文中被定义为:在例如诱导条件下, 其mRNA可占总细胞mRNA的至少0. 5% (w/w)的基因;或者,其基因产物可占总细胞蛋白的 至少1% (w/w)的基因;或者在分泌的基因产物的情况下,可分泌至至少0.lg/1水平的基 因(如EP357127B1 所述)。
[0076] 在一个优选的实施方式中,启动子为任何Rasamsonia启动子。为转录基因所挑 选的特定启动子的选择取决于培养基条件,其中启动子应当为有活性的。此外,启动子的 强度是启动子选择的标准。启动子的强度取决于宿主菌株和发酵条件。通过在特定发酵 条件下生长丝状宿主和通过使用例如微阵列分析、定量RT-PCR或者RNA测序来定量转录 物水平可确定优选的启动子。使用本领域技术人员已知的标准方法能够进行微阵列分析, 例如通过在Kiryu等人,2005.Extractingrelationsbetweenpromotersequencesand theirstrengthsfrommicroarraydata.Bioinformatics21 (7) : 1062-1068 中描述的方 法。使用本领域技术人员已知的标准方法能够进行RNA的测序,例如使用第二代测序技术, 例如IlluminaGA2、Roche454 等,如在Pareek等人,2011Sequencingtechnologiesand genomesequencing,】ApplGenetics52:413 - 435 中所综述。或者,使用MALDI-T0F分 析、LC-MS或者LC/MS-MS,通过蛋白质组学研究能确定感兴趣的启动子,其中根据表达的蛋 白量能选择启动子。
[0077] 通过定量转录物,可以评估给定条件下的启动子强度。比较在不同条件下的强度 使得可以确定条件特异性诱导型启动子。或者,可识别在不同条件下激活和组成型激活的 启动子。
[0078] 在一个优选的实施方式中,本发明的启动子DNA序列为以下列表中所示的DNA序 列:SEQIDNO1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:11、 SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQIDN0:16*#SEQIDN0:17。
[0079] 根据另一优选的实施方式,本发明的启动子DNA序列是能够与以下列表所示的 DNA序列杂交且仍然保持启动子活性的DNA序列:SEQIDNO1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDNO: 11、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、 5£〇10勵:16或者5£〇10勵:17,。
[0080] 在本发明上下文中,优选通过测量编码序列表达所产生的蛋白质的浓度来确定启 动子活性,该编码序列与该启动子可操作相连。或者,通过测量由编码序列编码的蛋白质 的酶活性来确定启动子的活性,该编码序列与该启动子可操作相连。根据一个优选的实施 方式,通过测量lacZ报告基因编码序列的表达(在Luo(Genel63 (1995) 127-131)或者通 过测量FLAG标记的蛋白例如FLAG标记的葡糖淀粉酶(参见实施例)来测定启动子活性 (及其强度)。根据另一优选的实施方式,通过使用绿色荧光蛋白作为编码序列来测定启动 子的活性(在Microbiology. 1999Mar;145(Pt3) :729-34.SanterreHenriksenAL,Even S, MullerC,PuntPJ,vandenHondelCA,NielsenJ.Study)。此外,通过测量在启动子控 制下产生的转录物的mRNA水平能够测定启动子活性。mRNA水平能例如通过Northern印迹 来测量(J.Sambrook,E.F.Fritsch和T.Maniatus, 1989,MolecularCloning,ALaboratory Manual,第2版,ColdSpringHarbor,N.Y.)。在用于确定启动子活性的所有所描述的测 定中,可将该启动子活性与另一启动子活性相比较,这例如通过将相同的报告基因或者编 码序列置于不同启动子控制下并在相同条件下测量启动子活性来实现。
[0081] 本发明涵盖在非常低严格条件,优选低严格条件,更优选中严格条件,更优选 中-高严格条件,甚至更优选高严格条件,和最优选非常高严格条件下与核酸探针的互补 链杂交的(分离的)启动子DNA序列,所述核酸探针对应于:
[0082] a.SEQIDNO: 1或者SEQIDN0:2的第1至1494位核苷酸,优选第100至1494,更 优选200至1494,甚至更优选300至1494,甚至更优选350至1494以及最优选360至1494 位核苷酸;
[0083] b.SEQIDN0:2的第1至1482位核苷酸,优选第100至1482,更优选200至1482, 甚至更优选300至1482,甚至更优选350至1482以及最优选360至1482位核苷酸;
[0084] c.SEQIDN0:3或者SEQIDN0:4的第1至1503位核苷酸,优选第100至1503,更 优选200至1503,甚至更优选300至1503,甚至更优选350至1503以及最优选360至1503 位核苷酸;
[0085] d.SEQIDN0:5的第1至1979位核苷酸,优选第100至1979,更优选200至1979, 甚至更优选300至1979,甚至更优选350至1979以及最优选360至1979位核苷酸;
[0086] 6.5£〇10勵:12、5£〇10勵:13、5£〇10勵:14、5£〇10勵:16或者5£〇10勵:17 的第1至1501位核苷酸,优选第100至1501,更优选200至1501,甚至更优选300至1501, 甚至更优选350至1501以及最优选360至1501位核苷酸;或者
[0087] f.SEQIDN0:15的第1至651位核苷酸,优选第50至651,更优选100至651,甚 至更优选150至651,甚至更优选200至651以及最优选250至651位核苷酸。
[0088] 术语互补链为本领域技术人员所已知,并在J.Sambrook,E.F.Fritsch和 T. Maniatis, 1989,MolecularCloning,ALaboratoryManual,第 2 版,ColdSpring Harbor,N.Y中描述。
[0089] 如本文所使用,术语"杂交"旨在描述用于杂交和洗涤的条件,在该条件下,彼此之 间至少约60%、至少约70%、至少约80%、更优选至少约85%、甚至更优选至少约90%、更 优选至少95%、更优选至少98%或者更优选至少99%同源的核苷酸序列通常保持彼此杂 交。
[0090] 这些杂交条件的一个优选、非限制性例子为在约45°C下在6X氯化钠/柠檬酸钠 (SSC)中杂交,然后在50°C下,优选在55°C下,优选在60°C下以及甚至更优选在65°C下在 IXSSC,0. 1%SDS中洗涤一次或者更多次。
[0091] 高严格条件包括例如在68°C下在5xSSC/5xDenhardt's溶液/I. 0%SDS中杂交 和在室温下在0. 2xSSC/0. 1%SDS中洗涤。或者,可在42°C下进行洗涤。
[0092] 技术人员将知道严格和高严格杂交条件适用何种条件。容易在本领域中获得关于 这些条件的另外的指导,例如,在Sambrook等人,1989,MolecularCloning,ALaboratory Manual,ColdSpringHarborPress,N.Y.;和Ausubel等人(编辑),1995,Current ProtocolsinMolecularBiology,(Johnffiley&Sons,N.Y.)中。
[0093] 当然,仅与多聚腺苷酸序列(例如mRNA的3'末端poly(A)段(tract))或者仅与 T(或者U)残基的互补性延伸区段(stretch)杂交的多核苷酸将不被包括在用于与本发明 核酸的一部分特异性杂交的本发明多核苷酸中,因为此类多核苷酸将与含有poly(A)延伸 区段或者其互补物的任何核酸分子杂交(例如,几乎任何双链cDNA克隆)。
[0094] SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQID 勵:12、5£〇10勵:13、5£〇10勵:14、5£〇10勵:15、5£〇10勵:16或者5£〇10勵:17的 子序列(subsequence)可以为至少100个核苷酸、优选至少200个核苷酸、更优选至少300 个核苷酸、甚至更优选至少400个核苷酸以及最优选至少500个核苷酸。
[0095] SEQIDN0:USEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQID NO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 的 核酸序列或者其子序列可被用于设计核酸探针,以按照本领域公知的方法来识别和克隆来 自不同属或者种的菌株的DNA启动子。尤其,此类探针可被用于按照标Southern印迹法工 序与目标属或者种的基因组或者cDNA杂交,以识别和分离其中相应的基因。此类探针可比 完整序列短很多,但是长度应当为至少15个,优选至少25个,更优选至少35个核苷酸。此 夕卜,此类探针可被用于通过PCR来扩增DNA启动子。也可以使用更长的探针。可以使用DNA、 RNA和肽核酸(PNA)探针。典型地,对探针进行标记,用于探测相应的基因(例如,用032P、 @33P、@3H、035S、生物素或者亲和素或者荧光标记物)。此类探针被涵盖在本发明中。
[0096] 因此,可对从所述其它生物制得的基因组DNA或者cDNA文库加以筛选,选出与上 述探针杂交并编码多肽的DNA。可通过琼脂糖或者聚丙烯酰胺凝胶电泳或者其它分离技术 来分离来自此类其它生物的基因组或者其它DNA。可将来自文库的DNA或者分离的DNA转移 并固定到硝酸纤维素或者其它合适的载体材料上。为识别出与SEQIDN0:1、SEQIDN0:2、 SEQIDNO:3、SEQIDNO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、 SEQIDNO: 15、SEQIDNO: 16或者SEQIDNO: 17或者其子序列同源的克隆或者DNA,可将 运载体材料用于Southern印迹中。
[0097] 就本发明的目的而言,杂交指:核酸序列与对应于SEQIDN0:1、SEQIDN0:2、SEQ IDNO:3、SEQIDNO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQ IDNO: 15、SEQIDNO: 16或者SEQIDNO: 17所示核酸序列的互补链的经标记核酸探针在 非常低至非常高严格条件下杂交。用例如X射线膜来探测在这些条件下与核酸探针杂交 的分子。也可使用其它杂交技术,例如,使用荧光来探测以及玻璃片(glassside)和/或 DNA微阵列作为支持物的技术。FEMSYeastRes. 2003Dec;4 (3): 259-69 (Daran-Lapujade P,DaranJM,KotterP,PetitT,PiperMD,PronkJT."Comparativegenotypingof theSaccharomycescerevisiaelaboratorystrainsS288CandCEN.PK113-7Dusing oligonucleotidemicroarrays"中给出了DNA微阵列杂交探测的例子。此外,PNA微阵 列用于杂交的用途在NucleicAcidsRes. 20030ctl;31(19):ell9(Brandt0,Feldner J,StephanA,SchroderM,SchnolzerM,ArlinghausHF,HoheiselJD,JacobA.PNA microarraysforhybridisationofunlabelledDNAsamples)中描述。
[0098] 在一个优选的实施方式中,核酸探针为SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、 SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、 SEQIDNO: 16或者SEQIDNO: 17的核酸序列。在另一优选的实施方式中,核酸探针为具有 以下的序列:
[0099] a.SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQID NO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQIDNO: 17 的第 20 至 1480 位核苷酸,更优选SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、 SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQIDNO: 17 的第 500 至 1480 位核苷酸,甚至更优选SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQ IDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQIDNO: 17 的第 800 至 1480 位核苷酸,以及最优选SEQIDNO: 1、SEQIDNO:2、SEQIDNO:3、SEQID NO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 16 或者SEQ IDNO: 17的第900至1480位核苷酸;或者
[0100] b.SEQIDNO: 15 的第 20 至 651 位核苷酸,更优选SEQIDNO: 15 的第 100 至 651 位核苷酸,甚至更优选SEQIDNO: 15的第200至651位核苷酸,以及最优选SEQIDNO: 15 的第300至651位核苷酸;或者
[0101] 另一优选探针为紧邻转录起始位点之前的DNA序列的部分。
[0102] 对于长度为至少100个核苷酸的长探针而言,非常低至非常高严格条件被定义 为:按照标准Southern印迹法工序,在42摄氏度下在以下中进行预杂交和杂交:5倍SSPE、 0. 3%SDS、200微克/ml经剪切和变性的鲑鱼精DNA,以及对于非常低和低严格而言的25% 甲酰胺;对于中等和中-高严格而言的35%甲酰胺;或者对于高严格和非常高严格而言的 50%甲酰胺。
[0103] 对于长度为至少100个核苷酸的长探针而言,载体材料被最终洗涤三次,每次15 分钟,其中使用2倍SSC、0. 2%SDS,优选至少在45摄氏度(非常低严格),更优选在至少50 摄氏度(低严格),更优选在至少55摄氏度(中严格),更优选在至少60摄氏度(中-高 严格),甚至更优选在至少65摄氏度(高严格)以及最优选在至少70摄氏度(非常高严 格)下进行。
[0104] 对于长度为大约15个核苷酸至大约70个核苷酸的短探针而言,严格条件被定义 为:预杂交、杂交和杂交后洗漆在比根据Bolton和McCarthy(1962,Proceedingsofthe NationalAcademyofSciencesUSA48:1390)的算式计算得到的Tm低 5 摄氏度至 10 摄氏度的温度下,在 0.9MNaCl、0.09MpH7.6 的Tris-HCl、6mM£01八、0.5%咿-40、1倍 Denhardt's溶液、ImM焦憐酸纳、ImM憐酸二氧纳、0.ImMATP和0. 2mg酵母RNA/ml中,按照 标准Southern印迹法工序来进行。
[0105] 对于长度为大约15个核苷酸至大约70个核苷酸的短探针而言,载体材料如下洗 涤:使用6倍SSC加0. 1 %SDS洗涤一次,15分钟;用6倍SSC洗两次,每次15分钟,在比计 算出的Tm低5摄氏度至10摄氏度下进行。
[0106] 根据另一优选的实施方式,SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、 SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQIDN0:16* 者SEQIDNO: 17首先被用于克隆与之可操作相连的天然基因、编码序列或者其部分。这可 以用前文定义的SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQ IDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 或者其子序列来开始,用该序列作为探针。将探针与给定宿主(Rasamsoniaemersonii或 者本申请中定义的任何其它宿主)的cDNA或者基因组文库杂交。一旦天然基因或者其部 分已被克隆,随后就可以通过如本文所述的杂交实验,用其自身作为探针去克隆来自其它 真菌的其同源基因。
[0107] 在本发明的上下文中,同源基因是指与天然基因至少50%同源(相同)的基因。 优选地,同源基因与天然基因至少55 %同源,更优选至少60 %,更优选至少65 %,更优选至 少70 %,甚至更优选至少75 %,优选约80 %,更优选约90 %,甚至更优选约95 %,甚至更优 选约97 %,甚至更优选约98 %,甚至更优选约99 %,以及最优选约99. 5 %同源。
[0108] 同源基因编码序列上游的序列是本发明所涵盖的启动子。或者,使用例如本文所 述的比对或者BLAST算法,可以用前文定义的SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDNO:4、SEQIDNO:5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、 SEQIDNO: 16或者SEQIDNO: 17或者其子序列去检索基因组数据库来识别对与本发明启 动子可操作相连的天然基因、编码序列或者其部分的序列。该识别出的序列随后可被用于 识别本申请所定义的任何其它宿主中的直系同源(orthologue)或者同源基因。识别出的 直系同源或者同源基因的编码序列上游序列是本发明所涵盖的启动子。
[0109] 根据另一优选的实施方式,本发明的启动子DNA序列是(分离的)DNA序列,其与 SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQ IDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 至少 50% 同源 (相同)。优选地,DNA序列与SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQ IDNO: 5、SEQIDNO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者 SEQIDNO: 17至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,甚至更 优选至少75 %,优选约80 %,更优选约90 %,甚至更优选约95 %,甚至更优选约97 %,甚至 更优选约98%,甚至更优选约99%,以及最优选约99. 5 %同源。
[0110] 就本发明的目的而言,两条核酸序列之间同源性(同一性)的程度优选通过BLAST 程序来确定。用于进行BLAST分析的软件是公众可通过国家生物信息中心(National CenterforBiotechnologyInformation)(http://www.ncbi.nlm.nih.gov/)获得 的。BLAST算法参数W、T和X确定了比对的灵敏度和速度。BLAST程序使用缺省值,字 长(W)为 11,BL0SUM62 分数矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对⑶为50,期望(E)为10,M= 5,N=-4,以及对两条链比较。
[0111] 术语"同源性"、"同一性"或者"同一性百分比"在本文中可互换使用。就本发明的 目的而言,在此定义为:为确定两条氨基酸序列或者两条核酸序列的同一性百分比,本着最 佳比较的目的(例如,可以在第一条氨基酸序列或者核苷酸序列上引入缺口,以与第二条 氨基酸序列或者核苷酸序列最佳比对)来对序列进行比对。然后对相应氨基酸位置或者核 苷酸位置上的氨基酸残基或者核苷酸进行比较。如果第一条序列上某位置的氨基酸残基或 者核苷酸与第二条序列上相应位置的相同,那么分子在此位置就是相同的。两条序列间的 同一性百分比是序列共有的相同位置的数量的函数(即,同一性%=相同位置的数量/位 置(即重叠位置)总数X100)。优选地,两条序列长度相同。
[0112] 在另一优选的实施方式中,启动子是SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、 SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、 SEQIDNO: 16或者SEQIDNO: 17的子序列,该子序列仍然具有启动子活性。子序列优选含 有至少约100个核苷酸,更优选至少约200个核苷酸,以及最优选至少约300个核苷酸。
[0113] 在另一优选的实施方式中,子序列是由已缺失5'和/或3'端的一个或者更多个 核苷酸的SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQID NO: 12、SEQIDNO: 13、SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17 涵 盖的核酸序列,该DNA序列仍然具有启动子活性。
[0114] 在另一优选的实施方式中,启动子序列是"经修整的(trimmed)"的子序列,即, 翻译起始处和/或转录起始处上游的序列片段。对启动子进行修整以及功能分析的例子 见Gene. 1994Aug5 ; 145 (2):179-87:theeffectofmultiplecopiesoftheupstream regiononexpressionoftheAspergillusnigerglucoamylase-encodinggene. VerdoesJC,PuntPJ,StouthamerAH,vandenHondelCA)中所述。
[0115] 在本发明的另一实施方式中,启动子DNA序列是SEQIDN0:1、SEQIDN0:2、SEQ IDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:11、SEQIDN0:13、SEQIDN0:14、SEQID NO: 15、SEQIDNO: 16 或者SEQIDNO: 17 的变体。
[0116] 术语"变体"或者"变体启动子"在本文中被定义为具有下述核苷酸序列的启动子, 所述核苷酸序列包含亲本启动子一个或者更多个核苷酸的替换、缺失和/或插入,其中变 体启动子较之相应的亲本启动子具有更多或者更少的启动子活性。这些替换、缺失和/或 插入的长度可不同,例如1-1000个核苷酸,优选1-100个核苷酸,更优选1-20个核苷酸,甚 至更优选1-10个核苷酸,还更优选1-6个核苷酸,以及最优选1-3个核苷酸,但仍然得到具 有启动子活性的生物活性多核苷酸。
[0117] 术语"变体启动子"涵盖天然变体和用本领域公知的方法例如经典诱变、定点诱变 和DNA改组(shuffling)获得的体外产生的变体。变体启动子可以具有一处或者更多处突 变。每处突变是独立的核苷酸的替换、缺失和/或插入。
[0118] 根据一个优选的实施方式,变体启动子为:较之最初识别出的启动子序列(SEQID N0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、SEQIDN0:12、SEQIDN0:13、 SEQIDNO: 14、SEQIDNO: 15、SEQIDNO: 16 或者SEQIDNO: 17)具有至少一处经修饰的 调控位点的启动子。此类调控位点可以被整体去除或者按照上文的解释进行特异性突变。 此类启动子变体的调控被修饰从而例如其不再被葡萄糖所诱导。此类启动子变体和如何获 得它们的技术的例子在EP673429或者W094/04673中描述。
[0119]启动子变体可以是等位变体。等位变体是指占据相同染色体基因座的基因的两种 或者更多种可替换形式中的任意种。等位变化是通过突变天然产生的,其能导致种群内的 多态性。可通过下述获得变体启动子:(a)在非常低、低、中、中-高、高或者非常高严格条 件下,使DNA与⑴SEQIDN0:1、SEQIDN0:2、SEQIDN0:3、SEQIDN0:4、SEQIDN0:5、 SEQIDN0:12、SEQIDN0:13、SEQIDN0:14、SEQIDN0:15、SEQIDN0:16*#SEQID NO: 17 ; (ii) (i)的子序列;或者(iii) (i)、(ii)的互补链杂交,以及(b)从DNA分离变体启 动子。严格性和洗涤条件如本文所定义。
[0120] 本发明的启动子可以是其序列可提供有接头的启动子,所述接头用于如下目的: 引入特定限制位点从而促进启动子序列与编码多肽的核酸序列编码区之间的连接。
[0121] 本文提供的序列信息不应被狭义理解为需要包括被错误识别的碱基。本文公开的 特定序列可容易地被用于从优选的丝状真菌(特别是Rasamsonia)分离原始DNA序列,再 对其进行进一步的序列分析,由此识别出测序错误。
[0122] 除非另有指明,本文中通过对DNA分子进行测序测定的所有核苷酸序列都是用自 动DNA测序仪测定的。因此,如本领域关于通过该自动方法测定的任何DNA序列所已知的, 本文测定的任何核苷酸序列可能含有一些错误。通过自动方法测定的核苷酸序列典型地与 被测序DNA分子的实际核苷酸序列至少大约90%相同,更典型地,至少约95%相同至至少 大约99. 9%相同。可以通过包括本领域公知的手动DNA测序方法的其它方法对实际序列 进行更为精确的测定。
[0123] 本领域技术人员能识别出此类被错误识别的碱基,并且知道如何更正此类错误。
[0124] 本发明涵盖启动子的功能等同物,其典型地含有不改变相关启动子生物功能的突 变。术语"功能等同物"也涵盖RasamsoniaDNA序列的直系同源物。RasamsoniaDNA序列 的直系同源物是可从其它生物体、其他真菌物种或者菌株中分离并且具有相似或者相同生 物活性的DNA序列。
[0125] 本发明的启动子序列可从任何属的微生物中获得。就本发明的目的而言,如本文 所使用的与给定来源相关的术语"从……获得"应表示:多肽是该来源产生的或者是被来自 该来源的基因所插入的细胞产生的。
[0126] 启动子序列可从真菌来源获得,优选Rasamsonia菌株,更优选Rasamsonia emersonii〇
[0127] Rasamsonia是包括耐热和嗜热的Talaromyces和Geosmithia物种的新 属(J.Houbraken等人,见上)。基于表型、生理和分子数据,Houbraken等人提议将 T.emersonii、T.byssochlamydoides、T.eburneus、G.argillacea和G.cylindrospora种改 为Rasamsoniagen.nov。Talaromycesemersonii、Penicilliumgeosmithiaemersonii 和Rasamsoniaemersonii在本文中可交换使用。
[0128] 应理解,对上述物种而言,本发明包括完美的和不完美的状态以及其它分类学等 同物,例如,无性型(anamorph),而不管它们是以什么种名被知道的。本领域技术人员容 易对合适的等同物加以鉴定。这些物种的菌株是公众容易从大量的培养单位获得的,例 如,美国典型培养物保藏中心(AmericanTypeCultureCollection(ATCC))、德国微生物 和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturen GmbH(DSM))、荷兰真菌培养物保藏中心(CentraalbureauVoorSchi_elcultures(CBS)) 和农业研究机构专利培养物保藏中兴北区研究中心(AgriculturalResearchService PatentCultureCollection,NorthernRegionalResearchCenter(NRRL))〇
[0129] 而且,可使用上文提到的探针,从其它来源(包括从自然界(例如,土壤、肥料、水 等)分离的微生物)鉴定并获得根据本发明的启动子序列。用于从自然环境分离微生物的 技术是本领域公知的。然后可以通过对其它微生物基因组DNA文库进行类似筛选来获得核 酸序列。一旦用探针探测出了编码启动子的核酸序列,就可以利用本领域普通技术人员已 知的技术来分离或者克隆该序列(例如,参见Sambrook等人,1989,见上)。
[0130] 在本发明中,启动子DNA序列还可以是杂合启动子,其包含本发明的一种或者更 多种启动子的一部分;本发明的启动子的一部分以及另外的已知启动子的一部分,例如,一 种启动子的前导序列(leadersequence)和来自其它启动子的转录起始位点;或者本发明 的一种或者更多种启动子的一部分以及一种或者更多种其它启动子的一部分。其它启动子 可以是任何在选用的宿主细胞中显示出转录活性的启动子序列,包括变体的、截短的和杂 合的启动子,并且其可以从编码对于宿主细胞来说同源或者异源的、细胞外或者细胞内多 肽的基因获得。其它启动子序列可以是对编码多肽的核酸序列来说天然的或者外源的,并 且对细胞来说可以是天然的或者外源的。
[0131] 作为一个优选的实施方式,鉴定出的启动子的重要调控子序列可以与其它 "基础"启动子融合,从而增强它们的启动子活性(例如,见MolMicrobiol. 1994May; 12 (3):479-90.Regulationofthexylanase-encodingxlnAgeneofAspergillus tubigensis.deGraaffLH,vandenBroeckHC,vanOoijenAJ,VisserJ.中所述)。
[0132] 可用于与本发明的启动子一起构建杂合启动子的其它启动子的其他例子包括:从 A.oryzaeTAKA淀粉酶、Rhizomucormiehei天冬氨酸蛋白酶、A.niger中性a-淀粉酶、 A.niger酸稳定性a-淀粉酶、A.niger或者Aspergillusawamori葡糖淀粉酶(glaA)、 A.nigergpdA、A.niger葡萄糖氧化酶goxC、Rhizomucormiehei脂酶、A.oryzae喊性蛋白 酶、A.oryzae憐酸丙糖异构酶、A.nidulans乙醜胺酶和Fusariumoxysporum膜蛋白酶样蛋 白酶(W0 96/00787)的基因获得的启动子,以及NA2-tpi启动子(来自A.niger中性a-淀 粉酶和A.oryzae磷酸丙糖异构酶基因的启动子的杂合体)、Saccharomycescerevisiae烯 醇酶(EN0-1)、Saccharomycescerevisiae半乳糖激酶(GAL1)、Saccharomycescerevisiae 醇脱氧酶/甘油醒_3_憐酸脱氧酶(ADH2/GAP)和Saccharomycescerevisiae3_憐酸甘 油酸激酶的基因获得的启动子及其突变的、截短的和杂合的启动子。酵母宿主细胞的另一 些可使用启动子通过Romanos等人,1992,Yeast8:423-488描述。
[0133] 在本发明中,启动子DNA序列还可以是"串联启动子"。"串联启动子"在本文中被 定义为两个或者更多个启动子序列,它们每一个都与编码序列可操作相连,并介导编码序 列转录成mRNA。
[0134] 串联启动子包含:本发明的两种或者更多种启动子,或者本发明的一种或者更多 种启动子与一种或者更多种其它已知的启动子,例如上文例示的用于构建杂合启动子的那 些。串联启动子的两种或者更多种启动子序列可以同时促进核酸序列的转录。或者,串联 启动子的一种或者更多种启动子序列可以促进核酸序列在细胞不同生长阶段或者菌丝体 不同形态部分的转录。
[0135] 在本发明中,启动子对于编码生物化合物的编码序列可以是外源的和/或启动子 对于宿主细胞来说可以是外源的。本发明的变体、杂合或者串联启动子应当被理解为对于 编码的编码序列来说是外源的,即使野生型启动子对编码序列或者宿主细胞是天然的。
[0136] 本发明的变体、杂合或者串联启动子的启动子活性为:具有SEQIDNO: 1、SEQID NO:2,SEQIDNO:3,SEQIDNO:4,SEQIDNO:5,SEQIDNO: 12,SEQIDNO: 13,SEQID NO: 14、SEQIDNO: 15、SEQIDNO: 16或者SEQIDNO: 17的启动子的启动子活性的至少约 20%、优选至少约40%、更优选至少约60%、更优选至少约80%、更优选至少约90%、更优 选至少约100%、甚至更优选至少约200%、最优选至少约300%、以及甚至最优选至少约 400 %。启动子活性优选如说明书中前述部分所述来测定。
[0137] 本发明还涉及下述DNA构建体,该DNA构建体包含(至少一个)如上所述的启动子 DNA序列和与该启动子DNA序列可操作相连的编码序列,从而编码序列可以在启动子DNA 序列的控制下表达。这可在任何合适的宿主细胞中检测。或者,这可在合适的体外表达和 /或翻译体系中检测。编码序列可从任何原核的、真核的或者其它来源中获得。或者,编码 序列可以是合成的或者部分合成的序列。合成基因的密码子使用己经被最优化来匹配宿主 细胞物种的密码子使用,从而促进所编码的生物物质的表达和/或分泌。优化密码子使用 的例子描述于W097/11086中,其中植物多肽的密码子使用被优化为在丝状真菌细胞中表 达。优选地,编码序列编码生物化合物。两种或者更多种这些DNA构建体可连接以形成新 的(串联)DNA构建体。该新的(串联)构建体可包含两种或者更多种DNA构建体,其例如 包含(启动子-开放阅读框-终止子)连接至(启动子-开放阅读框-终止子),该(启动 子-开放阅读框-终止子)可任选连接下一个(启动子-开放阅读框-终止子)单元。在 例如有5个线状排列单元的情况下,DNA构建体优选包含5种不同的启动子,从而防止单元 因重组而缺失。优选至少一种启动子为本发明的启动子。
[0138] 或者,编码序列可编码反义RNA和/或RNAi(RNA干扰)构建体的表达。反义RNA 表达的实例显不于ApplEnvironMicrobiol. 2000Feb;66 (2): 775-82.(Characterization ofafoldase,proteindisulfideisomeraseA,intheproteinsecretorypathway ofAspergillusniger.NgiamC,JeenesDJ,PuntPJ,VanDenHondelCA,ArcherDB) 或者(ZrennerR,ffillmitzerL,SonnewaldU.Analysisoftheexpressionofpotato uridinediphosphate-glucosepyrophosphorylaseanditsinhibitionbyantisense RNA.Planta. (1993) ; 190 (2): 247-52)中。基因表达的完全灭活用于例如灭活控制不期望 的代谢途径分支的基因,例如从而提高特定次级代谢产物例如内酰胺)抗生素或者类 胡萝卜素的产生。完全灭活也用于减少毒素或者非所需化合物的产生(Penicillium中的 黄青霉素;Aspergillus中的黄曲霉毒素:MacDonaldKD等人,heterokaryonstudiesand thegeneticcontrolofpenicillinandchrysogeninproductioninPenicillium chrysogenum.JGenMicrobiol. (1963)33:375-83)。完全灭活还用于改变生物的形态以改 进发酵过程和下游加工。
[0139] 本发明的另一实施方式涉及对宿主细胞的广泛代谢程序重排或者工程改造。引入 全新的途径和/或修饰非所需途径会提供特别适用于产生特定生物化合物(例如蛋白质或 者代谢产物)的细胞。
[0140] 在本发明的方法中,当编码序列编码多肽时,该多肽还可包括融合的或者杂合的 多肽,其中另一多肽与该多肽或者其片段的N-末端或者C-末端融合。融合的多肽通过将 编码一个多肽的核酸序列(或者其一部分)与编码另一多肽的核酸序列(或者其一部分) 融合来产生。用于产生融合多肽的技术为本领域已知,其包括:连接编码多肽的编码序列, 使得其同框并且使得融合多肽的表达位于相同的启动子和终止子控制下。杂合多肽可包含 由至少两个不同多肽获得的部分或者完整多肽序列的组合,其中一个或者更多个所述多肽 可以对真菌细胞而言异源。
[0141] 除启动子DNA序列外,DNA构建体可包含一个或者更多个控制序列,启动子DNA序 列指导编码序列在合适宿主细胞中在与控制序列相容的条件下表达。表达应理解为包括多 肽生产中涉及的任何步骤,其包括但不仅限于转录、转录后修饰、翻译、翻译后修饰和分泌。 一个或者更多个控制序列可以对编码序列或者宿主是天然的。或者,一个或者更多个控制 序列可以用对核酸序列而言为外源的一个或者更多个控制序列代替,用于改善编码序列在 宿主细胞中的表达。
[0142] "DNA构建体"在本文中被定义为单链或者双链的核酸分子,其分离自天然存在的 基因,或者其经修饰而含有以自然中不会存在的方式组合和并置的核酸区段。当DNA构建 体含有编码序列和编码序列表达所需的全部控制序列时,术语DNA构建体与术语表达盒同 义。
[0143] 术语"控制序列"在本文中被定义为包括对编码序列表达必需或者有利的所有 成分,包括本发明的启动子。各控制序列可以对编码多肽的核酸序列是天然的或者外源 的。这类控制序列包括但不仅限于前导序列、翻译起始序列(如在Kozak,1991,J.Biol. Chem. 266:19867-19870中所述)、翻译起始编码序列、聚腺苷酸化序列、前肽序列、信号肽 序列、上游激活序列、本发明的启动子(包括源自它的变体、片段和杂合以及串联启动子)、 转录终止子和翻译终止子。控制序列最少包括转录和翻译终止信号和(部分的)本发明 启动子。控制序列可以与用于引入特异限制性位点的接头一起提供,以便于连接控制序列 与编码多肽的核酸序列的编码区。
[0144] 控制序列可以是合适的转录终止子序列,即被宿主细胞识别以终止转录的序列。 终止子序列与编码多肽的编码序列3'末端可操作相连。任何在所选宿主细胞中有功能的 终止子可用于本发明。
[0145] 用于丝状真菌宿主细胞的优选终止子得自A.oryzaeTAKA淀粉酶、A.niger葡 糖淀粉酶、A.nidulans氨基苯甲酸合酶、A.nigera-葡糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶样蛋白酶的基因。
[0146] 控制序列还可为合适的前导序列,即mRNA的5'非翻译区,其对宿主细胞翻译是重 要的。前导序列与编码多肽的核酸序列的5'末端可操作相连。任何在所选宿主细胞中有 功能的前导序列可用于本发明。
[0147] 用于丝状真菌宿主细胞的优选前导序列由A.oryzaeTAKA淀粉酶、A.nidulans磷 酸丙糖异构酶和A.nigerglaA的基因获得。
[0148] 控制序列还可以是聚腺苷酸化序列,该序列与核酸序列3'末端可操作相连并且 经转录后被宿主细胞识别为向经转录的mRNA添加聚腺苷酸残基的信号。在所选宿主细胞 中有功能的任何聚腺苷酸化序列可用于本发明。
[0149] 用于丝状真菌宿主细胞的优选的聚腺苷酸化序列由A.oryzaeTAKA淀粉酶、 A.niger葡糖淀粉酶、A.nidulans氨基苯甲酸合酶、Fusariumoxysporum膜蛋白酶样蛋白 酶和A.nigera-葡糖苷酶获得。
[0150] 控制序列还可以是信号肽编码区,其编码与多肽的氨基末端连接并指导被编码的 多肽进入细胞分泌途径的氨基酸序列。核酸序列编码序列的5'端可固有地含有信号肽编 码区,该信号肽编码区与编码被分泌多肽的编码区区段按翻译阅读框天然连接。或者,编码 序列的5'端可含有对编码序列是外源的信号肽编码区。当编码序列天然不含有信号肽编 码区时,可需要外源信号肽编码区。或者,外源信号肽编码区可简单地替换天然信号肽编码 区,从而增强多肽的分泌。然而,指导所表达的多肽进入所选宿主细胞分泌途径的任何信号 肽编码区可用于本发明。
[0151] 用于丝状真菌宿主细胞的有效信号肽编码区为由A.oryzaeTAKA淀粉酶、A.niger 中性淀粉酶、A.ficuum植酸酶、A.niger葡糖淀粉酶、A.niger内切木聚糖酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicolainsolens纤维素酶和Humicolalanuginosa脂酶的基 因获得的信号肽编码区。
[0152] 用于酵母宿主细胞的有用信号肽由Saccharomyces cerevisiaea-因子和 Saccharomyces cerevisiae转化酶的基因获得。另一些有用的信号肽编码区描述于 Romanoset al.,1992,见上。
[0153] 控制序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。得到的 多肽称为前酶(proenzyme)或者前多肽(或者一些情况下为酶原(zymogen))。前多肽通 常是无活性的,并可通过将前肽从前多肽上催化或者自身催化切割转化为成熟的活性多 肽。前肽编码区可由Bacillussubtilis碱性蛋白酶(aprE)、Bacillussubtilis中性蛋 白酶(nprT)、Saccharomycescerevisiaea-因子、Rhizomucormiehei天冬氨酸蛋白酶、 ]\15^61;[0口111:110四1:1161'1]1〇口11;[13漆酶(冊 95/33836)和六.111861'内切木聚糖酶(611(101)的基 因获得。
[0154] 当信号肽和前肽区均出现在多肽氨基末端时,前肽区处在与多肽的氨基末端相邻 的位置,而信号肽区处在与前肽区的氨基末端相邻的位置。
[0155] 还可期望添加调节序列,其允许相对于宿主细胞的生长调节多肽表达。调节体系 的实例为响应化学或者物理刺激(包括调节化合物的存在)引起基因的表达被打开或者 关闭的那些调节体系。原核体系中的调节体系包括lac和trp操纵子体系。在酵母中,可 使用ADH2体系或者GAL1体系。在丝状真菌中,可使用TAKAa-淀粉酶启动子、A.niger葡 萄糖淀粉酶启动子、A.oryzae葡糖淀粉酶启动子、A.tubingensis内切木聚糖酶(xlnA)启 动子、A.niger硝酸还原酶(niaD)启动子、Trichodermareesei纤维二糖水解酶启动子和 A.nidulans醇和醛脱氢酶(分别为alcA和aldA)启动子(如US5, 503, 991中所述)作为 调节序列。调节序列的其它实例为允许基因扩增的那些调节序列。在真核体系中,这些包 括二氢叶酸还原酶基因(其在存在氨甲蝶呤时被扩增)和金属硫蛋白基因(其在有重金属 时被扩增)。在这些情况下,编码多肽的核酸序列应与调节序列可操作相连。
[0156] 去除creA结合位点(如早先在EP673429中所述的碳分解代谢产物抑制)、改变 pacC和areA(用于pH和氮调节)可以是重要的。
[0157] 优选地,DNA构建体包含本发明的启动子DNA序列、与该启动子DNA序列可操作相 连的编码序列和翻译控制序列,例如:
[0158] -选自以下序列列表的依照5'到3'方向的一个翻译终止序列:TAAG、TAGA和 TAAA,优选TAAA,和/或
[0159] -选自以下序列列表的依照5'到3'方向的一个翻译起始编码序列:GCTACCCCC; GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC和 GCTTCCTTC,优选GCTTCCTTC;和 / 或
[0160] -选自以下序列列表的一个转录起始序列:5'-mwChkyCAAA_3';5'-mwChkyCACA_3' 或者 5'-mwChkyCAAG-3',采用核苷酸的不确定编码:m(A/C) ;w(A/T) ;y(C/T) ;k(G/T); h(A/C/T),优选 5' -CACCGTCAAA-3' 或者 5' -CGCAGTCAAG-3'。
[0161] 在本发明上下文中,术语"翻译起始编码序列"被定义为DNA编码序列开放阅读框 的起始子或者起始密码子下游紧邻的九个核苷酸。起始子或者起始密码子编码AA甲硫氨 酸。起始密码子典型为ATG,但是也可以是任何功能性起始密码子,例如GTG。
[0162] 在本发明上下文中,术语"翻译终止序列"被定义为从开放阅读框或者核苷酸编码 序列3'端翻译终止密码子开始并依照5'到3'方向的三或者四个核苷酸。
[0163] 在本发明上下文中,术语"翻译起始序列"被定义为编码多肽的DNA序列开放阅读 框起始子或者起始密码子上游紧邻的十个核苷酸。起始子或者起始密码子编码AA甲硫氨 酸。起始密码子典型为ATG,但是也可以是任何功能性起始密码子,例如GTG。本领域公知 的是在RNA中,尿嘧啶U替换脱氧核苷酸胸腺嘧啶T。
[0164] 本发明还涉及包含本发明启动子、编码多肽的编码序列和转录和翻译起始子以及 终止信号的重组表达载体。
[0165] 上述多种编码和控制序列可以结合在一起,产生下述重组表达载体,该重组表达 载体可包含一个或者更多个便利的限制位点,以允许在这类位点处插入或者替换启动子和 /或编码多肽的编码序列。或者,可通过例如Gene.l989Apr15;77(l):51-9.HoSN,Hunt HD,HortonRM,PullenJK,PeaseSite-directedmutagenesisbyoverlapextension usingthepolymerasechainreaction")中所述的使用PCR的序列重叠延伸(SOE-PCR) 或者通过使用Gateway?克隆体系(Invitrogen)克隆完成编码序列和启动子的融合。或 者,可通过将编码序列或者包含启动子和/或编码序列的DNA构建体插入适当的表达载体 来表达编码序列。创建表达载体时,编码序列以下述方式位于载体中:编码序列与本发明启 动子和一个或者更多个适当的表达控制序列可操作相连。
[0166] 重组表达载体可以是下述任何载体(例如,质粒或者病毒),该载体可便利地进行 重组DNA操作并可完成编码序列的表达。对载体的选择典型地会取决于载体与所述载体待 被引入的宿主细胞间的相容性。载体可以是线性或者闭环质粒。
[0167] 载体可以是自主复制的载体,即作为染色体外实体存在的载体,其复制不依赖于 染色体复制,例如质粒、染色体外元件、微型染色体或者人工染色体。对自主复制而言,载体 可以包含使载体能够在所述宿主细胞中自主复制的复制起点。用于酵母宿主细胞的复制起 点实例为2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合以及ARS4和CEN6的组合。复 制起点可以是具有下述突变的复制起点,该突变使宿主细胞中复制起点的功能对于温度敏 感(参见例如Ehrlich, 1978,ProceedingsoftheNationalAcademyofSciencesUSA 75:1433)。丝状真菌中自主维持的克隆载体的实例为包含AMA1-序列的克隆载体。AMA1为 自A.nidulans分离的6. 〇-kb基因组DNA片段,其能够在Aspergillus中自主维持(参见 例如Aleksenko和Clutterbuck(1997),FungalGenet.Biol. 21:373-397)。
[0168] 或者,载体可以是引入宿主细胞时被整合至基因组和与将其整合至的染色体一起 复制的载体。而且,可以使用单个载体或者质粒或者一起包含要引入宿主细胞基因组中的 全部DNA的两个或者更多个载体或者质粒或者转座子。
[0169] 本发明的载体优选含有一个或者更多个可选择标记物,该可选择标记物允许容易 地选择经转化的细胞。宿主可以用至少两个载体共转化,其中一个包含可选择标记物。可 选择标记物是下述基因,所述基因的产物提供对抗微生物剂或者病毒的抗性、对重金属的 抗性、针对营养缺陷型的原营养等。用于酵母宿主细胞的合适标记物为ADE2、HIS3、LEU2、 LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的可选择标记物包括但不限于amdS(乙 酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸 转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5' -磷酸盐脱羧酶)、sC(硫酸腺噪呤基转移 酶)、trpC(氨基苯甲酸合酶)及其等效物。也可使用提供针对例如腐草霉素、潮霉素B或 者G418抗性的标记物。在Rasamsonia细胞中优选使用ble和hygB选择标记物。
[0170] 就整合至宿主细胞基因组而言,载体可依赖于启动子序列和/或编码多肽的编码 序列或者载体的任何其它元件,用于通过同源重组或者非同源重组将载体稳定整合至基因 组内。或者,载体可含有用于指导通过同源重组整合至宿主细胞基因组的额外的核酸序列。 该额外的核酸序列使得载体能够在染色体中预先确定的靶位点整合至宿主细胞基因组。为 了提高在精确位点整合的可能性,整合元件应优选含有足够数量的核酸,例如30到1,500 个碱基对,优选100到1,500个碱基对,更优选400到1,500个碱基对,更优选800到1,500 个碱基对并最优选至少2kb,其与相应的靶序列高度同源以提高同源重组的可能性。整合元 件可以是与宿主细胞基因组中靶序列同源的任何序列。而且,整合元件可以是非编码或者 编码核酸序列。为了促进靶向的整合,克隆载体优选在转化宿主细胞之前线性化。线性化 优选以下述方式进行:克隆载体的至少一端(但是优选两端)侧翼为与靶基因座同源的序 列。
[0171] 优选地,克隆载体中与靶基因座同源的整合元件来自高度表达的基因座,即它们 来自能够在真菌宿主细胞中高水平表达的基因。能够有高表达水平的基因(即高表达的 基因)在本文中定义为下述基因,所述基因的mRNA可占据总细胞mRNA的至少0. 5% (w/w) (例如在经诱导的条件下),或者,所述基因的基因产物可占据总细胞蛋白质的至少1 % (w/ w),或者在经分泌的基因产物情况下,可分泌至少0.lg/1的水平(如在EP357127B1中所 述)。大量优选的高表达真菌基因以实例的方式给出:来自Aspergilli或者Trichoderma 的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、甘油醛-磷酸脱氢酶或者纤维二糖水解酶的 基因。
[0172] 另一方面,载体可以通过非同源重组整合至宿主细胞基因组。
[0173] 可将编码生物化合物的核酸序列的多于一个拷贝插入宿主细胞中,以促进基因产 物的产生。这可优选通过将DNA序列的数个拷贝整合进其基因组中,更优选通过将DNA序 列的整合靶向高表达基因座来完成。或者,这可通过在核酸序列中包含可扩增的可选择标 记物基因,使含有经扩增拷贝的可选择标记物基因从而含有额外拷贝的核酸序列的细胞可 通过在存在适当可选择剂时培养细胞而被选择。
[0174] 用于连接上述元件以构建本发明重组表达载体的方法为本领域技术人员公知 (参见例如Sambrook等人,1989,见上)。
[0175] 本发明还涉及包含与编码序列可操作相连的本发明启动子DNA序列的重组宿主 细胞,该宿主细胞有利地用于生产生物化合物。将包含与编码序列可操作相连的本发明启 动子的载体引入宿主细胞,使得载体作为染色体整合体或者作为前文所述的自主复制染色 体外载体而保持。术语"宿主细胞"涵盖亲本细胞的任何子代,该子代由于复制中发生的突 变而与亲本细胞不同。宿主细胞的选择很大程度上取决于编码序列的来源和本发明启动子 的来源。技术人员知晓如何选择最合适的宿主细胞。
[0176] 本发明还涉及重组宿主细胞,该宿主细胞包含多于一个本发明的启动子DNA序 列,各启动子优选地与编码序列可操作相连。这类宿主细胞可有利地用于至少一种生物化 合物的重组生产。或者,本发明的重组宿主细胞可包含与本领域己知启动子组合的一个或 者更多个本发明的启动子。本领域已知的这类启动子包括但不限于由下述基因获得的启 动子:A.tubigensisxlnA、A.oryzaeTAKA淀粉酶、Rhizomucormiehei天冬氨酸蛋白酶、 A.niger中性a-淀粉酶、A.niger酸稳定性a-淀粉酶、A.niger或者A.awamori葡糖淀 粉酶(glaA)、A.niger或者A.awamori内切木聚糖酶(xlnA)或者0 -木糖苷酶(xlnD)、 T.reesei纤维二糖水解酶I(CBHI)、R.miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙 糖异构酶、A.nidulans乙醜胺酶、TrichodermareeseiP-葡糖苷酶、Trichodermareesei 纤维二糖水解酶I、Trichodermareesei纤维二糖水解酶II、Trichodermareesei内切葡 聚糖酶I、Trichodermareesei内切葡聚糖酶II、Trichode;rmareesei内切葡聚糖酶III、 Trichodermareesei内切葡聚糖酶IV、Trichodermareesei内切葡聚糖酶V、Trichoderma reesei木聚糖酶I、Trichodermareesei木聚糖酶II、Trichodermareesei0 -木糖苷酶, 以及NA2_tpi启动子(来自编码A.niger中性a-淀粉酶和A.oryzae磷酸丙糖异构酶的 多核苷酸的启动子杂合物)及其突变的、截短的和杂合的启动子。启动子的其他例子是描 述于W02006/092396和W02005/100573中的启动子,其通过引用方式并入本文。启动子 使用的又一其他例子于W02008/098933中描述。诱导型(异源)启动子的实例为醇诱导 型启动子alcA、使用四环素响应启动子的tet系统、雌激素响应启动子(Pachlinger等人 (2005),Appl&EnvironmentalMicrobiol672-678)〇
[0177] 本发明的宿主细胞和本发明方法中使用的宿主细胞可以是任何宿主细胞。优选 地,本发明的宿主细胞为真菌细胞。如本文所使用的"真菌"包括子囊菌亚门(Ascomycota)、 担子菌亚门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由 Hawksworth等人,AinsworthandBisby'sDictionaryofTheFungi,第 8 版,1995,CAB International,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如 Hawksworth等人,1995,见上,171页所述)和所有的有丝分裂孢子真菌(Hawksworth等人, 1995,见上)。
[0178] 在一个优选的实施方式中,真菌宿主细胞为丝状真菌细胞。"丝状真菌"包括真菌 门(Eumycota)和卵菌门亚门的所有丝状形式(如Hawksworth等人,1995,见上所定义)。 丝状真菌表征为由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖构成的菌丝 体壁。营养生长通过菌丝伸长,并且碳分解代谢为专性需氧。相反,酵母如Saccharomyces cerevisiae的营养生长通过单细胞菌体出芽实现且碳分解代谢可以是发酵的。
[0179] 优选地,丝状真菌宿主细胞为以下属的细胞:Acremonium、Agaricus、 Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filobasidium、 Fusarium、Geosmithia、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、 Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Rasamsonia、Schizophyllum、Talaromyces、Thermoascus、Thermomyces、Thielavia、 Tolypocladium或者Trichoderma。
[0180] 在一个更优选的实施方式中,丝状真菌宿主细胞为Humicolagriseavar. thermoidea、Humicolalanuginosa、Myceliophthorathermophila、Papulaspora thermophilia、Rasamsoniabyssochlamydoides、Rasamsoniaemersonii、Rasamsonia argi1lacea、Rasamsoniaeburnean、Rasamsoniabrevistipitata、Rasamsonia cylindrospora、Rhizomucorpusillus、Rhizomucormiehei、Talaromycesbacillisporus、 Talaromycesleycettanus、Talaromycesthermophilus、Thermomyceslenuginosus、 Thermoascuscrustaceus、ThermoascusthermophilusThermoascusaurantiacus或 者Thielaviaterrestris细胞。在另一更优选的实施方式中,丝状真菌宿主细胞为 Aspergillusawamori、Aspergillusfoetidus、Aspergillusjaponicus、A.nidulans、 A.niger、A.sojae、A.oryzae、Chrysosporiumlucknowense、Fusariumbactridioides、 Fusariumcerealis、Fusariumcrookwellense、Fusariumculmorum、Fusarium graminearum、Fusariumgraminum、Fusariumheterosporum、Fusariumnegundi、Fusarium oxysporum、Fusariumreticulatun、Fusariumroseum、Fusariumsambucinum、Fusarium sarcochroum、Fusariumsporotrichioides、Fusariumsulphureum、Fusariumtorulosum、 Fusariumtrichothecioides或者Fusariumvenenatum细胞。在另一更优选的实施方 式中,丝状真菌宿主细胞为Mucormiehei、Myceliophthorathermophila、Neurospora crassa>PenicilliumpurpurogenunuPenicilliumchrysogenunuTrichodermaharzianum、 Trichodermakoningii、Trichodermalongibrachiatum、Trichodermareesei或者 Trichodermaviride细胞。在一个最优选的实施方式中,丝状真菌宿主细胞为选自以下 的种:Rasamsoniaemersonii、Aspergillusniger、Aspergillusoryzae、Aspergillus sojae^Myceliophthorathermophila、Trichodermareesei或者Penici11ium chrysogenum。一个最优选的Rasamsoniaemersonii宿主细胞为CBS393. 64或者其衍生物。
[0181] 公众可以容易地从多个培养物保藏中心获得丝状真菌的几种菌株,例如美国典型 培养物保藏中心(AmericanTypeCultureCollection(ATCC))、德国微生物和细胞培养物 保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH(DSM))、 荷兰真菌培养物保藏中心(CentraalbureauVoorSchi_elcultures(CBS))和农业研 究机构专利培养物保藏中兴北区研究中心(AgriculturalResearchServicePatent CultureCollection,NorthernRegionalResearchCenter(NRRL)Rasamsonia.emersonii ATCC16479、AspergillusnigerCBS513. 88、AspergillusoryzaeATCC20423、IF0 4177、 ATCC1011、ATCC9576、ATCC14488-14491、ATCC11601、ATCC12892、P.chrysogenumCBS 455. 95、PenicilliumcitrinumATCC38065、PenicilliumchrysogenumP2、Acremonium chrysogenumATCC36225 或者ATCC48272、TrichodermareeseiATCC26921 或者ATCC 56765 或者ATCC26921、AspergillussojaeATCC11906、Chrysosporiumlucknowense ATCC44006。
[0182] 宿主细胞可以是野生型丝状真菌宿主细胞或者变体、突变体或者经遗传修饰的丝 状真菌宿主细胞。
[0183] 可以用本身已知的方式,通过下述方法来转化真菌细胞,该方法涉及原生质体形 成、原生质体转化以及细胞壁再生。合适的用于转化Rasamsonia宿主细胞的工序描述 于TO2011\054899中。合适的用于转化Aspergillus宿主细胞的工序描述于EP 238023 以及Yelton等人,1984, Proceedings of the National Academy of Sciences USA 81:1470-1474中。使用Agrobacterium tumefaciens转化Aspergillus和其他丝状真 菌宿主细胞的合适工序描述于例如Nat Biotechnol. 1998S印;16(9) :839-42,错误刊 载在Nat Biotechno1 1998Nov;16 (11):1074. Agrobacterium tumefaciens-mediated transformation of filamentous fungi.de Groot MJ,Bundock P,Hooykaas PJ, Beijersbergen AG. Unilever Research Laboratory Vlaardingen, The Netherlands. 中。转化?11831';[111]1种的合适的方法通过]\^131(1161'等人,1989,66116 78:147-156和冊 96/00787描述。可以通过Becker和Guarente, Abelson,J.N?和Simon, M. I.编辑,Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194,pp 182-187, Academic Press, Inc.,New York ;Ito等人,1983,Journal of Bacteriology 153:163;以及Hinnen等人,1978, Proceedings of the National Academy of Sciences USA 75:1920描述的工序来转化酵母。
[0184] "生物化合物"可以是任何生物聚合物或者代谢产物。生物化合物可由单个编码 序列或者组成生物合成或代谢途径的一系列编码序列编码,或者可以是单一编码序列的产 物或者一系列编码序列的产物的直接结果。生物化合物对宿主细胞可以是天然的或者异源 的。
[0185] 术语"异源生物化合物"在本文中定义为下述生物化合物,其对给定宿主细胞不是 同源的,或者天然生物化合物中进行了结构修饰以改变天然生物化合物。
[0186] 术语"生物聚合物"在本文定义为相同、相似或者不相似的亚单元(单体)的链 (或者聚合物)。生物聚合物可以是任何生物聚合物。生物聚合物可以是例如但不限于核 酸(例如RNA)、多胺、多元醇、多肽(或者聚酰胺)或者多糖。
[0187] 根据一个优选的实施方式,生产的生物化合物为多肽。根据一个更优选的实施方 式,生产的多肽由DNA构建体中存在的编码序列编码,该DNA构建体包含与所述编码序列可 操作相连的本发明的启动子。多肽可以是具有目的生物活性的任何多肽。术语"多肽"在 本文并非意指特定长度的被编码的产物,并因此涵盖肽、寡肽和蛋白质。术语"多肽"还涵 盖组合以形成所编码的产物的两个或者更多个多肽。多肽还包括杂合多肽,其包含得自至 少两个不同多肽的部分或者全部多肽序列的组合,其中一个或者更多个可对宿主细胞是 异源的。多肽还包括上述多肽和杂合多肽的天然存在的等位和工程化的变异。
[0188] 多肽对给定的宿主细胞可以是天然的或者异源的。术语"异源多肽"在本文定义 为对给定宿主细胞而言并非天然的多肽。或者,异源多肽为其中进行了修饰以改变天然序 列的天然多肽,或者其表达在数量上被改变的天然多肽,该改变是通过重组DNA技术操作 真菌细胞的结果。例如,可通过以下方式重组生产天然多肽,例如将编码多肽的序列置于本 发明启动子控制下,从而增强多肽表达、通过使用信号序列加速目标天然多肽输出细胞外, 和提高通常由细胞产生的编码多肽的基因的拷贝数。
[0189] 多肽可以是胶原或者明胶、或者其变体或者杂合体。多肽可以是抗体或者其部分、 抗原、凝固因子、酶、激素或者激素变体、受体或者其部分、调节蛋白质、结构蛋白质、受体或 者转运蛋白、分泌过程涉及的蛋白质、折叠过程涉及的蛋白质、伴侣分子(chaperone)、肽氨 基酸转运蛋白、糖基化因子、转录因子、合成肽或者寡肽、细胞内蛋白质。细胞内蛋白质可以 是酶,例如蛋白酶、神经酰胺酶、环氧化物水解酶、氨基肽酶、酰基转移酶、醛缩酶、羟化酶、 氨基肽酶、脂酶。多肽可以是细胞外分泌的酶。这类酶可以属于以下的组:氧化还原酶、转 移酶、水解酶、裂合酶、异构酶、连接酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、脱氧核糖 核酸酶、葡聚糖酶、酯酶。酶可以是碳水化合物酶,例如纤维素酶例如内切葡聚糖酶、3 -葡 聚糖酶、纤维二糖水解酶或者葡糖苷酶、半纤维素酶或者胶质水解酶(pectinolytic enzyme)例如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果 胶裂合酶、果胶酸裂合酶(pectatelyase)、内切多聚半乳糖醒酸酶、外切多聚半乳糖醒酸 酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖酶、阿拉伯木聚糖水解酶、半乳糖醛酸 酶、裂合酶或者淀粉分解酶;水解酶,异构酶或者连接酶,磷酸酶如植酸酶,酯酶如脂酶,蛋 白水解酶,氧化还原酶如氧化酶,转移酶或者异构酶。酶可以是植酸酶。酶可以是氨基肽 酶、淀粉酶、碳水化合物酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶过氧化氢酶、壳 多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、酯酶、a-半乳糖苷酶、半 乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、葡糖苷酶、卤素过氧化物酶、蛋白水解酶、转化 酶、漆酶、脂酶、甘露糖苷酶、变构水解酶(mutanase)、氧化酶、胶质水解酶、过氧化物酶、磷 脂酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶或者葡萄糖氧化酶、己糖氧化酶、单加氧酶。
[0190] 或者,与本发明启动子可操作连接的编码序列可编码细胞内蛋白质,例如伴 侣分子或者转录因子。其的一个实例描述于ApplMicrobiolBiotechnol. 19980ct; 50 (4) : 447-54 ("AnalysisoftheroleofthegenebipA,encodingthemajor endoplasmicreticulumchaperoneproteininthesecretionofhomologous andheterologousproteinsinblackAspergi11i.PuntPJ,vanGemeren IA,Drint-KuijvenhovenJ,HessingJG,vanMuijlwijk-HarteveldGM,Beijersbergen A,VerripsCT,vandenHondelCA)中。这可用于例如促进宿主细胞作为蛋白质生产者或 者作为代谢产物的效力,如果该编码序列(例如伴侣分子或者转录因子)已知是蛋白质或 者代谢产物产生的限制因子。
[0191] 生物化合物可以是多糖。多糖可以是任何多糖,包括但不限于粘多糖(例如肝素 和透明质酸)和含氮多糖(例如几丁质)。在一个更优选的选择中,多糖为透明质酸。
[0192] 或者,生物化合物可以是代谢产物。术语"代谢产物"涵盖初级和次级代谢产物; 代谢产物可以是任何代谢产物。一个优选的代谢产物为柠檬酸。
[0193] 根据另一优选的实施方式,产生的生物化合物为代谢产物。根据一个更优选的实 施方式,DNA构建体中存在的编码序列编码涉及代谢产物产生的酶,该DNA构建体包含与该 编码序列可操作连接的本发明的启动子。
[0194] 或者,本发明的DNA构建体中可存在若干编码序列。各编码序列可编码涉及引 起代谢产物产生的代谢或者生物合成途径的不同的酶。初级代谢产物是细胞的初级或者 一般代谢产物,其涉及能量代谢、生长和结构。次级代谢产物是次级代谢的产物(参见例 如R.B.Herbert,TheBiosynthesisofSecondaryMetabolites,ChapmanandHall,New York, 1981) 〇
[0195] 初级代谢产物可以是但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯或者维 生素。一个优选的初级代谢产物为柠檬酸。
[0196] 次级代谢产物可以是但不限于生物碱、香豆素、类黄酮、聚酮化合物、奎宁、类固 醇、肽或者萜。次级代谢产物可以是抗生素、拒食素、引诱素、杀细菌素、杀真菌素、激素、杀 虫剂或者杀鼠剂。优选的抗生素为头抱菌素和内酰胺。
[0197] 生物化合物还可以是可选择标记物。可选择标记物是提供针对抗微生物剂或者 病毒的抗性、对重金属抗性、对营养缺陷型的原养等的产物。可选择标记物包括但不限于 amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮 霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5' -磷酸盐脱羧酶)、sC(硫酸腺嘌 呤基转移酶)、trpC(氨基苯甲酸合酶)、ble(腐草霉素抗性蛋白)及其等效物。
[0198] 在本发明的生产方法中,细胞使用本领域己知方法在适于生产生物化合物的营养 培养基中培养,该生物化合物可以是但不限于多肽或者代谢产物。例如,细胞可在实验室或 者工业发酵器中通过摇瓶培养、小规模或者大规模发酵(包括连续、分批、分批补料或者固 态发酵)来培养,其在合适培养基和使得编码序列被表达和/或生物化合物被分离的条件 下进行。在含有碳和氮源和无机盐的合适的营养培养基中,使用本领域已知工序进行培养。 合适的培养基可来自商业供货商或者可通过(例如美国典型培养物保藏中心的产品目录 中)公开的成分制备。如果生物化合物分泌进营养培养基,则该生物化合物可直接从培养 基中回收。如果生物化合物(其可以是但不限于多肽或者代谢产物)不分泌,那么其可从 细胞裂解物中回收。
[0199] 可通过本领域已知方法回收所得生物化合物,其可以是但不限于多肽或者代谢产 物。例如,可通过常规工序从营养培养基中回收多肽或者代谢产物,该常规工序包括但不限 于离心、过滤、提取、喷雾干燥、蒸发或者沉淀。
[0200] 多肽可通过本领域已知的多种方法纯化,所述方法包括但不仅限于色谱法(例如 离子交换、亲和、疏水、色谱聚焦和尺寸排阻)、电泳工序(例如制备型等电聚焦)、差异溶 解度(例如硫酸铵沉淀)、SDS-PAGE或者提取(参见例如ProteinPurification,J. -C. Janson和LarsRyden编辑,VCHPublishers,NewYork, 1989)。多肤可使用本领域已知的 对于多肽特异的方法检测。这些检测方法可包括特异抗体的使用、酶产物的形成或者酶底 物的消失。
[0201] 本发明还涉及用于改变编码多肽的编码序列的表达的DNA构建体,该多肽对于真 菌宿主细胞是内源的。该构建体可含有改变内源基因表达所需的最少数量的成分。
[0202] 在一个实施方式中,核酸构建体优选含有:(a)祀向序列;(b)本发明的启动子DNA 序列,(c)外显子;以及(d)剪接供体位点。将核酸构建体引入细胞时,构建体通过同源重 组在内源基因位点处整合至细胞基因组内。靶向序列指导元件(a)-(d)进入内源基因的整 合,使得元件(b)-(d)与内源基因可操作相连。
[0203] 在另一实施方式中,核酸构建体含有:(a)靶向序列;(b)本发明的启动子DNA序 列;(c)外显子;(d)剪接供体位点;(e)内含子;以及(f)剪接受体位点,其中靶向序列指导 元件(a)-(f)的整合,使得元件(b)-(f)与内源基因可操作相连。然而,构建体可含有额外 的成分,如可选择标记物。可使用的可选择标记物先前已描述。
[0204] 在两种实施方式中,这些成分的引入引起新转录单位的产生,其中内源基因的表 达被改变。事实上,新的转录单位是通过靶向构建体引入的序列和内源基因的融合产物。在 一个内源基因被改变的实施方式中,基因被激活。在该实施方式中,使用同源重组替换、破 坏或者失活调节区,该调节区通常通过调节序列的插入与亲本细胞的内源基因相关联,这 引起与相应的亲本细胞中的现象相比所述基因以更高水平表达。
[0205] 靶向序列可以在内源基因内、紧邻该基因、在上游基因内或者在内源基因上游和 与内源基因有段距离。可使用一个或者更多个靶向序列。例如环形质粒或者DNA片段优选 使用单个靶向序列,而线性质粒或者DNA片段优选使用两个靶向序列。
[0206] 构建体还含有内源基因的一个或者更多个外显子。外显子定义为下述DNA序列, 该DNA序列被拷贝为RNA并存在于成熟的mRNA分子中,使得外显子序列与内源基因的编码 区同框。外显子可任选地包含这样的DNA,该DNA编码一个或者更多个氨基酸和/或部分 地编码氨基酸。或者,外显子含有对应于5'非编码区的DNA。当一个或者更多个外源外显 子编码一个或者更多个氨基酸和/或氨基酸的一部分时,设计核酸构建体使得在转录和剪 接时,内源基因的编码区是同框的,从而来自第二个外显子的mRNA部分的合适读码框是不 变的。构建体的剪接供体位点指导一个外显子剪接到另一外显子。典型地,第一个外显子 位于第二个外显子的5',并且与第一个外显子3'侧重合并位于其侧翼的剪接供体位点识 别位于第二个外显子5'侧翼的第二个外显子侧翼的剪接受体位点。剪接受体位点(类似 于剪接供体位点)是指导一个外显子剪接到另一个外显子的序列。与剪接供体位点一同作 用的剪接装置使用剪接受体位点来促成内含子的去除。
[0207] 用于改变给定DNA序列表达的一个优选策略包括缺失给定DNA序列和/或通过经 修饰的启动子DNA序列(例如本发明的启动子)代替给定DNA序列的内源启动子序列。
[0208] 替代地或者与其它提到的技术相组合,可使用基于在E.coli中粘粒的体内重组 的技术,如在Arapidmethodforefficientgenereplacementinthefilamentous fungusA.nidulans(2000)Chaveroche,M-K. ,Ghico,J-M.和d'EnfertC;Nucleicacids Research,vol28,no22中所述。该技术可应用于其它丝状真菌,例如R.emersonii。
[0209] 本文描述和要求保护的发明并不限于本文公开的特定实施方式的范围,因为这些 实施方式旨在说明本发明的多个方面。任何等效的实施方式旨在包括在本发明范围内。事 实上,除本文示出和描述的以外,通过前述说明,本发明的多种变型对本领域技术人员而言 是明显的。这类变型也旨在落入所附的权利要求书范围内。在冲突的情况下,以包括定义 的本公开内容为准。
[0210] 本发明通过以下实施例进一步描述,这些实施例不应当解释为限制本发明的范 围。 实施例
[0211] 应当理解,尽管示出本发明的优选实施方式,但是这些实施例仅通过示例方式给 出。根据上述讨论和这些实施例,本领域技术人员可确定本发明的必要特征,并且在没有违 背本发明精神和范围下,本领域技术人员可得到本发明的各种变化和修改以使其适应各种 用途和条件。因此除本文示出和描述的以外,由前述说明书,本发明的多种修改对本领域技 术人员而言是明显的。这类修改也旨在落入所附权利要求书的范围内。
[0212] 试骀信息
[0213] 菌株
[0214] 本文所使用的Rasamsoniaemersonii(R.emersonii)菌株来自ATCC16479,将 其用作野生型菌株。ATCC16479之前也称为Talaromycesemersonii和Penicillium geosmithiaemersonii。在使用名称Rasamsoniaemersonii时,也表不Talaromyces emersonii。R.emersoniiATCC16479 的其他菌株名称为CBS393. 64、IF031232 和 IMI116815。
[0215] Rasamsonia(Talaromyces)emersonii菌株TEC-142 于 2009 年 7 月 1 日保藏在荷兰 真菌培养物保藏中心(CENTRAALBUREAUV00RSCHIMMELCULTURES),荷兰乌特勒支NL-3508 AD乌普萨兰 8 号,邮箱 85167(Uppsalalaan8,P.O.Box85167,NL-3508ADUtrecht),其登 录号为CBS124902。TEC-142S是TEC-142的单一分离菌株。
[0216] 分子牛物抟术
[0217] 在这些菌株中,使用技术人员已知的分子生物技术(参见: Sambrook&Russell,MolecularCloning:ALaboratoryManual,第 3 版,CSHLPress,Cold SpringHarbor,NY,2001),如下所述将若干种基因过表达,并将其他基因下调。用于基因 过表达的表达载体和用于下调的破坏载体、转化、标记物使用和选择培养基的一般设计的 实例可在例如W0199846772、W0199932617、W02001121779、W02005095624、EP635574B和 W02005100573 中找到。
[0218] 培养某和溶液
[0219] 十豆右旋糖掠脂,PDA(Fluka,Cat.No. 70139)

【权利要求】
1. Rasamsonia 启动子 DNA 序列,优选 Rasamsonia emersonii 启动子 DNA 序列。
2. 根据权利要求1所述的Rasamsonia启动子DNA序列,其连接至能够被过表达的编码 序列。
3. 根据权利要求1所述的Rasamsonia启动子DNA序列,其对应于强启动子和/或诱导 型启动子。
4. 启动子DNA序列,例如: (a) 以下列表中所示的 DNA 序列:SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID N0:4、SEQ ID N0:5、SEQ ID N0:12、SEQ ID N0:13、SEQ ID N0:14、SEQ ID N0:15、SEQ ID NO: 16 或者 SEQ ID NO: 17 ; (b) 能够与(a)中DNA序列的互补体杂交的DNA序列;或者 (c) 与(a)中DNA序列至少50%同源的DNA序列。 5. DNA构建体,其包含根据权利要求1或2所述的启动子DNA序列和与所述启动子DNA 序列可操作相连的编码序列,从而所述编码序列能够在所述启动子DNA序列的控制下被表 达。
6. 宿主细胞,优选真菌宿主细胞,其包含根据权利要求3所述的DNA构建体。
7. 根据权利要求4所述的宿主细胞,其中所述宿主细胞是来自以下属的细胞: Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、 Cryptococcus、Filobasidium、Fusarium、Geosmithia、Humicola、Magnaporthe、Mucor、 Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、 Panerochaete、Pleurotus、Rasamsonia、Schizophyllum、Talaromyces、Thermoascus、 Thermomyces、Thielavia、Tolypocladium 或者 Trichoderma,优选来自 Rasamsonia、 Aspergillus、Penicillium、Chrysosporium 或者 Trichoderma 属,优选为 Rasamsonia emersonii 〇
8. -种在合适的宿主细胞中表达编码序列的方法,其包括: (a) 提供根据权利要求3所述的DNA构建体; (b) 使用所述DNA构建体转化合适的宿主细胞;以及 (c) 在有助于所述编码序列表达的培养条件下培养所述合适的宿主细胞。
9. 一种在合适的宿主细胞中生产生物化合物的方法,其包括: (a) 提供权利要求3所定义的DNA构建体; (b) 使用所述DNA构建体转化合适的宿主细胞;以及 (c) 在有助于所述编码序列表达的培养条件下培养所述合适的宿主细胞;以及任选 地, (d) 从培养液回收所述生物化合物。
10. 根据权利要求7所述的方法,其中生产的所述生物化合物为多肽或者代谢产物。
11. 根据权利要求8所述的方法,其中生产的所述多肽由存在于权利要求2所定义的 DNA构建体中的编码序列来编码。
12. 根据权利要求10所述的方法,其中存在于权利要求2所定义的DNA构建体中的所 述编码序列编码酶,所述酶任选地参与代谢产物的生产。
13. 编码葡糖淀粉酶的DNA序列,其包含: (a) SEQ ID N0:23 所示的 DNA 序列; (b) 能够与(a)中DNA序列的互补体杂交的DNA序列; (c) 与(a)中DNA序列至少50%、优选至少60%、更优选至少70%、甚至更优选至少 80%、还更优选至少90%和最优选至少95%同源的DNA序列;或者 (d) 编码葡糖淀粉酶且与SEQ ID NO:24至少50%、优选至少60%、更优选至少70%、 甚至更优选至少80%、还更优选至少90%和最优选至少95%同源的DNA序列。
14.葡糖淀粉酶,其具有与SEQ ID NO: 24至少50%、优选至少60%、更优选至少70%、 甚至更优选至少80%、还更优选至少90%和最优选至少95%同源的DNA序列。
【文档编号】C12P1/02GK104508114SQ201380032068
【公开日】2015年4月8日 申请日期:2013年6月17日 优先权日:2012年6月19日
【发明者】埃里克·皮特·洛斯, 威尔伯特·赫尔曼·马里·海涅, 赫尔曼·扬·佩尔, 罗波图斯·安东尼厄斯·戴维尔德, 布伦达·沃恩克 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1