用于在真菌细胞中表达基因的启动子的制作方法

文档序号:9661486阅读:491来源:国知局
用于在真菌细胞中表达基因的启动子的制作方法
【专利说明】
[0001] 本发明申请是基于申请日为2011年11月30日、申请号为201180066380. 3 (国际 申请号为PCT/US2011/062663)、名称为"用于在真菌细胞中表达基因的启动子"的发明专利 申请的分案申请。
[0002] 对相关申请的交叉引用
[0003] 本申请要求2010年11月30日提交的美国临时申请系列号61/418, 302的权益, 该申请通过提述并入本文。
[0004] 涉及序列表
[0005] 本申请包含计算机可读形式的序列表。所述计算机可读形式通过提述并入本文。
[0006] 发明背景
技术领域
[0007] 本发明涉及产生多肽的方法。本发明亦涉及分离的启动子和涉及包含可操作地连 接于编码多肽的多核苷酸的启动子的核酸构建体、载体和宿主细胞。
【背景技术】
[0008] 在真菌宿主细胞,例如丝状真菌细胞中,多肽的重组表达,可对于以商业上相关的 量产生所述多肽提供更理想的媒介(vehicle)。
[0009] 多肽的重组产生伴随构建表达盒,其中将编码多肽的DNA置于启动子的表达调控 下,所述启动子从基因切出并适于所述宿主细胞。将该表达盒导入宿主细胞,通常通过质粒 介导的转化。然后,多肽的产生通过在包含在所述表达盒上的启动子的合适功能所需的诱 导条件下培养经转化的宿主细胞来实现。
[0010] 将真菌宿主细胞用于多肽的重组产生一般需要得到适于在宿主细胞中调控所述 多肽表达的启动子。因此,在本领域具有对调控基因的重组表达的新颖启动子的需要。
[0011] Melin等,2002,Mol.Genet.Genomics267(6):695-702 公开了构巢曲霉 (Aspergillusnidulans)concanamycin(伴刀球霉素)诱导的蛋白C。Lu等,2010,Microb. CellFact. 9:23 公开了黑曲霉(Aspergillusniger)中的cipC蛋白。
[0012] 本发明提供了改善的用于在真菌宿主细胞中产生多肽的方法。

【发明内容】

[0013] 本发明涉及用于产生多肽的方法,其包括:(a)在有助于产生所述多肽的培养基 中培养真菌宿主细胞,其中所述真菌宿主细胞包含编码多肽的多核苷酸,所述多核苷酸可 操作地连接于启动子,所述启动子选自下组:(i)启动子,其包含核苷酸序列,所述核苷酸 序列与SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6, SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32 具有至少 60%序列同一性; (ii)启动子,其包含核苷酸序列,所述核苷酸序列在至少中等严格条件下与以下杂交:SEQ IDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQID N0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32;或其全长互补链;(iii)启动子,其包 含SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQ IDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32;(iv)启动子,其包含(i),(ii), 或(iii)的保持启动子活性的亚序列;和(v) (i),(ii),(iii),或(iv)的突变、杂合或串联 (tandom)启动子;其中所述编码多肽的多核苷酸对于所述启动子是外源的;和(b)从培养 基分尚所述多肽。
[0014] 本发明亦涉及分离的启动子,其选自下组:(i)启动子,其包含核苷酸序列,所述 核苷酸序列与SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQ IDN0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32 具有至少 60%序列 同一性,(ii)启动子,其包含核苷酸序列,所述核苷酸序列在至少中等严格条件下与以下杂 交:SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6, SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32;或其全长互补链;(iii)启动 子,其包含SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQID N0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32;(iv)启动子,其包含 (i),(ii),或(iii)的保持启动子活性的亚序列;和(v) (i),(ii),(iii),或(iv)的突变、 杂合或串联启动子。
[0015] 本发明亦涉及包含可操作地连接于编码多肽的多核苷酸的本发明的启动子的构 建体、载体和真菌宿主细胞。
[0016] 具体地,本发明涉及如下各项:
[0017] 1.-种产生多肽的方法,其包括:
[0018] (a)在有助于产生所述多肽的培养基中培养真菌宿主细胞,其中所述真菌宿主细 胞包含编码多肽的多核苷酸,所述多核苷酸可操作地连接于启动子,所述启动子选自下组: ⑴启动子,其包含核苷酸序列,所述核苷酸序列与SEQIDN0:1,SEQIDN0:2,SEQID N0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31, 或SEQIDN0:32具有至少60%序列同一性,(ii)启动子,其包含核苷酸序列,所述核苷酸 序列在至少中等严格条件下与以下杂交:SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQID N0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQID NO:32;或其全长互补链;(iii)启动子,其包含SEQIDNO: 1,SEQIDNO:2,SEQIDNO:3, SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或 SEQIDNO: 32 ;(iv)启动子,其包含(i),(ii),或(iii)的保持启动子活性的亚序列;和(v) (i),(ii),(iii),或(iv)的突变、杂合或串联启动子;其中所述编码多肽的多核苷酸对于 所述启动子是外源的;和
[0019] (b)从培养基分呙所述多肽。
[0020] 2.项1的方法,其中所述启动子包含核苷酸序列,所述核苷酸序列与SEQID N0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7, SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32 具有至少 60%,至少 65%,至少 70%,至少 75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少 87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少 95%,至少96%,至少97%,至少98%,至少99%或100%序列同一性。
[0021] 3.项1的方法,其中所述启动子包含核苷酸序列,所述核苷酸序列在中等严格条 件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDNO: 1,SEQID N0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,SEQIDN0:8, SEQIDN0:31,或SEQIDN0:32;或其全长互补链。
[0022] 4.项1的方法,其中所述启动子包含或组成为SEQIDNO: 1,SEQIDNO: 2,SEQID N0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31, 或SEQIDN0:32的多核苷酸序列;或其具有启动子活性的亚序列。
[0023] 5.项1的方法,其中所述启动子是杂合启动子,其包含SEQIDNO: 1,SEQIDN0:2, SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,和SEQIDN0:8 的 多核苷酸序列的一个或多个部分。
[0024] 6.项的方法1,其中所述启动子是串联启动子,其包含SEQIDNO: 1,SEQIDN0:2, SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,和SEQIDN0:8 的 一个或多个多核苷酸序列;或其保留启动子活性的亚序列。
[0025] 7.项1-6任一项的方法,其中其中所述多肽对于真菌宿主细胞是天然的或外源 的。
[0026] 8.项1-7任一项的方法,其中所述真菌宿主细胞是丝状真菌细胞。
[0027] 9.项1-7任一项的方法,其中所述真菌宿主细胞是酵母细胞。
[0028] 10.-种分离的启动子,其选自下组:(i)启动子,其包含核苷酸序列,所述核苷酸 序列与SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6, SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32 具有至少 60%序列同一性; (ii) 启动子,其包含核苷酸序列,所述核苷酸序列在至少中等严格条件下与以下杂交:SEQ IDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQID N0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32;或其全长互补链;(iii)启动子,其包 含SEQIDN0:1,SEQIDN0:2,SEQIDN0:3,SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQ IDN0:7,SEQIDN0:8,SEQIDN0:31,或SEQIDN0:32 ;(iv)启动子,其包含(i),(ii),或 (iii) 的保持启动子活性的亚序列;和(v) (i),(ii),(iii),或(iv)的突变、杂合或串联启 动子。
[0029] 11.项10的启动子,其包含核苷酸序列,所述核苷酸序列与SEQIDN0:1,SEQID NO:2,SEQIDNO:3,SEQIDNO:4,SEQIDNO:5,SEQIDNO:6,SEQIDNO:7,SEQIDNO:8, SEQIDN0:31,或SEQIDN0:32具有至少60%,至少65%,至少70%,至少75%,至少80%, 至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至 少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少 97%,至少98%,至少99%或100%序列同一性。
[0030] 12.项10的启动子,其包含核苷酸序列,所述核苷酸序列在中等严格条件,中 等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:SEQIDN0:1,SEQID NO:2,SEQIDNO:3,SEQIDNO:4,SEQIDNO:5,SEQIDNO:6,SEQIDNO:7,SEQIDNO:8, SEQIDN0:31,或SEQIDN0:32;或其全长互补链。
[0031] 13.项 10 的启动子,其包含或组成为SEQIDNO: 1,SEQIDNO:2,SEQIDNO:3, SEQIDN0:4,SEQIDN0:5,SEQIDN0:6,SEQIDN0:7,SEQIDN0:8,SEQIDN0:31,或 SEQIDN0:32的多核苷酸序列;或其具有启动子活性的亚序列。
[0032] 14.项10的启动子,其为杂合启动子,所述杂合启动子包含SEQIDN0:1,SEQID NO:2,SEQIDNO:3,SEQIDNO:4,SEQIDNO:5,SEQIDNO:6,SEQIDNO:7,和SEQIDNO:8 的多核苷酸序列的一个或多个部分。
[0033] 15.项10的启动子,其为串联启动子,所述串联启动子包含SEQIDN0:1,SEQID NO:2,SEQIDNO:3,SEQIDNO:4,SEQIDNO:5,SEQIDNO:6,SEQIDNO:7,和SEQIDNO:8 的一个或多个多核苷酸序列;或其保留启动子活性的亚序列。
[0034] 16. -种核酸构建体,其包含可操作地连接于项10-15任一项的启动子的编码多 肽的多核苷酸。
[0035] 17.-种重组宿主细胞,其包含项16的核酸构建体。
[0036] 18.项17的重组宿主细胞,其为丝状真菌细胞。
[0037] 19.项17的重组宿主细胞,其为酵母细胞。
【附图说明】
[0038] 图1显示pHUda852的限制性图。
[0039] 图2显示pMhCt036的限制性图。
[0040] 图3显示来自黑曲霉889-852-47和黑曲霉cipC036. 24的发酵的相对淀粉葡糖苷 酶产率(yield)。
[0041] 定义
[0042] 等位变体(allelicvariant):术语"等位变体"意指占据相同染色体基因座的基 因的任何两种或更多种(例如几种)可选形式。等位变异通过突变天然地发生,并且可导 致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改 变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
[0043] cDNA:术语"cDNA"意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接 的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起 始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工包括剪接,然 后作为成熟的已剪接的mRNA出现。
[0044] 编码序列:术语"编码序列"意指直接指定多肽的氨基酸序列的多核苷酸。编码序 列的边界通常由开读框决定,所述开读框以起始密码子如ATG、GTG或TTG开始,并且以终止 密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
[0045] 调控序列(controlsequence):术语"调控序列"意指对编码多肽的多核苷酸表达 是必需的核酸序列。各个调控序列对于编码所述多肽的多核苷酸可以是天然的(即,来自 同一基因)或外源的(即,来自不同基因)。这些调控序列包括但不限于前导序列、聚腺苷 酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子 和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所 述特异性限制位点促进调控序列与编码所述多肽的多核苷酸编码区的连接。
[0046] 表达:术语"表达"包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修 饰、翻译、翻译后修饰和分泌。
[0047] 表达载体:术语"表达载体"意指线性的或环状的DNA分子,其包含编码多肽的多 核苷酸,并且所述多核苷酸与提供用于其表达的调控序列可操作地连接。
[0048] 高严格条件:术语"高严格条件"意指对于长度至少100个核苷酸的探针,在42°C, 在5XSSPE、0.3%SDS、200 微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据 标准的Southern印迹法进行预杂交和杂交12至24小时。使用2XSSC、0. 2%SDS在65°C 将载体材料最终洗涤三次,每次15分钟。
[0049] 宿主细胞:术语"宿主细胞"意指任何细胞类型,所述细胞类型对于使用包含感兴 趣的多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susc印tible)。术 语"宿主细胞"涵盖任何亲本细胞的后代,其由于在复制中发生的突变而不同于亲本细胞。
[0050] 杂合启动子:术语"杂合启动子"意指两个或更多个(例如几个)启动子的部分连 接在一起以生成是所述两个或更多个启动子的部分的融合物的序列,所述序列当可操作地 连接于编码序列时,介导所述编码序列转录为mRNA。
[0051] 分离的:术语"分离的"意指以不在自然界出现的形式或环境存在的物质。分离 的物质的非限定性实例包括(1)任何非天然存在的物质,(2)任何至少部分地从一种或多 种或全部与其天然结合的天然存在的成分移出的物质,包括但不限于任何酶、变体、多核苷 酸、蛋白质、肽或辅因子;(3)任何相对于见于自然界的该物质经人工修饰的物质;或(4)任 何通过相对于与其自然结合的其他组分增加该物质的量(例如,编码该物质的基因的多拷 贝;比与编码该物质的基因自然结合的启动子更强的启动子的使用)而修饰的物质。感兴 趣的多肽可以以发酵液产物的形式用于工业应用,即所述多肽是在工业应用(例如乙醇产 生)中作为产物使用的发酵液的组分。所述发酵液产物除了感兴趣的多肽之外,还会包含 其它用于发酵工艺的成分,如例如细胞(包括含有编码感兴趣的多肽的基因的宿主细胞, 其用于产生所述多肽),细胞碎片,生物质,发酵培养基和/或发酵产物。可任选地对发酵 液进行一个或多个纯化(包括过滤)步骤以去除或减少一种或多种发酵工艺的组分。相应 地,分离的物质可在此种发酵液产物中存在。
[0052] 低严格条件:术语"低严格条件"意指对于长度至少100个核苷酸的探针,在42°C, 在5XSSPE、0.3%SDS、200 微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据 标准的Southern印迹法进行预杂交和杂交12至24小时。使用2XSSC、0. 2%SDS在50°C 将载体材料最终洗涤三次,每次15分钟。
[0053] 成熟多肽:术语"成熟多肽"意指以其在翻译和任何翻译后修饰之后的最终形式存 在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在本领域中已知宿 主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/ 或N端氨基酸)的混合物。
[0054] 成熟多肽编码序列:术语"成熟多肽编码序列"意指编码具有生物活性的成熟多肽 的多核苷酸。
[0055] 中等严格条件:术语"中等严格条件"意指对于长度至少100个核苷酸的探针,在 42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中, 根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2XSSC、0. 2%SDS在 55 °C将载体材料最终洗涤三次,每次15分钟。
[0056]中等-高严格条件:术语"中等-高严格条件"意指对于长度至少100个核苷酸的 探针,在42°C,在5XSSPE、0. 3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲 酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2XSSC、0. 2%SDS在60°C将载体材料最终洗涤三次,每次15分钟。
[0057] 核酸构建体:术语"核酸构建体"意指单链或双链的核酸分子,其分离自天然存在 的基因,或其经修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的 区段,或其为合成的。
[0058] 可操作地连接:术语"可操作地连接"意指这样的构型,其中将调控序列置于相对 于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。
[0059]多肽片段:术语"多肽片段"意指具有从成熟多肽的氨基和/或羧基端缺失一个或 多个(例如几个)氨基酸的多肽,其中所述片段具有生物活性。在一个方面,所述片段具有 成熟多肽的氨基酸数的至少85%,例如至少90%或至少95%。
[0060] 多肽变体:术语"多肽变体"意指包含改变,即在一个或多个(例如几个)位置的 取代、插入和/或缺失的具有生物活性的多肽。取代意指用不同的氨基酸替代占据某位置 的氨基酸;缺失意指去除占据某位置的氨基酸;而插入意指在邻接并紧接着占据某位置的 氨基酸之后添加氨基酸。
[0061]启动子:术语"启动子"意指DNA序列,其结合RNA聚合酶并将所述聚合酶导向编 码多肽的多核苷酸的下游转录起始位点以起始转录。RNA聚合酶有效地催化互补于编码区 的合适DNA链的信使RNA的装配(assembly)。术语"启动子"亦理解为包括用于在转录为 mRNA之后的翻译的5'非编码区(在启动子和翻译起点之间),顺式作用转录调控元件如增 强子,和其它能够与转录因子相互作用的核苷酸序列。
[0062]启动子变体:术语"启动子变体"意指包含改变,即在一个或多个(例如几个)位 置的取代、插入和/或缺失的启动子。取代意指用不同的氨基酸替代占据某位置的氨基酸; 缺失意指去除占据某位置的氨基酸;而插入意指在邻接并紧接着占据某位置的氨基酸之后 添加氨基酸。术语"启动子变体"亦会涵盖天然变体,和通过使用本领域公知的方法如经典 的诱变,定位诱变和DNA改组而获得的体外生成的变体。
[0063] 序列同一性:参数"序列同一性"描述两个氨基酸序列之间或两个核苷酸序列之间 的相关性。
[0064] 就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包 (EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,Trends Genet. 16:276-277),优选3. 0. 0、5. 0. 0版或更高版本的Needle程序中所执行的 Needleman-Wunsch算法(Needleman和Wunsch, 1970,J.Mol.Biol. 48:443-453)来测定。 使用的参数为缺口罚分(gappenalty) 10,缺口延伸罚分(gapextensionpenalty)0. 5和 EBL0SUM62(BL0SUM62的EMBOSS版)取代矩阵。使用Needle标记为"最高同一性(longest identity) "的输出结果(使用-nobrief选项获得)作为同一1性百分比,并计算如下:
[0065](同样的残基X100V(比对长度一比对中缺口的总数)
[0066] 就本发明而言,两个核苷酸序列之间的序列同一性程度使用如EMBOSS软件包 (EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上 文),优选3. 0. 0、5. 0. 0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法 (Needleman和Wunsch,1970,见上文)来测定。使用的参数为缺口罚分10,缺口延伸罚分 0. 5和EDNAFULL(NCBINUC4. 4的EMBOSS版)取代矩阵。使用Needle标记为"最高同一性" 的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
[0067](同样的脱氧核糖核苷酸X100V(比对长度一比对中缺口的总数)
[0068] 亚序列:术语"亚序列(subsequence) "意指从成熟多肽编码序列的5'和/或3' 端缺失一个或多个(例如几个)核苷酸的多核苷酸,其中所述亚序列编码具有生物活性的 片段,或者从启动子序列的5'和/或3'端缺失一个或多个(例如几个)核苷酸的多核苷 酸,其中所述启动子亚序列具有启动子活性。在一个方面,所述亚序列具有成熟多肽编码序 列的核苷酸数的至少85%,例如至少90%或至少95%。在另一个方面,所述启动子亚序列 具有启动子序列的核苷酸数的至少85%,例如至少90%或至少95%。
[0069] 串联启动子:术语"串联启动子"意指串联连接的两个或更多个(例如几个)启动 子,其每一个均可操作地连接于编码序列并介导所述编码序列转录为mRNA。
[0070] 非常高严格条件:术语"非常高严格条件"意指对于长度至少100个核苷酸的探 针,在42°C,在5XSSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰 胺中,根据标
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1