用于改变的蛋白质产生的具有失活蛋白酶基因的丝状真菌的制作方法

文档序号:66601阅读:308来源:国知局
专利名称:用于改变的蛋白质产生的具有失活蛋白酶基因的丝状真菌的制作方法
技术领域
本发明涉及改造为具有一个或多个失活蛋白酶基因以便产生改变的蛋白质产生 的丝状真菌微生物,如曲霉属(Aspergillus)物种。
背景技术
遗传工程已允许在用作工业生物反应器、细胞工厂的微生物,以及用于食品发酵 的微生物中的改进。由改造的微生物产生的重要的酶和蛋白质包含葡糖淀粉酶、α-淀粉 酶、纤维素酶、中性蛋白酶和碱性(或丝氨酸)蛋白酶、激素和抗体。但是,蛋白质降解和修 饰在一些遗传改造系统中的发生可干扰有效的产生。
已改造丝状真菌(例如曲霉属和木霉属(Trichoderma)物种)和某些细菌(例如 芽孢杆菌属(Bacillus)物种)来产生和分泌大量有用的蛋白质和代谢产物(见例如Bio/ Technol. 5 :369_376,713-719 和 1301-1304 [1987]和 Doi 和McGlouglin (编辑)Biology of Bacilli !Applications to Industry, Butterworth-Heinemann, Stoneham. Mass 311—337 页[1992]中白勺 Zukowski,"Production of commercially valuable products,,)。
WO 97/22705涉及不产生某些蛋白酶且可以用作易被通常产生的蛋白酶蛋白水解 降解的蛋白质产生的宿主真菌,其在此引入本文作为参考。
美国专利号5,840,570和6,509,171涉及天冬氨酸蛋白质基因缺乏的突变丝状真 菌,其是用于产生如凝乳酶的异源多肽的宿主,每个该专利在此引入本文作为参考。
美国专利申请公开号2006/0M6545涉及具有对应于derA、derB、htmA、mnn9、 mnnlO、ochA、dpp4、dpp5、ρ印Aa、ρ印Ab、ρ印Ac、ρ印Ad、ρ印F及其组合的失活染色体基因的 重组丝状真菌细胞,其在此引入本文作为参考。
发明概述
在一个实施方案中,本发明提供包含至少一个失活基因的丝状真菌细胞,其中失 活基因选自apSB、apSB同源物、cpSA、cpSA同源物及其组合。在一些实施方案中,失活基因 是cpsA同源物,其中该同源物与SEQ ID NO :1具有至少85%序列同一性,或编码与SEQ ID NO 2具有至少85%序列同一性的多肽。在一些实施方案中,失活基因是apsB同源物,其 中该同源物与SEQ ID NO :9具有至少85%序列同一性,或编码与SEQ ID N0:10具有至少 85%序列同一性的多肽。在一些实施方案中,失活基因是cpsA (SEQ ID N0:1)或apsB(SEQ ID NO 9)。
在一些实施方案中,失活基因编码胞内蛋白质,其中该胞内蛋白质涉及蛋白质降 解和修饰(例如蛋白酶基因、内质网(ER)降解途径基因和糖基化基因)。在具体实施方案 中,由失活基因编码的胞内蛋白质是N端蛋白酶(例如氨肽酶,如apsB)或胞内C端蛋白酶(例如羧肽酶)。
在其他实施方案中,本发明的丝状真菌细胞包含编码分泌性蛋白质(如蛋白酶) 的失活基因。
在一些实施方案中,本发明的丝状真菌细胞是来自选自曲霉属物种、根霉属物种 (Rhizopus sp.)、木霉属物种和毛霉属物种(Mucor sp.)的丝状真菌的细胞。在一个方面 中,丝状真菌是选自米曲霉(A.oryzae)、黑曲霉(A. niger)、泡盛曲霉(A. awamori)、构巢曲 霉(A. nidulans)、酱油曲霉(A. sojae)、日本曲霉(A. japonicus)、河内曲霉(A. kawachi)和 棘孢曲霉(A. aculeatus)的曲霉属物种。
在一些实施方案中,丝状真菌细胞包含至少选自apSB、apSB同源物、cpSA、cpSA同 源物的第一失活基因禾口选自 apsB、cpsA、derA、derB、htmA、mnn9、mnnlO、ochA、dpp4、dpp5、 ρ印Aa、ρ印Ab、ρ印Ac、ρ印AcU ρ印B、ρ印C、ρ印D、ρ印F及其同源物的第二失活基因。在一个 方面中,第二失活基因选自apsB、cpsA、dpp4、dpp5及其同源物。
在一些实施方案中,通过用选择标记基因破坏(disruption)来失活该失活基因。 因此,在一些实施方案中,丝状真菌细胞还包含插入该失活基因的核酸序列编码区中的编 码选择标记基因的核酸序列。在一些实施方案中,选择标记基因是amdS。
在一些实施方案中,本发明的丝状真菌细胞还产生内源蛋白质,其中该细胞内 源蛋白质的产生比对应的丝状真菌细胞亲本菌株中内源蛋白质的产生高至少约0%至约 200% (或更多)。因此,在一些实施方案中,内源蛋白质的产生比对应的丝状真菌细胞亲本 菌株中内源蛋白质的产生高至少约0 %至100 %,在一些实施方案中高至少约10 %至60 %, 包含其中产生高至少约10%、15%、20%、25%、30%、35%、40%、45%、50%和55%的实施 方案。在一些实施方案中,内源蛋白质是生糖酶(glucogenic enzyme)或选自α-淀粉酶、 纤维素酶、葡糖淀粉酶、漆酶、中性蛋白酶和碱性蛋白酶的酶。
在一些实施方案中,本发明的丝状真菌细胞还包含编码异源蛋白质的核酸。在一 些实施方案中,此异源蛋白质的产生相对于对应的丝状真菌细胞亲本菌株中相同蛋白质的 产生被改变。在一些实施方案中,异源蛋白质是酶,尤其是选自α-淀粉酶、纤维素酶、葡糖 淀粉酶、漆酶、中性蛋白酶和碱性蛋白酶的酶。在其他实施方案中,异源蛋白质选自蛋白酶 抑制剂、抗体或抗体片段。
在一些实施方案中,本发明丝状真菌细胞异源蛋白质的产生比对应的丝状真菌细 胞亲本菌株中异源蛋白质的产生高至少约0%至约200% (或更多)。因此,在一些实施 方案中,异源蛋白质的产生比对应的丝状真菌细胞亲本菌株中异源蛋白质的产生高至少约 0 %至100 %,在一些实施方案中高至少约10 %至60 %,包含其中产生高至少约10 %、15 %、 20%、25%、30%、;35%、40%、45%、50%和55%的实施方案。此外,在一些实施方案中,本发 明的丝状真菌细胞的总细胞干重由于比对应的丝状真菌细胞亲本菌株的总细胞干重低约 25%、20%、15%、10%、5%或更少而不同。
在另一个实施方案中,本发明提供包含至少一个失活基因的丝状真菌细胞,其中 该失活基因编码胞内蛋白质,且其中该细胞的至少一种其他蛋白质的产生比对应的丝状真 菌细胞亲本菌株中其他蛋白质的产生高至少约10%至60% (包含至少约10%、15%、20%、 25%、30%、35%、40%、45%、50%和55% )(或更多)。其产生提高的其他蛋白质可以是内 源(即天然)蛋白质或异源蛋白质,和/或可以是胞内蛋白质或分泌性蛋白质。[0020]在另一个实施方案中,本发明提供包含至少一个失活基因的丝状真菌细胞,其中 一个或多个内源和/或异源目的蛋白质的产生比丝状真菌对应的亲本菌株中内源和/或异 源蛋白质的产生低至少约0%至100%或甚至更低。在一些实施方案中,蛋白质的产生比对 应的亲本菌株中一个或多个内源和/或异源蛋白质的产生低至少约10%至60%,包含其中 产生低至少约 10%、15%、20%、25%、30%、35%、40%、45%、50%和 55%的实施方案。
在另一个实施方案中,本发明提供用于产生蛋白质的方法,其中所述方法包括 (a)将编码蛋白质的核酸引入丝状真菌细胞,其中所述细胞包含至少一个失活基因,其中失 活基因选自apSB、apSB同源物、cpSA、cpSA同源物及其组合;和(b)在适合于产生该蛋白质 的条件下培养细胞。在一些实施方案中,该方法还包括回收该蛋白质。
本发明用于产生蛋白质的方法可以使用任意真菌细胞,且在一些实施方案中,可 以使用本文所公开的任意丝状真菌细胞。
在另一个实施方案中,本发明提供产生用于蛋白质产生的丝状真菌菌株的方法, 其中所述方法包括(a)用破坏序列转化丝状真菌细胞,其中该破坏序列包含至少一个选 自apSB、apSB同源物、cpSA、cpSA同源物及其组合的失活基因;和(b)选择其中所述破坏序 列在染色体上整合的转化细胞。
本发明的产生用于蛋白质产生的丝状真菌菌株的方法可以使用本文所公开的任 意丝状真菌细胞实施方案。
在产生用于蛋白质产生的丝状真菌菌株的方法的一些实施方案中,破坏序列包含 在失活基因的编码区序列中的限制位点处反向插入的选择标记基因序列。在此方法的一些 实施方案中,该选择标记基因是amdS。在一些实施方案中,该限制位点包含失活基因中一个 以上的位点。
在一些实施方案中,本发明提供包含基因破坏序列的线性化破坏质粒片段,其中 该基因选自cpsA、cpsA同源物、apsB和apsB同源物,其中破坏序列包含在该基因的编 码区序列中的限制位点处反向插入的选择标记基因序列。在一些实施方案中,该基因是 cpsA(SEQ ID NO :1)。在一些实施方案中,该基因是cpsA同源物,其中该同源物与SEQ ID NO :1具有至少85%序列同一性,或编码与SEQ ID NO :2具有至少85%序列同一性的多肽。 在一个实施方案中,本发明提供其中破坏序列与SEQ ID NO :8具有至少95%同一性(或更 多)的线性化破坏质粒片段。在一些实施方案中,该基因是apsB (SEQ ID NO :9)。在一些 实施方案中,该基因是apsB同源物,其中该同源物与SEQ ID NO :9具有至少85%序列同一 性,或编码与SEQ ID NO :10具有至少85%序列同一性的多肽。在一个实施方案中,本发明 提供其中破坏序列与SEQ ID NO :15具有至少95%同一性(或更多)的线性化破坏质粒片 段。
在另一个实施方案中,本发明提供包含基因破坏序列的载体,其中该基因选自 cpsA、cpsA同源物、apsB和apsB同源物,其中破坏序列包含在该基因编码区序列中的限制 位点处反向插入的选择标记基因序列。在一个实施方案中,该载体包含与SEQ ID N0:8具 有至少95%同一性(或更多)的破坏序列。在另一个实施方案中,该载体包含与SEQ ID NO 15具有至少95%同一性(或更多)的破坏序列。
在另一个方面中,本发明涉及产生重组丝状真菌细胞的方法,其包括将与选自 apsB、cpsA、其同源序列及其组合的染色体基因重组的DNA构建体引入丝状真菌细胞,由此失活染色体基因。在一些实施方案中,该失活基因被破坏,在其他实施方案中,该失活基因 被删除。
在其他方面中,本发明涉及用于产生丝状真菌细胞失活突变体的DNA构建体,其 中该DNA构建体包含被间插基因序列破坏的apsB、cpsA、其同源序列及其组合的部分基因 序列。
附图简述

图1显示黑曲霉(Aspergillus niger) cpsA基因的2188bp基因组DNA序列(SEQ ID NO :1)。
图2显示由SEQ ID NO 1的黑曲霉cpsA基因组DNA序列编码的552个氨基酸的 序列(SEQ ID NO :2)。
图3显示用于制备失活cpsA菌株的Wl扩增子的DNA序列(SEQ IDNO 12)。
图4显示通过NruI限制酶线性化并用来转化黑曲霉以产生cpsA失活菌株AcpsA 的pBS Δ cpsA-amd破坏质粒的质粒图。
图5显示通过NruI限制酶线性化并用来转化黑曲霉菌株GICC2733的 pBS Δ cpsA-amd破坏质粒部分的DNA序列(SEQ ID NO 8)。
图6显示电泳凝胶的图像,其显示来自失活菌株Δ cpsA的染色体DNA的PCR扩增 后1378bp扩增子的存在。泳道1 :100bp DNA梯标记;泳道2 黑曲霉AcpsA菌株的染色体 DNA用作扩增模板;泳道3 黑曲霉Δ dpp4/ Δ dpp5菌株的染色体DNA用作扩增模板。
图7显示黑曲霉氨肽酶基因apsB的3352bp基因组DNA序列(SEQID NO 9)。
图8显示由SEQ ID NO :9的apsB基因组DNA序列编码的881个氨基酸的序列(SEQ ID NO 10)。
图9显示用于制备失活apsB菌株的W2扩增子的DNA序列(SEQ IDNO 14)。
图10显示通过HindIII和PvuII限制酶线性化并用来转化黑曲霉以产生apsB失 活菌株Δ apsB的pBS Δ apsB-amdS破坏质粒的质粒图。
图11显示通过HindIII和PvuII限制酶线性化并用来转化黑曲霉菌株GICC2733 的pBS Δ apsB-amdS破坏质粒部分的DNA序列(SEQ IDNO 15)。
图12显示电泳凝胶的图像,其显示来自失活菌株AapsB的染色体DNA的PCR扩增 后1604bp扩增子的存在。泳道1 IOObp DNA梯标记;泳道2 黑曲霉AapsB菌株克隆#28 的染色体DNA用作扩增模板;泳道3 黑曲霉AapsB菌株克隆#87的染色体DNA用作扩增 模板;泳道4 黑曲霉AapsB菌株克隆#93的染色体DNA用作扩增模板;泳道3 黑曲霉的 对应亲本菌株的染色体DNA用作扩增模板。
发明详述
本发明涉及具有一个或多个失活蛋白酶基因的重组丝状真菌细胞,如曲霉属细 胞。在一些实施方案中,失活基因导致丝状真菌细胞产生其他异源或内源蛋白质的能力的 改变。在一些实施方案中,具有一个或多个失活基因的细胞以比对应的丝状真菌细胞亲本 菌株(即非失活菌株)相同蛋白质的产生高至少约10%至约60% (或更多)的量产生异 源或内源蛋白质。
I.定义
本文提到的所有专利和出版物,包含这类专利和出版物中公开的所有序列明确引用作为参考。除非本文另作定义,本文使用的所有技术和科学术语具有与本发明所 属领域的普通技术人员的通常理解相同的意义(见例如Singleton等,Dictionary of Microbiology and Molecular Biology,第二版,John Wiley 禾口 Sons, New York [1994]; 禾口 Hale 禾口 Marham, The Harper Collins Dictionary of Biology, Harper Perennial, NY[1991],二者都向技术人员提供了本文所用许多术语的一般字典)。类似或等同于本文所 述的多种实施方案的任意方法和材料可以用于实施或测试本发明。
此说明书中公开的每个最大(或最小)数字限制旨在包含每个较低(或较高)的 数字限制,就如同已在本文中明确地写出这类较低(或较高)的数字限制。此外,本说明书 中公开的每个数字范围旨在包含落在这种较宽的数字范围中的每个较窄的数字范围,就如 同已在本文中明确地写出这类较窄的数字范围。
如本文所用,除非文中清楚地另作指定,单数形式“一个”、“所述”和“该”包含复 数指示物。因此,例如提到一个“宿主细胞”包含多个这类宿主细胞。
除非另作指定,分别以5'至3'的方向从左向右书写核酸;以氨基至羧基的方向 从左向右书写氨基酸序列。本文给出的标题不是对可通过参考说明书整体而得到的本发明 的多个方面或实施方案的限制。因此,下文即将定义的术语通过参考说明书整体而得到更 充分的定义。
本文所用的术语“失活”指基本上阻止一个或多个基因及其片段或同源物的功能 性表达的任意方法,其中该基因或基因产物不能发挥其已知功能。它旨在包含含有删除、蛋 白质编码序列的破坏、插入、添加、突变、基因沉默(例如RNAi基因反义)等的任意基因失 活方法。因此,术语“失活的”指上文所述“失活”的结果。在一些实施方案中,“失活”将产 生无可检测到的对应于失活基因的基因或基因产物的活性的细胞。在一些实施方案中,“失 活”可以产生少量或无基因的功能性表达,但仍然具有该基因同源物的功能性表达。因此, “失活菌株”可以显示由同源基因引起的部分活性表型。
如本文所用,“失活突变体”或“失活菌株”指具有一个或多个失活基因的宿主生物 (例如黑曲霉细胞)。该术语旨在包含失活突变体或失活菌株的子代,且不限于经受最初的 失活方法的细胞(例如最初转化的细胞)。
在一些实施方案中,“失活”是基因删除的结果,有时将这些失活突变体称为“删除 突变体”。在其他实施方案中,失活是基因的蛋白质编码序列被破坏的结果,有时将这些失 活突变体称为“破坏突变体”。在一些实施方案中,失活是不可回复的。
如本文所用,基因的“删除”指整个编码序列的删除、部分编码序列的删除或包含 侧翼区的编码序列的删除。
如本文所用,“破坏”指与亲本序列或天然存在的序列相比,分别在核苷酸或氨基 酸序列中插入一个或多个核苷酸或氨基酸残基的变化。因此,如本文所用,“破坏序列”或 “破坏突变体”指包含核苷酸或氨基酸插入的核酸或氨基酸序列(通常是编码区序列)。
如本文所用,“插入”或“添加”在序列的背景中指核酸或氨基酸序列中的变化,其 中与内源染色体序列或蛋白质产物相比,加入了 一个或多个核苷酸或氨基酸残基。
如本文所用,“不可回复的”指将以低于10_7的频率自然回复为其对应的亲本菌株 的菌株。
本文所用的术语“对应的亲本菌株”指从其产生失活突变体的宿主菌株(例如最初的和/或野生型的菌株)。
如本文所用,“菌株生存力”指生殖生存力。在一些实施方案中,基因的失活并非有 害地影响失活突变体在实验室条件下的分裂和存活。
如本文所用,“编码区”指编码蛋白质氨基酸序列的基因区域。
如本文所用,“氨基酸”指多肽或蛋白质序列或其部分。术语“蛋白质”、“肽”和“多 肽”可互换使用。
本文所用的术语“异源蛋白质”或“外源蛋白质”指并非天然存在于宿主细胞中的 蛋白质或多肽,包含天然存在的内源蛋白质的遗传改造形式。
如本文所用,“内源蛋白质”或“天然蛋白质”指天然存在于细胞中的蛋白质或多肽。
如本文所用,“宿主”、“宿主细胞”或“宿主菌株”指可以表达引入该细胞中的DNA 序列的细胞。在本发明的一些实施方案中,宿主细胞是曲霉属物种。
如本文所用,“丝状真菌细胞”指生长为多细胞菌丝链的任意微观真菌物种的细 胞,包含但不限于曲霉属物种、根霉属物种、木霉属物种和毛霉属物种。
如本文所用,“曲霉属,,或“曲霉属物种,,包含如本领域技术人员已知的“曲霉属,, 这个属内的所有物种,包含但不限于黑曲霉、米曲霉、泡盛曲霉、河内曲霉和构巢曲霉。
如本文所用,“核酸”指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合 成来源的DNA、cDNA和RNA,其可以是双链或单链,代表有义链或反义链。应理解,由于遗传 密码的简并性,大量核苷酸序列可以编码给定的蛋白质。
本文所用的术语“基因”指涉及产生多肽的DNA区段,可以包含编码区之前和之 后的区域(例如启动子、终止子、5'非翻译序列(5‘ UTR)或前导序列和3'非翻译序列 (3' UTR)或尾随序列,以及单个编码区段(外显子)之间的间插序列(内含子))。
如本文所述,“同源基因”、“基因同源物”或“同源物”指具有同源序列和产生具有 相同或相似功能的蛋白质的基因。该术语包含通过物种形成(即新物种的发生)分离的基 因(例如直向同源基因),以及已通过遗传复制分离的基因(例如共生同源基因)。
如本文所用,“同源序列,,指通过最佳比对进行比较时,与对象核苷酸或氨基酸序 列具有至少约99%、至少约98%、至少约97%、至少约96%、至少约95%、至少约94%、至 少约93 %、至少约92 %、至少约91%、至少约90 %、至少约88 %、至少约85 %、至少约80 %、 至少约75%、至少约70%或至少约60%序列同一性的核酸或多肽序列。在一些实施方案 中,同源序列具有约80%和100%之间的序列同一性,在一些实施方案中具有约90%和 100%之间的序列同一性,在一些实施方案中具有约95%和100%之间的序列同一性。
可以使用本领域已知的标准技术(见例如Smith和Waterman,Adv. App 1. Math.,2 :482[1981] ;Needleman 禾口 ffunsch, J.Mol. Biol. ,48 :443[1970] ;Pearson 和 Lipman, Proc. Natl. Acad. Sci. USA 85 :2444 [1988];诸如 Wisconsin Genetics Software Package (Genetics Computer Group, Madison, WI)中的 GAP、BESTFIT、FASTA 和 TFASTA 的 程序;和 Devereux 等,Nucl. Acid Res. , 12 :387-395 [1984])测定序列同源性。
用于测定序列同源性的算法包含=PILEUP和BLAST(Altschul等,J. Mol. Biol., 215 :403-410, [1990];和 Karlin 等,Proc. Natl. Acad. Sci. USA90 :5873-5787 [1993])。 PILEUP 使用 Feng 禾口 Doolittle 的渐进比对法(progressive alignment method) (Feng 禾口Doolittle, J. Mol. Evol. ,35 =351-360 [1987])的简化方法。该方法类似于Higgins 和 Sharp 所描述的方法(Higgins和Sharp,CABIOS 5 :151_153[1989])。有用的PILEUP参数包含默 认空位权重3. 00、默认空位长度权重0. 10和加权的末端空位。
WU-BLAST-2 程序(见 Altschul 等,Meth. Enzymol.,266 :460-480 [1996])是尤其 有用的BLAST程序。WU-BLAST-2使用几个搜索参数,其中大多数设置为默认值。用以下值 设置可调节参数重叠跨度(overlap span) = 1,重叠分数(overlap fraction) = 0. 125, 字串阈值(word threshold)⑴=11。HSP S和HSP S2参数是动态值,其由程序自身根据 具体序列的组成和针对其搜索目的序列的具体数据库的组成来建立。但是,可以调节数值 来提高敏感性。通过匹配的相同残基数除以比对区中“较长”序列的总残基数来测定百分 比氨基酸序列同一性的值。“较长”序列是在比对区中具有最多的真实残基的序列(忽略由 WU-Blast-2引入以最大化比对评分的空位)。
本文所用的术语“载体”指可以在细胞中复制且可以携带新基因或DNA区段进入 细胞的任意核酸。因此,该术语指涉及用于在不同宿主细胞之间转移的核酸构建体。“表达 载体”指具有在细胞中掺入和表达异源DNA片段(即非天然DNA)的能力的载体。许多原核 和真核表达载体是市售的。适合的表达载体的选择属于本领域技术人员的技能。
本文所用的术语“DNA构建体”、“表达盒”和“表达载体”指通过重组或合成产生 的,具有允许具体核酸在靶细胞中转录的一系列特定的核酸元件(即如上文所述的载体或 载体元件)的核酸分子。例如,可以将表达盒掺入质粒、染色体、线粒体DNA、质体DNA、病毒 或核酸片段。通常,表达载体的表达盒部分包含待转录的核酸序列、启动子和终止子等。在 一些实施方案中,DNA构建体也包含允许具体核酸在靶细胞中转录的一系列特定的核酸元 件。在一些实施方案中,本发明的DNA构建体包含选择标记。
还本文所用的术语“DNA构建体”(以及“转化DNA”和“转化序列”)指用来将序 列引入宿主细胞或生物(即“转化宿主细胞”)的DNA。可以通过PCR或任意其他适合的 技术在体外产生DNA构建体。在一些实施方案中,转化DNA可以包含进入序列(incoming sequence)和/或可以包含侧翼具有同源盒的进入序列。还在另一个实施方案中,转化DNA 包含连接至末端的其他非同源序列(例如填充序列或侧翼序列)。可以封闭末端以使转化 DNA形成封闭的环(即质粒),例如插入载体中。
本文所用的术语“质粒”指用作克隆载体的环状双链(ds)DNA构建体,其在许多细 菌和一些真核生物中形成染色体外自主复制的遗传元件。在一些实施方案中,质粒掺入宿 主细胞的基因组。
本文所用的术语“分离的”和“纯化的”用来指从至少一种其天然结合的成分移出 的分子(例如核酸或多肽)或其他成分。
本文所用的术语“改变的表达”解释为包含改变的(即改造的)细胞株目的蛋白 质的产生相对于来自对应的未改变的亲本菌株的正常产生水平的提高或降低(即在基本 上相同的条件下培养时)。
本文所用的术语“增强的表达”解释为包含改变的(即改造的)细胞株目的蛋白 质的产生在来自对应的未改变的亲本菌株的正常产生水平之上的增加(即在基本上相同 的条件下培养时)。
本文所用的术语“表达”指通过其产生多肽的过程。该过程包含基因的转录和翻译二者。在一些实施方案中,该过程还包含多肽的分泌。
如本文所用,在“将核酸序 列引入细胞”的背景中,术语“引入”(和过去式的“已引 入”)指适合用于将核酸序列转移至细胞内的任意方法,其包含但不限于转化、电穿孔、核显 微注射、转导、转染(例如脂质介导的转染和DEAE-糊精介导的转染)、与磷酸钙DNA沉淀孵 育、用DNA包被的微粒高速轰击、农杆菌属介导的转化和原生质体融合。
本文所用的术语“稳定转化的”指具有整合入其基因组或作为附加型质粒维持至 少两代的非天然(异源)多核苷酸序列的细胞。
如本文所用,“进入序列”指被引入宿主细胞的DNA序列。进入序列可以是DNA构 建体的部分,可以编码一种或多种目的蛋白质(例如异源蛋白质),可以是功能性或非功能 性基因和/或突变的或经修饰的基因,和/或可以是选择标记基因。例如,进入序列可以包 含选自 apsB、cpsA、derA、derB、htmA、mnn9、mnnlO、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、 ρ印Ad、ρ印F、ρ印B、ρ印C、ρ印D、其片段和同源序列的基因的功能性或非功能性(例如破坏 的)形式。在一个实施方案中,进入序列包含两个同源盒。
如本文所用,“同源盒”指与丝状真菌细胞染色体中的基因序列同源的核酸序列。 更具体地,同源盒是与紧邻的基因编码区侧翼或待按照本发明失活的基因的部分具有约 80 %至100 %之间的序列同一性、约90 %至100 %之间的序列同一性或约95 %至100 %之间 的序列同一性的上游或下游区域。这些序列指定DNA构建体或进入序列在染色体中的何处 整合,并指定染色体的什么部分被DNA构建体或进入序列替代。虽然不意味着限制本发明, 但同源盒可以包含约1碱基对(bp)至200千碱基对(1Λ)之间。通常,同源盒包含约Ibp 和 10. Okb 之间、Ibp 和 5. Okb 之间、Ibp 和 2. 5kb 之间、Ibp 和 1. Okb 之间、0. 25kb 和 2. 5kb 之间。同源盒还可以包含约 10. Okb,5. Okb,2. 5kb、2. OkbU. 5kb、l. 0kb、0. 5kb、0. 25kb 和 0.11Λ。在一些实施方案中,选择标记的5'端和3'端侧翼具有同源盒,其中同源盒包含紧 邻基因编码区侧翼的核酸序列。
在另一个实施方案中,转化DNA序列包含无进入序列存在的同源盒。在此实施方 案中,希望删除两个同源盒之间的内源DNA序列。此外,在一些实施方案中,转化序列是野 生型序列,而在其他实施方案中,它们是突变体或经修饰的序列。此外,在一些实施方案中, 转化序列是同源的,而在其他实施方案中,它们是异源的。
本文所用的术语“靶序列”指宿主细胞中的DNA序列,其编码希望进入序列在该处 插入宿主细胞基因组的序列。在一些实施方案中,靶序列编码功能性野生型基因或操纵子, 而在其他实施方案中,靶序列编码功能性突变体基因或操纵子,或非功能性基因或操纵子。
如本文所用,“侧翼序列”指所讨论的序列上游或下游的任意序列(例如,对基因 A-B-C,基因B侧翼为A和C基因序列)。在一些实施方案中,进入序列在每一侧侧接同源 盒。在其他实施方案中,进入序列和同源盒包含每一侧侧接填充序列的单位。在一些实施 方案中,侧翼序列仅存在于单侧上(3’或5’),在其他实施方案中,其存在于被其包夹的序 列的每一侧上。每个同源盒的序列与曲霉属染色体中的序列同源。这些序列指定新构建体 在曲霉属染色体中的何处整合和曲霉属染色体的什么部分将被进入序列替代。在一些实施 方案中,这些序列指定新构建体在没有染色体的任何部分被进入序列替代的情况下在曲霉 属染色体中的何处整合。在一些实施方案中,选择标记的5'和3'端侧接包含失活染色体 区段的节段的多核苷酸序列。在一些实施方案中,侧翼序列仅存在于单侧上(3’或5’),在其他实施方案中,其存在于被其包夹的序列的每一侧上。
本文所用的术语“在染色体上整合的”指已整合入宿主细胞染色体DNA的序列,通 常是突变体基因(例如天然基因的破坏形式)。通常,染色体整合经由“同源重组”的过程 发生,其中引入(转化)DNA的同源区与宿主染色体的同源区一起排列(align)。随后,同源 区之间的序列在双交换中被进入序列替代。因此,“在染色体上整合的”在本文中可与“同 源重组的”或“同源整合的”互换使用。
本文所用的术语“可选择标记”和“选择标记”指能够在宿主细胞中表达的核酸, 其允许方便地选择包含该标记的那些宿主。因此,术语“可选择标记”指提供宿主细胞已吸 收(例如已被用其成功地转化)进入的目的核酸(例如失活的基因)或一些其他反应已 发生的指示的基因。通常,可选择标记是赋予宿主细胞抗微生物剂抗性或代谢优势,以允 许从在转化过程中未接受任意外源序列的细胞区分包含外源DNA的细胞的基因。用于本发 明的选择标记包含但不限于抗微生物剂抗性标记(例如ampR、phleoR、specR、kanR、eryR、 tetR、cmpR、hygroR 禾口 neoR ;见例如 Guerot—Fleury,Gene, 167 :335-337 [1995] ;Palmeros 等,Gene 247 :255-264 [2000];和 Trieu-Cuot 等,Gene,23 :331-341 [1983])、营养缺陷型标 记(如色氨酸、PyrG和amdS)和检测标记(如β -半乳糖苷酶)。
“居留(residing)可选择标记”是定位在待转化微生物的染色体上的可选择标记。 居留可选择标记编码不同于转化DNA构建体上的可选择标记的基因。
本文所用的术语“启动子”指发挥功能来指导下游基因转录的核酸序列。在一些 实施方案中,启动子适合于在其中表达所希望的基因的宿主细胞。启动子与其他转录和翻 译调节核酸序列(也称为“控制序列”)一起是表达给定基因必需的。一般,转录和翻译调 节序列包含但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止 序列和增强子或激活序列。
当将其与其他核酸序列置于功能性关系中时,核酸被“有效连接”。例如,若编码分 泌前导序列(即信号肽)的DNA表达为参与多肽分泌的前蛋白质,则其有效连接至该多肽 的DNA ;若启动子或增强子影响编码序列的转录,则其有效连接至该序列;或者若核糖体结 合位点放置得便于促进翻译,则其有效连接至编码序列。一般,“有效连接”指所连接的DNA 序列是紧邻的,在分泌前导序列的情况下,所连接的DNA序列是紧邻且处于阅读相中的。但 是,增强子不必是紧邻的。通过在方便的限制位点处连接来完成连接。若不存在这类位点, 则按照常规实施使用合成的寡核苷酸衔接物或接头。
本文所用的术语“杂交”指核酸链通过本领域已知的碱基配对与其互补链连接的 过程。
若核酸序列与参考核酸序列在中度到高度严格的杂交和漂洗条件下特异性地彼 此杂交,则认为这两条序列“可选择性杂交”。杂交条件以核酸结合复合物或探针的溶解温 度(Tm)为基础。例如,“最严格”通常发生在约Tm-5°C (探针的Tm以下5°C );“高度严格” 在Tm以下约5-10°C ;“中度严格”在探针的Tm以下约10_20°C ;和“低度严格”在Tm以下 约20-25°C。在功能上,最严格的条件可用来鉴定与杂交探针具有绝对的同一性或几乎绝对 的同一性的序列;而中度或低度严格的杂交可用来鉴定或检测多核苷酸序列同源物。
中度和高度严格的杂交条件为本领域公知。高度严格的条件的实例包含于约42°C 在50%甲酰胺、5X SSC、5X Denhardt,s溶液、0. 5% SDS和100 μ g/ml变性载体DNA中杂交,然后于室温在2X SSC和0.5% SDS中漂洗两次,于42°C在0. IX SSC和0. 5% SDS中漂洗 另外两次。中度严格的条件的实例包含于37°C在包含20%甲酰胺、5x SSC(150mM氯化钠, 15mM柠檬酸三钠)、50mM磷酸钠(pH 7. 6)、5x Denhardt,s溶液、10%硫酸葡聚糖和20mg/ ml变性的剪切鲑鱼精子DNA的溶液中孵育过夜,然后于约37-50°C在Ix SSC中漂洗滤膜。 本领域技术人员了解如何按适应如探针长度等的因素所需来调节温度、离子强度等。
如本文所用,在谈论细胞或载体中使用的“重组体”指通过异源核酸序列的引入修 饰的细胞或载体,或衍生自经如此修饰的细胞的细胞。因此,例如,由于有意的人为干预,重 组细胞表达不以相同形式见于该细胞的天然(非重组)形式的基因,或表达否则将非正常 表达、低量表达、过量表达或完全不表达的基因。“重组”、“重组的”或产生“重组的”核酸一 般是两个或多个核酸片段的组装,其中组装产生嵌合基因。
本文所用的术语“引物”指天然存在于纯化的限制酶消化产物中的或合成产生的 寡核苷酸,当将其置于诱导与核酸链互补的引物延伸产物合成的条件(即存在核苷酸和如 DNA聚合酶的诱导剂,且处于适合的温度和pH的情况下)下时,其能够作为合成起点。通 常,引物是用于最大化扩增效率的单链。大多数情况下,引物是寡脱氧核糖核苷酸。
本文所用的术语“聚合酶链反应”(PCR)指用引物对、DNA聚合酶和DNA聚合、溶 解和退火的反复循环扩增DNA链的方法(见例如美国专利号4,683,195 ;4, 683, 202和 4,965,188,其在此引入本文作为参考)。
本文所用的术语“限制性内切酶”和“限制酶”指细菌酶,其各自在特异核苷酸序 列处或在其附近切割双链DNA。
“限制位点,,指被给定的限制性内切酶识别和切割的核苷酸序列,其经常是DNA片 段插入的位点。在本发明的某些实施方案中,将限制位点设计入选择标记中和DNA构建体 的5'和3'末端中。
II.本发明的一般性方法和实施方案
本发明提供能够产生目的蛋白质的失活突变体(例如删除突变体和破坏突变 体)。具体而言,本发明涉及具有改变的目的蛋白质表达的重组丝状真菌微生物(如曲霉属 物种),其中一个或多个染色体基因已失活,且通常其中一个或多个染色体基因已从曲霉属 染色体删除,或其中一个或多个染色体基因的蛋白质编码区已被破坏。更确切地,本发明提 供用于删除单个或多个基因的方法。在一些实施方案中,这类删除提供如提高的目的蛋白 质产生的优势。
在一些方面中,本发明依赖于遗传工程和分子生物学领域中使用的常规技术和方 法。以下资源包含用于本发明的一般方法学的描述Sambrook等,MOLE⑶LAR CLONING A LABORATORY MANUAL(第 二 版,1989) ;Kreigler, GENE TRANSFER AND EXPRESSION A LABORATORY MANUAL (1990);和 Ausubel 等编辑 CURRENT PROTOCOLS IN MOLECULAR BI0L0GY(1994)。这些一般参考文献提供本领域技术人员已知的定义和方法。但是,并非旨 在将本发明限于所述的任意具体方法、流程和试剂,这些方法、流程和试剂可以改变。
失活基因
如上文所指出,本发明包含具有单个或多个蛋白酶基因失活的丝状真菌细胞,其 中该失活基因选自apsB、apsB同源物、cpsA、cpsA同源物及其组合。可以通过基因删除或 基因破坏来失活基因。在一些实施方案中,失活基因是不可回复的。[0106]在一些实施方案中,失活基因是apsB同源物或cpsA同源物。用于本发明的同源 物具有与apsB或cpsA相同或相似的功能,且与apsB或cpsA具有至少99%、至少98%、至 少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至少 88%、至少85%、至少80%、至少70%或至少60%序列同一性。
基因CpsA(SEQ ID NO 1)编码具有氨基酸序列SEQ ID NO 2的黑曲霉羧肽酶,该 羧肽酶被认为是分泌性蛋白质。
基因apsB(SEQ ID NO 9)编码具有氨基酸序列SEQ ID NO 10的黑曲霉氨肽酶,该 氨肽酶是胞内蛋白质(即不被细胞分泌)。
在一些实施方案中,丝状真菌细胞可以包含其他失活基因。其他失活基因可以包 含但不限于涉及蛋白质降解或蛋白质修饰的基因,如ER降解途径中的蛋白质、蛋白酶基因 (如分泌性丝氨酸和天冬氨酸蛋白酶基因)、糖基化基因和糖蛋白降解基因。在一些实施 方案中,其他失活基因可以选自以下的一种或多种derA、derB、htmA、mnn9、mnnlO、ochA、 dpp4、dpp5、ρ印F、ρ印Aa、pepAb, pepAc和ρ印Ad。这些基因的多种编码序列和功能,以及 产生和使用具有一个或多个失活的这些基因的丝状真菌细胞的方法描述于美国专利申请 公开号2006/0M6545中,其在此引入本文作为参考(还见Wang等,“Isolation of four pepsin-like protease genes from Aspergillus niger and analysis of the effect of disruptions on heterologous laccase expression,,,Fungal Genet. Biol.45 (1) 17-27 (2008年1月),其在此引入本文作为参考)。
在一些实施方案中,本发明的具有失活基因的丝状真菌细胞可包含两个或多个 (例如两个、三个或四个)失活基因。
在一些实施方案中,丝状真菌细胞可以包含其他失活基因。其他失活基因可以包 含但不限于涉及蛋白质降解或蛋白质修饰的基因,如ER降解途径中的蛋白质、蛋白酶基因 (如分泌性丝氨酸和天冬氨酸蛋白酶基因)、糖基化基因和糖蛋白降解基因。在一些实施 方案中,其他失活基因可以选自以下的一种或多种derA、derB、htmA、mnn9、mnnlO、ochA、 dpp4、dpp5、ρ印F、ρ印Aa、pepAb, pepAc和ρ印Ad。这些基因的多种编码序列和功能,以及 产生和使用具有一个或多个失活的这些基因的丝状真菌细胞的方法描述于美国专利申请 公开号2006/0M6545中,其在此引入本文作为参考(还见Wang等,“Isolation of four pepsin-like protease genes from Aspergillus niger and analysis of the effect of disruptions on heterologous laccase expression,,,Fungal Genet. Biol.45 (1) 17-27 (2008年1月),其在此引入本文作为参考)。
在一些实施方案中,本发明的具有失活基因的丝状真菌细胞可包含两个或多个 (例如两个、三个或四个)失活基因。
在一些实施方案中,本发明的具有失活基因的丝状真菌细胞包含至少一个选自 apsB、apsB 同源物、cpsA、cpsA 同源物的基因禾口选自 derA、derB、htmA、mnn9、mnnlO、ochA、 dpp4、dpp5、ρ印F、ρ印Aa、ρ印Ab、pepAc和ρ印AcU其组合和与其具有至少99%、至少98%、 至少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至 少88 %、至少85 %、至少80 %、至少70 %或至少60 %序列同一性的功能性同源序列的基因。
还考虑失活基因的组合,可将美国专利申请公开号2006/0M6545中明确公开的 derA、derB、htmA、mnn9、mnnlO、ochA、dpp4、dpp5、pepF、pepAa、pepAb、pepAc 禾口 pepAd 与本文公开的失活apsB和/或cpsA基因组合,以向丝状真菌细胞提供两个或多个失活基因。 在一些实施方案中,除失活的apsB和/或cpsA蛋白酶基因外,丝状真菌细胞可以包含失活 的二肽基蛋白酶基因dpp4和dpp5。在一些实施方案中,除失活的apsB和/或cpsA蛋白 酶基因外,本发明的丝状真菌细胞可以包含一个或多个失活的胃蛋白酶样天冬氨酸蛋白酶 基因ρ印Aa、pepAb, ρ印Ac和/或ρ印Ad。在一些实施方案中,本发明的具有失活基因的丝 状真菌细胞包含至少一个选自apsB、apsB同源物、cpsA、cpsA同源物的基因和选自derA、 derB> htmA、mnn9、mnnlO、ochA、dpp4、dpp5、pepF、pepAa、pepAb、pepAc 禾口 pepAd、其组合禾口 与其具有至少99 %、至少98 %、至少97 %、至少96 %、至少95 %、至少94 %、至少93 %、至少 92%、至少91%、至少90%、至少88%、至少85%、至少80%、至少70%或至少60%序列同 一性的功能性同源序列的基因。
还考虑失活基因的组合,可将美国专利申请公开号2006/0M6545中明确公开的 derA、derB、htmA、mnn9、mnnlO、ochA、dpp4、dpp5、pepF、pepAa、pepAb、pepAc 禾口 pepAd 与 本文公开的失活apsB和/或cpsA基因组合,以向丝状真菌细胞提供两个或多个失活基因。 在一些实施方案中,除失活的apsB和/或cpsA蛋白酶基因外,丝状真菌细胞可以包含失活 的二肽基蛋白酶基因dpp4和dpp5。在一些实施方案中,除失活的apsB和/或cpsA蛋白酶 基因外,本发明的丝状真菌细胞可以包含一个或多个失活的胃蛋白酶样天冬氨酸蛋白酶基 因 pepAa、pepAb、pepAc 禾口 / 或 pepAd。
在一些实施方案中,见于丝状真菌细胞中的apsB和cpsA的同源基因可用于本发 明。具体而言,产生本文公开的具有失活基因的丝状真菌细胞的方法可以用来失活具有 apsB和/或cpsA的这些天然同源物失活的突变株。在一些实施方案中,apsB和cpsA的 这些同源基因将分别与SEQ IDNO :l(cpsA)或SEQ ID NO :8(apsB)具有至少约60%、70%、 80%、85%、90%、95%、或甚至更高的百分比序列同一性。
失活的方法和DNA构建体
用于鉴定丝状真菌细胞(例如黑曲霉)中待失活的基因的方法、用于制备用于 基因失活的DNA构建体(例如破坏序列)的方法和用于检测基因失活的方法描述于2006 年11月2日公开的美国专利申请公开号20060246M5A1中,其在此引入本文作为参考 (33SJAL Wang "Isolation of four pepsin-like protease genes from Aspergillus niger and analysis of the effect of disruptions on heterologous laccase expression, ”Fungal Genet. Biol. 45(1) :17-27(2008 年 1 月),其在此引入本文作为参 考)。
从宿主细胞确定同源序列的方法为本领域已知,其包括用本文公开的核酸序列来 构建寡核苷酸探针,所述探针对应于所编码的蛋白质的约6至20个氨基酸。然后可以用探 针来克隆同源基因。分离丝状真菌宿主基因组DNA并用适合的限制酶消化。分离片段并用 通过标准方法从蛋白质降解序列制备的寡核苷酸探针探测。分离对应于通过杂交至寡核苷 酸探针鉴定的DNA区段的片段,连接至适合的载体,然后转化入宿主以产生DNA克隆。
在一些实施方案中,用于本发明的apsB或cpsA的基因同源物可以是分别与 apsB(SEQ ID NO :10)或cpsA(SEQ ID NO :2)具有至少约60%、70%、80%、85%、90%、95% 或甚至更高的百分比氨基酸序列同一性的见于丝状真菌细胞(例如曲霉属物种)的蛋白 质。在一些实施方案中,功能性同源核苷酸或氨基酸序列可见于相关的丝状真菌物种(例如黑曲霉和米曲霉),且将与apsB(SEQ ID NOS :9禾口 10)或cpsA(SEQ ID N0S:1和2)具有 至少约80^^85^^90%或至少95%序列同一性。在其他实施方案中,用于本发明的基因同 源物可以具有产生因一个或多个保守性氨基酸替代而不同于SEQ ID NOS :10或2的氨基酸 序列的序列。在这类实施方案中,保守性氨基酸替代包含但不限于以下组甘氨酸和丙氨 酸;缬氨酸、异亮氨酸和亮氨酸;天冬氨酸和谷氨酸;精氨酸和谷氨酰胺;丝氨酸和苏氨酸; 色氨酸、酪氨酸和苯丙氨酸;和赖氨酸和精氨酸。
在一些实施方案中,本发明包含含有进入序列(例如破坏序列)的DNA构建体。在 体外组装DNA构建体,然后直接将构建体克隆入感受态宿主(例如曲霉属宿主),以使DNA 构建体整合入宿主染色体。例如,可以用PCR融合和/或连接在体外组装DNA构建体。
在一些实施方案中,DNA构建体是非质粒构建体,而在其他实施方案中,将DNA构 建体掺入载体(例如质粒)。在一些实施方案中,使用环状质粒。在一些实施方案中,设计 环状质粒以使用适合的限制酶(即不破坏DNA构建体的限制酶)。因此,可将线性化质粒用 于本发明。
在一些实施方案中,进入序列包含apsB基因、cpsA基因、apsB或cpsA的同源序 列、apsB或cpsA的基因片段;和/或紧邻的染色体编码区侧翼序列。同源序列是编码与 apsB或cpsA具有相似或相同功能的蛋白质,且与apsB或cpsA基因或其基因片段具有至 少约 99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、88%、85%、80%、70%或 60 %序列同一性的核酸序列。
在其中基因组DNA已知的一些实施方案中,通过两个PCR反应克隆待删除基因的 5’侧翼片段和3’侧翼片段,在其中基因被破坏的实施方案中,通过一个PCR反应克隆DNA 片段。
在一些实施方案中,编码区侧翼序列包含约Ibp至2500bp、约Ibp至1500bp、约 Ibp至lOOObp、约Ibp至500bp和Ibp至250bp。包含编码区侧翼序列的核酸序列的数目可 以在基因编码序列的每一端不同。例如,在一些实施方案中,编码序列的5'末端包含少于 25bp,编码序列的3'末端包含超过IOObp。
在一些实施方案中,进入序列包含破坏序列,其在5’和3’末端侧接选择标记,以 及基因序列的片段。在其他实施方案中,当将包含选择标记和基因、其基因片段或同源序列 的DNA构建体转化入宿主细胞时,选择标记的定位使得基因对其预期用途是无功能的。在 一些实施方案中,进入序列包含定位于基因启动子区中的选择标记。在其他实施方案中,进 入序列包含定位于基因启动子区之后的选择标记。
还在其他实施方案中,进入序列是包含定位于基因编码区中的选择标记的破坏序 列。在其他实施方案中,进入序列包含两个末端都具有同源盒的选择标记。还在其他实施 方案中,进入序列包含破坏编码序列的转录和/或翻译的序列。还在其他实施方案中,DNA 构建体包含设计在该构建体上游和下游末端的限制位点。
在一个实施方案中,构巢曲霉amdS基因为用于本发明的丝状真菌的转化提供选 择标记系统。amdS基因编码曲霉属菌株中缺乏的乙酰胺酶,为在乙酰胺培养基上生长的转 化体提供阳性选择压力。amdS基因甚至可以在已知其包含内源amdS基因或同源物的真菌 中用作选择标记,例如在构巢曲霉(Tilburn等1983,Gene 26 :205-221)和米曲霉(Gomi等 1991, Gene 108:91-98)中。可以通过在选择培养基中包含CsCl来抑制非转化体的背景amdS活性。
在本领域中建立了在工业上重要的丝状真菌(例如在黑曲霉中(见例如Kelly 和 Hynes 1985,EMBO J. 4 :475-479 ;Wang 等,Fungal Genet. Biol. 45(1) :17-27(2008 年 1 月));在产黄青霄(Penicillium chrysogenum)(见例如 Beri 禾口 Turner 1987,Curr. Genet. 11 :639-641);在里氏木霉(Trichoderma reesei)(见例如 Pentilla 等 1987,Gene 61 :155-164);在米曲霉(见例如 Christensen 等 1988,Bio/technology 6 :1419-1422); 在哈茨木霉(Trichoderma harzianum)(见例如 Pe' er 等 1991,Soil Biol. Biochem. 23 1043-1046 ;和美国专利号6,548, 285),每篇文献在此引入本文作为参考)的转化中使用 amdS标记系统的方法。
可以将包含进入序列的DNA构建体掺入载体(例如质粒中),或直接用来转化丝状 真菌细胞,从而产生失活突变体。通常,DNA构建体稳定转化,产生不可回复的失活基因的染 色体整合。在体外构建并将DNA构建体插入适合的载体的方法为本领域公知。一般通过在 方便的限制位点处连接来进行序列的删除和/或插入。若不存在这类位点,则可以按照常 规实践制备和使用合成的寡核苷酸接头。(见Sambrook (1989)上文;和Bennett和Lasure, More Gene Manipulations in Fungi, Academic Press, San Diego(1991)70-76 页)。此 夕卜,可以用己知的重组技术(例如 Invitrogen Life Technologies,Gateway Technology) 构建载体。可以用在本发明的实施中的适合的表达和/或整合载体的实例在Sambrook等, (1989)上文;Ausubel (1987)上文;Bennett 禾口 Lasure (编辑)More Gene Manipulations in Fungi, Academic Press 396-428 页中的 van den Hondel 等(1991);和美国专利号 5,874,276中给出。用于本发明的示例性载体包含pBS_T、pFB6、pBR322、pUC18、pUClOO和 pENTR/D。
在一些实施方案中,至少一个DNA构建体的拷贝整合入宿主染色体。在一些实施 方案中,用本发明的一个或多个DNA构建体转化宿主细胞。例如,可以用一个DNA构建体失 活apsB基因,而可以用另一个构建体失活cpsA基因。当然,本发明考虑和提供其他组合。
失活经由任意适合的方法发生,其包括在核酸基因序列中删除、替代(例如突 变)、破坏、插入和/或基因沉默机制,如RNA干扰(RNAi)。在一个实施方案中,失活基因 的表达产物是在蛋白质生物学活性中具有对应的改变的截短蛋白质。在一些实施方案中, 失活导致基因生物学活性的丧失。在一些实施方案中,重组真菌细胞中失活基因的生物学 活性将实际上是零(即不可测量)。在一些实施方案中,可以保留一些残余活性,且与对应 的亲本菌株中相同基因或同源基因的生物学活性相比,通常将低于251201151101 5%和2%或更少。
在一些实施方案中,通过删除达到失活,在其他实施方案中,通过基因蛋白质编码 区的破坏达到失活。在一些实施方案中,通过同源重组失活基因。
在一些实施方案中,只要染色体中剩余的序列使基因在功能上失活,删除可以是 部分的。在一些实施方案中,删除突变体包含产生稳定和不可回复的删除的一个或多个基 因的删除。编码序列的侧翼区可以在5’和3’末端包含约Ibp至约500bp。侧翼区可以大 于500bp,但在可以按照本发明失活或删除的区域中通常不包含其他基因。最终结果是删除 的基因实际上是非功能性的。虽然不意味着限制用于进行失活的方法,但在一些实施方案 中,可以通过删除来失活apsB和/或cpsA和同源基因。[0135]在一些实施方案中,破坏序列包含插入蛋白质编码区中的选择标记基因。通常,通 过在限制位点处切割然后连接,将基因序列反向插入失活基因的编码区序列来在体外进行 此插入。编码序列的侧翼区可以在5’和3’末端包含约Ibp至约500bp。侧翼区可以大于 500bp,但一般该区域中不包含其他基因。DNA构建体与宿主染色体的同源序列比对,基因的 翻译或转录在双交换事件中被破坏。例如,将apsB染色体基因与包含基因或部分基因编码 区和选择标记的质粒比对。在一些实施方案中,将选择标记基因定位在基因编码序列内或 在质粒上与基因分离的部分上。载体整合入宿主染色体,此后宿主基因由于插入编码序列 的标记的存在而失活。
虽然不意味着限制用于进行失活的方法,但在一些实施方案中,可以通过此方法 失活apsB和/或cpsA和同源序列。
在一些实施方案中,以质粒作为载体,通过单交换事件中的插入失活基因。例如, 载体整合入宿主细胞染色体,通过载体插入基因的蛋白质编码序列或基因的调节区来失活基因。
在其他实施方案中,由于基因的突变而产生失活。突变基因的方法为本领域公 知,且包含但不限于位点定向突变、随机突变的产生和缺口双链体方法(见例如美国专利 4,760,025 ;Moring 等,Biotech. 2 :646 [1984];和 Kramer 等,Nucleic Acids Res.,12 9441 [1984])。
宿主丝状真菌细胞
在本发明中,宿主细胞可以是丝状真菌细胞(见Alexopoulos,C.J· (1962), Introductory Mycology, Wiley, New York)。丝状真菌细胞的类型不是关键的。用于本 发明的丝状真菌细胞包含但不限于曲霉属物种(例如米曲霉、黑曲霉、泡盛曲霉、构巢曲 霉、酱油曲霉、日本曲霉、河内曲霉和棘孢曲霉)、根霉属物种、木霉属物种(例如里氏木霉 (之前分类为长梗木霉(T. Iongibrachiatum),现在也称为Hypocrea jecorina)、绿色木霉 (Trichoderma viride)、康宁木霄(Trichoderma koningii)禾口 Trichoderma harzianums) 和毛霉属物种(例如米黑毛霉(M.miehei)和微小毛霉(M. pusillus))。在一些实施方案 中,宿主细胞是黑曲霉。
在一些实施方案中,可以用于本发明的黑曲霉的具体菌株包含ATCC22342 (NRRL 3112)、ATCC 44733和ATCC 14331及从其衍生的菌株。在一些实施方案中,宿主细胞能够 表达异源基因。例如,宿主细胞可以是产生异源蛋白质的重组细胞。在其他实施方案中,宿 主是过量表达已引入细胞的蛋白质的细胞。
在一些实施方案中,宿主菌株是缺乏一个或多个基因(如对应于apsB和cpsA基 因以外的蛋白酶基因的基因)的突变株。例如,可以考虑使用其中编码主要的分泌性天冬 氨酰蛋白酶(如曲霉胃蛋白酶(aspergillop印sin))的基因已被删除的黑曲霉宿主细胞 (见例如美国专利号5,840,570和6,509,171,其在此引入本文作为参考)。因此,本发明提 供丝状真菌细胞的apSB和/或cpsA失活突变株,其中对应的亲本菌株已是具有一个或多 个失活基因的失活突变体。
目的蛋白质
在一些实施方案中,与丝状真菌对应的亲本菌株的一个或多个相同蛋白质的表达 和翻译相比,本发明所包含的失活突变体将显示一个或多个内源和/或异源目的蛋白质的改变的表达和翻译(即蛋白质产生)。
在一些实施方案中,本发明所包含的丝状真菌细胞失活突变体将以比对应的亲本 菌株中一个或多个相同蛋白质的产生高至少约0%至约200% (或更多)的量产生内源和 /或异源目的蛋白质。因此,在一些实施方案中,失活突变体一个或多个目的蛋白质的产生 比对应的亲本菌株中一个或多个内源和/或异源蛋白质的产生高至少约0%至100%,在一 些实施方案中高至少约10%至60%,包含其中产生高至少约10%、15%、20%、25%、30%、 35%、40%、45%、50%禾口 55%的实施方案。
在其他实施方案中,希望获得降低的目的蛋白质产生。因此,本发明还提供其中一 个或多个内源和/或异源目的蛋白质的产生比丝状真菌对应的亲本菌株中内源和/或异源 蛋白质的产生低至少约0%至100%或甚至更低的丝状真菌细胞失活突变体。在一些实施 方案中,蛋白质的产生比对应的亲本菌株中一个或多个内源和/或异源蛋白质的产生低至 少约10%至60%,包含其中产生低至少约10%、15%、20%、25%、30%、35%、40%、45%、 50%和55%的实施方案。
在本发明的一些实施方案中,由丝状真菌细胞失活突变体产生的目的蛋白质是胞 内产生的蛋白质(即胞内的非分泌性多肽)。在其他实施方案中,目的蛋白质是分泌性多 肽。此外,目的蛋白质可以是融合蛋白质或杂合蛋白质。在一些实施方案中,失活突变体显 示大量蛋白质的改变的产生,其中一些是胞内蛋白质,其中一些分泌性蛋白质。
用于本发明的目的蛋白质包含本领域已知的酶,其包含但不限于选自淀粉分解 酶、蛋白水解酶、纤维分解酶(cellulytic enzyme)、氧化还原酶和植物细胞壁降解酶的酶。 更具体而言,这些酶包含但不限于淀粉酶、葡糖淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚 氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、perioxidase、过氧化氢酶、葡糖氧化 酶、肌醇六磷酸酶、果胶酶、葡糖苷酶、异构酶、转移酶、半乳糖苷酶和几丁质酶。在一些实施 方案中,酶包含但不限于淀粉酶、葡糖淀粉酶、蛋白酶、酚氧化酶、纤维素酶、半纤维素酶、葡 糖氧化酶和肌醇六磷酸酶。在一些实施方案中,目的多肽是蛋白酶、纤维素酶、葡糖淀粉酶 或淀粉酶。
例如,在本发明的一个实施方案中,黑曲霉中apsB的失活导致异源漆酶以及内源 生糖酶的增加的产生。
在一些实施方案中,目的蛋白质是融合至信号肽(即待分泌蛋白质上的氨基端延 伸)的分泌性多肽。几乎所有分泌性蛋白质都使用氨基端蛋白质延伸,该延伸在前体蛋白 质靶向膜和跨膜转运中起作用。此延伸在膜转移的过程中或紧随其后被信号肽酶通过蛋白 水解去除。
在本发明的一些实施方案中,目的多肽是如抑制蛋白酶作用的蛋白酶抑制剂的蛋 白质。蛋白酶抑制剂为本领域已知,例如隶属于丝氨酸蛋白酶抑制剂家族的蛋白酶抑制剂, 已知其抑制trysin、组织蛋白酶G、凝血酶和组织激肽释放酶。用于本发明的蛋白酶抑制剂 包含Bowman-Birk抑制剂和大豆胰蛋白酶抑制剂(见Birk, Int. J. Pept. Protein Res. 25 113-131[1985] ;Kennedy, Am. J. Clin. Neutr. 68 1406S-1412S[1998];和 Billings 等, Proc. Natl. Acad. Sci. 89 :3120-3124 [1992])。
在本发明的一些实施方案中,目的多肽选自激素、抗体、生长因子、受体、细胞因子 等。本发明所包含的激素包含但不限于促卵泡激素、黄体生成素、促肾上腺皮质激素释放因子、促生长素抑制素、促性腺激素、血管升压素、催产素、促红细胞生成素、胰岛素等。生长因 子包含但不限于血小板衍生生长因子、胰岛素样生长因子、表皮生长因子、神经生长因子、 成纤维细胞生长因子、转化生长因子、细胞因子,如白细胞介素(例如IL-I至IL-13)、干扰 素、集落刺激因子等。抗体包含但不限于直接从希望从其产生抗体的任意物种获得的免疫 球蛋白。此外,本发明包含修饰的抗体。多克隆和单克隆抗体也包含于本发明。在一些实 施方案中,抗体或其片段是嵌合抗体或人源化抗体,包含但不限于抗_pl85HCT2、HulDlO-、司 徒曼布(trastuzumab)、贝伐单抗(bevacizumab)、帕利珠单抗(palivizumab)、英利昔单抗 (infliximab,)、达利珠单抗(daclizumab)和利妥希玛(rituximab)。
在另一个实施方案中,将编码目的蛋白质的核酸有效连接至在真菌宿主细胞中显 示转录活性的适合的启动子。启动子可以衍生自编码宿主细胞内源或异源蛋白质的基因。 启动子可以是截短启动子或杂合启动子。启动子还可以是诱导型启动子。通常,将启动子用 于木霉属宿主或曲霉属宿主中。适合的启动子的非限制性实例包含Cbhl、CW!2、egll、egl2 和xynl。在一个实施方案中,启动子是宿主细胞的天然启动子。有用的启动子的其他实例 包含来自泡盛曲霉和黑曲霉葡糖淀粉酶基因(glaA) (Nunberg等,(1984)Mol. Cell Biol. 4 2306-2315 和 Boel 等,(1984)EMBO J. 3 :1581-1585)、米曲霉 TAKA 淀粉酶基因、米赫根毛 霉(lihizomucor miehei)天冬氨酸蛋白酶基因、黑曲霉中性α -淀粉酶基因、黑曲霉酸稳定 α-淀粉酶基因、里氏木霉stpl和cellobiohydrolase 1基因的启动子(见例如EP 0137 280 Al,其在此引用作文本文的参考)及其突变体启动子、截短启动子和杂合启动子。
在一些实施方案中,将多肽编码序列有效连接至指导所编码的多肽进入细胞分泌 途径的信号序列。编码序列的5’末端可以天然包含在翻译阅读框中与编码分泌性蛋白质 的编码区的区段天然连接的信号序列。编码信号序列的DNA通常是与待表达的多肽天然结 合的序列。通常,信号序列由黑曲霉α-淀粉酶、黑曲霉中性淀粉酶或黑曲霉葡糖淀粉酶编 码。在一些实施方案中,信号序列是有效连接至cdhl启动子的木霉属cdhl信号序列。
丝状真菌细胞的转化
DNA构建体或载体往宿主细胞中的引入包含如转化、电穿孔、核显微注射、转导、转 染(例如脂质介导的转染和DEAE-糊精介导的转染)、与磷酸钙DNA沉淀孵育、用DNA包 被的微粒高速轰击、农杆菌属介导的转化和原生质体融合的技术。一般转化技术为本领域 已知(见例如 Ausubel 等,(1987),上文,第 9 章;和 Sambrook(1989)上文;Campbell 等, (1989) Curr. Genet. 16 :53-56 ;禾口 The Biotechnology of Filamentous Fungi,第 6 章编 辑Finkelstein和Ball (1992) Butterworth和Heinenmann,每篇文献在此引入本文作为参 考)。
异源蛋白质在丝状真菌细胞表达系统中的产生也是本领域已知的。例如,异源蛋 白质在木霉属中的表达描述于 Harkki 等(1991),Enzyme Microb. Technol. 13 :227-233 ; Harkki 等,(1989)Bio Technol. 7 :596-603 ;EP 244, 234 ;EP 215,594 ;和 Molecular Industrial Mycology,Leong和Berka编辑,Marcel Dekker Inc.,NY(1992) 129-148页中的 Nevalainen等,“The Molecular Biology of Trichoderma and its Application to the Expression of Both Homologous and Heterologous Genes“;禾口美国专利号 6,022,725 和6,268, 328中,每篇文献在此引入本文作为参考。
异源蛋白质在曲霉属物种中的表达描述于Cao等,OOOOWci. 9 :991-1001 ;和美国专利号6,509,171中,每篇文献在此引入本文作为参考。
可以用已知技术纯化本发明的转化体。
检测基因失活的方法
本领域技术人员可以使用多种方法来测定基因是否已被失活。虽然不意味着限 制本发明,但可以使用的一种方法是描述于Zhu(Zhu等,Acat Mycologica Sinica 13: 34-40[1994]中的酚/氯仿法,其在此引入本文作为参考。简言之,在此方法中,用基因组 DNA为模板进行PCR反应。如此设计引物,使得一条引物退火至选择标记基因(例如amdS 基因),第二条引物在基因的3’末端退火至离DNA同源片段更远的3’末端。与将对应的亲 本菌株(具有未失活的基因)基因组DNA用作模板时将不产生PCR片段相反,将失活突变 体基因组DNA用作PCR反应模板时将产生特异的PCR产物。此外,可以对来自失活突变体 的PCR片段进行DNA测序来确认失活基因的同一性。其他有用的方法包括Southern分析, 可参考Sambrook(1989)上文。
细胞培养
可将丝状真菌细胞培养在常规培养基中。可将用于转化细胞的培养基修改为适合 于激活启动子和选择转化体。如温度、PH等的具体培养条件将是本领域技术人员显而易见 的。用于本发明丝状真菌的一般培养条件是众所周知的,可以见于如Sambrook,(1982)上 文的科学文献中和从美国典型培养物保藏中心找到。此外,用于产生异源蛋白质的发酵方 法是本领域本身已知的。例如,可以通过固体培养或浸没培养产生蛋白质,包含分批法、补 料分批法和连续流法。发酵温度可以有一些改变,但对于如黑曲霉的丝状真菌,取决于所选 择的微生物菌株,温度一般将在约20°C至40°C的范围内,通常在约至37°C的范围内。 含水微生物发酵(发酵混合物)中的pH应在约2. O至8. O的示例性范围内。对于丝状真 菌,pH正常在约2. 5至8. O的范围内;对于黑曲霉,pH正常在约4. O至6. O的范围内,且通 常在约4. 5至5. 5的范围内。虽然部分取决于发酵温度和所使用的培养物,发酵混合物在发 酵罐中的平均存留时间可以显著改变,但其一般在约M至500小时的范围内,通常在约M 至400小时的范围内。可以在本发明中使用的用于培养丝状真菌的任意类型的发酵罐。用 于本发明的一个实施方案是在15L Biolatitte (Saint-Germain-en-Laye,法国)下操作。
检测所表达的蛋白质的活性的方法
本领域普通技术人员已知用于检测和测量在胞内和胞外表达的多肽活性的多种 测定法。测定宿主细胞中目的蛋白质的分泌水平和检测所表达的蛋白质的方法包括使用 对该蛋白质特异的多克隆或单克隆抗体的免疫测定的使用。实例包含酶联免疫吸附测 定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激活细胞分选术(FACS)。 但是,其他方法为本领域技术人员已知且可用于评估目的蛋白质(见例如Hampton等, Serological Methods, A Laboratory Manual, APS Press, St. Paul, MN[1990];禾口 Maddox 等,J. Exp. Med.,158 :1211 [1983],每篇文献在此引入本文作为参考)。在一些实施方案中, 目的蛋白质的表达和/或分泌在失活突变体中增强。在一些实施方案中,与对应的亲本菌 株相比,失活突变体中目的蛋白质的产生高至少100 %、至少95 %、至少90 %、至少80 %、至 少70%、至少60%、至少50%、至少40%、至少30%、至少20%、至少15%、至少10%、至少 5%和至少2%。
蛋白质回收[0167]一旦表达和任选地分泌了所希望的蛋白质,即可以回收和进一步纯化目的蛋白 质。可以通过本领域已知的方法从发酵培养液进行目的蛋白质的回收和纯化。发酵培养液 一般将包含细胞碎片(包含细胞、多种悬浮固体和其他生物量污染物)以及所希望的蛋白 质产物。
适合用于这种去除的方法包括产生无细胞滤液的常规固体-液体分离技术,例如 离心、过滤、透析、微量过滤、旋转真空过滤或其他已知方法。通常,在结晶之前用如超滤、蒸 发或沉淀的技术进一步浓缩发酵培养液或无细胞滤液可以是有用的。
可以利用盐来完成上清或滤液中蛋白质成分的沉淀,然后通过多种层析方法纯 化,例如离子交换层析、亲和层析和本领域已知的类似方法。当分泌所表达的希望多肽时, 可以从生长培养基纯化多肽。通常,在纯化多肽之前从培养基去除表达宿主细胞(例如通 过离心)。
当表达的重组希望多肽不从宿主细胞分泌时,通常破坏宿主细胞,将多肽释放入 含水“提取物”中,这是纯化的第一步。通常,在细胞破坏之前从培养基收集表达宿主细胞 (例如通过离心)。
通过参考以下实施例,本领域技术人员可以更充分地理解实施本发明的方式和方 法,这些实施例并非旨在以任意方式限制本发明或针对本发明的权利要求
的范围。
实施例
提供以下实施例是为了论证和进一步说明本发明的具体实施方案和方面,不解释 为限制其范围。
在以下实验公开内容中应用以下缩写°C (摄氏度);H20(水);dH20(去离子 水);HCl (盐酸);aa(氨基酸);bp (碱基对);1Λ (千碱基对);kD(千道尔顿);g(克); Pg(微克);mg(毫克);μ (微升);ml(毫升);mm(毫米);μπι(微米);M(摩尔); mM(毫摩尔);μ M(微摩尔);丽(分子量);s (秒);min(分钟);hr (小时);NaCl (氯化 钠);PBS (磷酸缓冲盐溶液[150mM NaCl,IOmM磷酸钠缓冲液,pH 7.2]) ;PCR(聚合酶链反 应);SDS(十二烷基硫酸钠);w/v(质量对体积);ν/ν(体积对体积);ATCC(美国典型培养 物保藏中心,Rockville, MD) ;BD Biosciences (前 CLONTECH Laboratories, Palo Alto, CA) ;Invitrogen(Invitrogen Corp. , San Diego, CA);禾口 Sigma(Sigma Chemical Co., St. Louis, M0)。
实施例1
具有失活cpsA基因的黑曲霉细胞
a.具有失活cpsA DNA构建体的破坏质粒“的制备
图1显示曲霉属cpsA基因(SEQ ID NO 1)的2188bp基因组DNA序列。图2显示 由SEQ ID NO :1的cpsA基因组DNA序列编码的552个氨基酸的序列(SEQ ID NO :2)。羧 肽酶是从多肽的C末端切割氨基酸的蛋白酶。
cpsA “破坏质粒”是用来转化黑曲霉细胞从而产生cpsA失活突变体微生物的包含 失活cpsA基因的DNA构建体。用来产生本文所用的cpsA (和apsB)破坏质粒的一般策略 和方法与描述于2006年11月2日公开的美国专利申请公开号20060246M5 Al中的策略 和方法相同,其在此引入本文作为参考(还见Wang等,“Isolation of four pepsin-likeprotease genes from Aspergillus niger and analysis of the effect of disruptions on heterologous laccase expression,"Fungal Genet. Biol. 45 (1) :17-27 (2008年1月), 其在此引入本文作为参考)。
以下表1显示用来产生失活cpsA破坏质粒构建体和检测转化细胞中破坏的基因 构建体的引物序列。
表 1
权利要求
1.包含至少一个失活基因的丝状真菌细胞,其中所述失活基因选自apsB、apsB同源 物、cpsA、cpsA同源物及其组合。
2.权利要求
1的丝状真菌细胞,其中所述失活基因是cpsA同源物,其中所述同源物与 SEQ ID NO 1具有至少85%序列同一性。
3.权利要求
1的丝状真菌细胞,其中所述失活基因是apsB同源物,其中所述同源物与 SEQ ID NO :9具有至少85%序列同一性。
4.权利要求
1的丝状真菌细胞,其中所述丝状真菌选自曲霉属物种、根霉属物种、木霉 属物种和毛霉属物种。
5.权利要求
4的丝状真菌细胞,其中所述丝状真菌是选自米曲霉、黑曲霉、泡盛曲霉、 构巢曲霉、酱油曲霉、日本曲霉、河内曲霉和棘孢曲霉的曲霉属物种。
6.权利要求
5的丝状真菌细胞,其中所述丝状真菌是黑曲霉。
7.权利要求
1的丝状真菌细胞,其中所述失活基因是apsB(SEQ IDNO 9)。
8.权利要求
7的丝状真菌细胞,其中所述丝状真菌细胞包含至少第二个选自cpsA、 dpp4、dpp5及其同源物的失活基因。
9.权利要求
1的丝状真菌细胞,其中所述失活基因是cpsA(SEQIDN0:l)o
10.权利要求
9的丝状真菌细胞,其中所述丝状真菌细胞包含至少第二个选自apsB、 dpp4、dpp5及其同源物的失活基因。
11.权利要求
1的丝状真菌细胞,其中通过用选择标记基因破坏来失活所述失活基因。
12.权利要求
1的丝状真菌细胞,其中所述细胞内源蛋白质的产生比对应的丝状真菌 细胞亲本菌株中内源蛋白质的产生高至少约10%至约60%。
13.权利要求
12的丝状真菌细胞,其中所述内源蛋白质是生糖酶。
14.权利要求
12的丝状真菌细胞,其中所述内源蛋白质是选自α-淀粉酶、纤维素酶、 葡糖淀粉酶、漆酶、中性蛋白酶和碱性蛋白酶的酶。
15.权利要求
1的丝状真菌细胞,其中所述细胞还包含编码异源蛋白质的核酸。
16.权利要求
15的丝状真菌细胞,其中所述异源蛋白质的产生相对于对应的丝状真菌 细胞亲本菌株中相同蛋白质的产生被改变。
17.权利要求
15的丝状真菌细胞,其中所述异源蛋白质的产生比对应的丝状真菌细胞 亲本菌株中相同蛋白质的产生高至少约10%至约60%。
18.权利要求
15的丝状真菌细胞,其中总干细胞重因比对应的丝状真菌细胞亲本菌株 的总干细胞重低约25%、20%、15%、10%或5%而不同。
19.权利要求
15的丝状真菌细胞,其中所述异源蛋白质是酶。
20.权利要求
19的丝状真菌细胞,其中所述酶选自α-淀粉酶、纤维素酶、葡糖淀粉酶、 漆酶、中性蛋白酶和碱性蛋白酶。
21.权利要求
19的丝状真菌细胞,其中所述酶是漆酶。
22.权利要求
15的丝状真菌细胞,其中所述异源蛋白质是蛋白酶抑制剂。
23.权利要求
15的丝状真菌细胞,其中所述异源蛋白质是抗体或其片段。
24.权利要求
1的丝状真菌细胞,其中所述失活基因编码胞内蛋白质。
25.权利要求
对的丝状真菌细胞,其中所述胞内蛋白质是蛋白酶。
26.权利要求
1的丝状真菌细胞,其中所述丝状真菌细胞包含至少两个失活基因。
27.权利要求
1的丝状真菌细胞,其还包含选自derA、derB、htmA、mnn9、mnnlO、ochA、 dpp4、dpp5、ρ印Aa、pepAb、ρ印Ac、ρ印Ad、ρ印B、ρ印C、ρ印D、ρ印F及其同源物的失活基因。
28.丝状真菌细胞,其包含至少一个失活基因,其中所述失活基因编码胞内蛋白质,且 其中所述细胞的至少一种其他蛋白质的产生比对应的丝状真菌细胞亲本菌株中其他蛋白 质的产生高至少约10%至约60%。
29.权利要求
观的丝状真菌细胞,其中所述胞内蛋白质是蛋白酶。
30.权利要求
观的丝状真菌细胞,其中所述胞内蛋白质是氨肽酶。
31.权利要求
观的丝状真菌细胞,其中所述胞内蛋白质是apsB。
32.用于产生蛋白质的方法,其包括a)将编码蛋白质的核酸引入丝状真菌细胞,其中所述细胞包含至少一个选自apsB、 apsB同源物、cpSA、cpSA同源物及其组合的失活基因;和b)在适合于产生所述蛋白质的条件下培养所述细胞。
33.权利要求
32的方法,其中所述方法还包括回收所述蛋白质。
34.权利要求
32的方法,其中所述失活基因是cpsA同源物,其中所述同源物与SEQID NO 1具有至少85%序列同一性。
35.权利要求
32的方法,其中所述失活基因是apsB同源物,其中所述同源物与SEQID NO 9具有至少85%序列同一性。
36.权利要求
32的方法,其中所述失活基因是cpsA(SEQID NO :1)。
37.权利要求
32的方法,其中所述失活基因是apsB(SEQ ID NO :9)。
38.权利要求
32的方法,其中所述丝状真菌是选自米曲霉、黑曲霉、泡盛曲霉、构巢曲 霉、酱油曲霉、日本曲霉、河内曲霉和棘孢曲霉的曲霉属物种。
39.权利要求
38的方法,其中所述曲霉属物种是黑曲霉。
40.权利要求
32的方法,其中所述蛋白质是蛋白酶抑制剂。
41.权利要求
32的方法,其中所述蛋白质是抗体或其片段。
42.权利要求
32的方法,其中所述蛋白质是酶。
43.产生用于蛋白质产生的丝状真菌菌株的方法,其包括a)用破坏序列转化丝状真菌细胞,其中所述破坏序列包含至少一个选自apSB、apSB同 源物、cpSA、cpSA同源物及其组合的失活基因;和b)选择其中所述破坏序列在染色体上整合的转化细胞。
44.权利要求
43的方法,其中所述失活基因是cpsA同源物,其中所述同源物与SEQID NO 1具有至少85%序列同一性。
45.权利要求
43的方法,其中所述失活基因是apsB同源物,其中所述同源物与SEQID NO 9具有至少85%序列同一性。
46.权利要求
43的方法,其中所述丝状真菌选自曲霉属物种、根霉属物种、木霉属物种 和毛霉属物种。
47.权利要求
43的方法,其中所述丝状真菌是选自米曲霉、黑曲霉、泡盛曲霉、构巢曲 霉、酱油曲霉、日本曲霉、河内曲霉和棘孢曲霉的曲霉属物种。
48.权利要求
47的方法,其中所述丝状真菌是黑曲霉。
49.权利要求
43的方法,其中所述失活基因是apsB(SEQ ID NO :9)。
50.权利要求
49的方法,其中所述丝状真菌细胞包含至少第二个选自CpsA、dpp4、dpp5 及其同源物的失活基因。
51.权利要求
43的方法,其中所述失活基因是cpsA(SEQ ID N0:1)。
52.权利要求
51的方法,其中所述丝状真菌细胞包含至少第二个选自apSB、dpp4、dpp5 及其同源物的失活基因。
53.权利要求
43的方法,其中所述细胞还包含编码异源蛋白质的核酸。
54.权利要求
43的方法,其中所述破坏序列包含在所述失活基因编码区序列中的限制 位点处反向插入的选择标记基因序列。
55.权利要求
讨的方法,其中所述选择标记基因是amdS。
56.分离的核酸,其包含基因的破坏序列,其中所述基因是cpsA或cpsA同源物,且其中 所述破坏序列包含在所述基因的编码区序列中的限制位点处反向插入的选择标记基因序 列。
57.权利要求
56的分离的核酸,其中基因是与SEQID NO :1具有至少85%序列同一性 WcpsA同源物。
58.权利要求
56的分离的核酸,其中基因是cpsA(SEQ ID NO :1)。
59.权利要求
56的分离的核酸,其中所述选择标记基因是amdS。
60.包含权利要求
56的核酸的载体。
61.分离的核酸,其包含基因的破坏序列,其中所述基因是apsB或cpsA同源物,且其中 所述破坏序列包含在所述基因的编码区序列中的限制位点处反向插入的选择标记基因序 列。
62.权利要求
61的分离的核酸,其中基因是与SEQID NO :9具有至少85%序列同一性 WapsB同源物。
63.权利要求
61的分离的核酸,其中基因是apsB(SEQ ID NO :9)。
64.权利要求
61的分离的核酸,其中所述选择标记基因是amdS。
65.包含权利要求
61的核酸的载体。
专利摘要
本发明涉及包含至少一个选自apsB、apsB同源物、cpsA、cpsA同源物及其组合的失活蛋白酶基因的丝状真菌细胞(例如曲霉属物种)。本发明提供用于产生失活突变丝状真菌细胞的核酸和方法,以及将该细胞用于改变的内源和异源目的蛋白质产生的方法。
文档编号C12N1/15GKCN102099460SQ200980112295
公开日2011年6月15日 申请日期2009年3月27日
发明者王华明 申请人:丹尼斯科美国公司导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1