在细菌细胞中扩增基因座的方法

文档序号:580356阅读:570来源:国知局
专利名称:在细菌细胞中扩增基因座的方法
技术领域
本发明提供在不使用抗生素的情况下扩增基因座的方法。具体而言,本发明涉及 在体内扩增编码目的多肽的DNA序列的方法、包含多个拷贝所述经扩增的DNA序列的细胞, 和包含待用于所述方法的DNA构建体的载体。此外,本发明涉及通过培养如上文所述的细 胞来产生目的多肽(例如酶)的方法。
背景技术
外源多肽的表达和重组产生是广泛使用的技术。众所周知,可以用编码外源目的 多肽的核酸转化细胞来表达和产生大量所希望的多肽。在一些应用中,用该方法产生超过 由起源生物自然产生的量的大量多肽。事实上,外源核酸序列的表达以及内源序列的过量 表达已广泛用于现代生物技术中。尽管有在分子生物学和蛋白质工程中的进步,但任然存在对提高多肽在宿主细胞 中的表达水平的方法和组合物的需要。发明概述本文提供扩增基因座的方法。在某些实施方案中,该方法可以包括a)将细菌宿 主细胞群体与必需酶的抑制剂接触,其中所述细菌宿主细胞包含结构为A1-P-M-A2的基因 座,其中A1和A2是同向重复,P包含目的多肽的编码序列,M包含所述必需酶的编码序列, 和b)选择对该抑制剂具有抗性的细胞;其中对该抑制剂具有抗性的细胞具有多个拷贝的 扩增单位。虽然考虑其他细菌细胞类型(例如链霉菌属物种(Str印tomyces sp.)),但细菌 宿主细胞可以是芽孢杆菌属物种(Bacillus sp.)细胞。在一些实施方案中,目的多肽是枯 草蛋白酶,例如SEQ ID NO :8的枯草蛋白酶,或SEQID NO :12中所示的其成熟形式。在某 些情况下,该方法避免使用抗生素标记和抗生素,提供基于抗生素的扩增系统之外的另一 种选择。在某些实施方案中,必需酶具有细胞内源酶(例如野生型酶)的氨基酸序列。在 具体实施方案中,用于该方法的细菌宿主细胞可以包含或不包含失活的编码该必需酶的内 源基因,其中失活的基因可以处于与结构SA1-P-M-A2的基因座不同的基因座。在某些情况 下,虽然可以使用其他酶/抑制剂组合,但必需酶可以是丙氨酸消旋酶(例如SEQ ID NO 11),抑制剂可以是β-氯-D-丙氨酸或环丝氨酸。在一些实施方案中,扩增单位包含SEQ ID NO 7中所示的序列。扩增单位提供由M区编码的必需酶的表达。在具体实施方案中,M可以包含必需 酶的编码序列和有效连接至该编码序列的启动子,其中该启动子是必需酶的编码序列的天 然启动子。在某些实施方案中,编码序列和启动子可以是宿主细胞内源的。扩增单位还提 供由P区编码的目的蛋白质的表达。在具体实施方案中,P的编码序列可以有效连接至存 在于相邻同向重复(A1)中的内源或非内源启动子。在其他实施方案中,P的启动子可以不 存在于相邻同向重复中。相反,该启动子存在于P区中。
3
在一些实施方案中,本发明提供包含含有结构为A1-P-M-A2的扩增单位的基因座 的细菌宿主细胞,其中A1和A2是同向重复,P包含目的多肽的编码序列,也提供包含必需酶 的编码序列的M。在这个实施方案中,扩增单位提供了必需酶的显著表达。虽然考虑其他细 菌细胞类型(例如链霉菌属物种),但细菌宿主细胞可以是芽孢杆菌属物种细胞。在一些 实施方案中,目的多肽是枯草蛋白酶,例如SEQ ID NO 8的枯草蛋白酶,或SEQ IDNO 12中 所示的其成熟形式。在某些情况下,该方法避免使用抗生素标记和抗生素,提供基于抗生素 的扩增系统之外的另一种选择。在某些实施方案中,必需酶具有细胞内源酶(例如野生型 酶)的氨基酸序列。在具体实施方案中,细菌宿主细胞可以包含或不包含失活的编码该必 需酶的内源基因,其中失活的基因可以处于与结构为A1-P-M-A2的基因座不同的基因座。在 某些情况下,虽然可以使用其他酶/抑制剂组合,但必需酶可以是谷氨酸消旋酶(例如SEQ ID NO :11),抑制剂可以是β-氯-D-丙氨酸或环丝氨酸。在一些实施方案中,扩增单位包 含SEQ ID NO 7中所示的序列。在其他实施方案中,本发明的细菌宿主细胞包含多个拷贝含有结构为A1-P-M-A2 的扩增单位的基因座,其中A1和A2是同向重复,P包含目的多肽的第一编码序列,M包含必 需酶的第二编码序列。在一些实施方案中,扩增单位包含SEQ ID NO :7中所示的多核苷酸 序列。在一些实施方案中,将第一编码序列有效连接至存在于同向重复A1中的启动子。在 具体实施方案中,细菌宿主细胞包含多个拷贝含有式(A1-P-M)n-A2K描述的扩增单位的基 因座,其中η为至少2,A1和A2是同向重复,P包含目的多肽的编码序列,M包含必需酶的编 码序列,其中M的编码序列有效连接至内源或非内源启动子。在一个实施方案中,M的编码 序列和启动子可以是宿主细胞内源的。在一些实施方案中,细菌宿主细胞包含多个拷贝含 有SEQ IDNO 7的扩增单位(例如至少2个拷贝)的基因座。扩增单位提供目的多肽(例如 枯草蛋白酶)和必需酶二者的表达。在一些实施方案中,所表达的目的多肽是SEQ ID NO 8中所示的枯草蛋白酶FNA,或SEQ ID NO 12中所示的其成熟形式,必需酶是SEQ ID NO 11中所示的丙氨酸消旋酶。在具体实施方案中,有效连接至P的编码序列的启动子可以是 相邻同向重复(A1)的部分。在另一个实施方案中,有效连接至P区编码序列的启动子存在 于P区中而不是相邻同向重复中。在另一个实施方案中,本发明包含细菌细胞培养物,其包含培养基和细菌宿主细 胞群体,该细菌宿主细胞包含结构为A1-P-M-A2的扩增单位的至少1个、至少2个或更多个 拷贝,其中A1和A2是同向重复,P包含用于目的蛋白质的第一编码序列,M包含用于必需酶 的第二编码序列。如上文所述,扩增单位提供目的多肽(例如枯草蛋白酶)和必需酶二者 的表达。在一些实施方案中,所表达的目的多肽是SEQ ID N0:8中所示的枯草蛋白酶FNA, 或SEQ ID NO :12中所示的其成熟形式,必需酶是SEQ ID NO :11中所示的丙氨酸消旋酶。 还在另一个实施方案中,可以在蛋白质产生方法中使用细菌细胞培养物,该方法包括在适 合产生由编码序列编码的目的多肽的条件下维持受试细胞的培养物。在具体实施方案中, 此方法还可以包括从培养基中回收目的多肽。附图简述

图1图示说明本文所述实施方案的一些特征。图 2 显示 pBSFNAalr 质粒(SEQ ID NO 2)的图谱。图3显示qPCR校准曲线。
4
图4是显示来自多种宿主菌株的枯草蛋白酶FNA表达水平的图表。定义除非本文另作定义,本文使用的所有技术和科学术语具有与本申请所属领域的普 通技术人员的通常理解相同的意义。虽然可将类似或等同于本文所述方法和材料的任意方 法和材料用于实施或测试本发明,但描述了优选的方法和材料。本文提到的所有专利和出版物,包含在这类专利和出版物中公开的所有序列在此 明确引入作为参考。数值范围包含定义该范围的数值。除非另行说明,核酸按5'至3'的方向从左向 右书写;氨基酸序列按氨基至羧基的方向从左向右书写。本文给出的标题不是对本发明的多个方面或实施方案的限制。因此,以下术语通 过参考说明书整体而得到更充分的定义。除非另作定义,本文使用的所有技术和科学术语具有与本申请所属领域的普 通技术人员的通常理解相同的意义。Singleton等,DICTI0NARY0F MICROBIOLOGY AND MOLECULAR BIOLOGY,第二版,JohnWiley 和 Sons,New York(1994)禾Π Hale & Markham,THE HARPERCOLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N. Y. (1991)为技术人员提供 了本文所用的许多术语的一般意义。但是,为了清楚和便于参考的缘故,下文定义了某些术 语。术语“重组体”指并非天然存在于宿主细胞中的多核苷酸或多肽。重组分子可以 包含以非天然存在的方式连接在一起的两条或更多条天然存在的序列。重组细胞包含重组 多核苷酸或重组多肽。术语“异源的”指正常情况下不彼此结合的元件。例如,若宿主细胞产生异源蛋白 质,则正常情况下该蛋白质不在该宿主细胞中产生。同样,有效连接至异源编码序列的启动 子是这样的启动子,其有效连接至编码序列,而在野生型宿主细胞中通常不有效连接至该 编码序列。关于多核苷酸或蛋白质,术语“同源的”指天然存在于宿主细胞中的多核苷酸或 蛋白质。术语“蛋白质”和“多肽”在本文中可互换使用。“信号序列”是存在于蛋白质N端部分的氨基酸序列,其促进成熟形式的蛋白质从 细胞分泌。信号序列的定义是功能性定义。胞外蛋白质的成熟形式无信号序列,其在分泌 过程中被切除。术语“核酸”包含单链或双链的DNA、RNA及其化学修饰物。术语“核酸”和“多核 苷酸”在本文中可互换使用。“载体”指设计用于将核酸引入一个或多个宿主细胞的多核苷酸。在某些实施方案 中,载体可在不同宿主细胞中自主复制,其包含克隆载体、表达载体、穿梭载体、质粒、噬菌 体粒子、盒等。在其他实施方案中,载体可以整合入宿主细胞基因组。“启动子”是起始下游核酸转录的调节序列。术语“有效连接”指使元件在功能上相关的元件排列。例如,若启动子控制编码序 列的转录,则启动子有效连接至该序列。术语“选择标记”指能够在宿主中表达的蛋白质,其便于包含引入的核酸或载体的 那些宿主的筛选。选择标记的实例包含但不限于抗微生物剂(例如潮霉素、博来霉素或氯
5霉素)和/或赋予宿主细胞代谢优势(如营养优势)的基因。本文所用的术语“回收的”、“分离的”和“分开的”指从至少一种其天然结合的成
分移出的蛋白质、细胞、核酸或氨基酸。如本文所用,提到细胞时使用的术语“转化的”、“稳定转化的”和“转基因的”指该 细胞具有整合入其基因组或作为附加型质粒保持多代的非天然(例如异源的)核酸序列。本文所用的术语“表达”指通过其来根据基因的核酸序列产生多肽的过程。该过 程包含转录和翻译二者。在将核酸序列插入细胞的背景中,术语“引入的”指“转染”、“转化”或“转导”,且包 含对核酸序列整合入真核或原核细胞的指代,其中该核酸序列可以整合入细胞基因组(例 如染色体、质粒、质体或线粒体DNA)、转变为自主复制子或瞬时表达(例如转染的mRNA)。术语“杂交”指核酸链通过本领域已知的碱基配对与其互补链连接的过程。若核 酸与参考序列核酸在中度到高度严格的杂交和漂洗条件下特异性地彼此杂交,则认为这两 条序列“可选择性杂交”。中度和高度严格的杂交条件是已知的(见例如Ausubel等,Short Protocols in Molecular Biology,第三版,Wiley & Sons 1995禾口Sambrook等,Molecular Cloning =ALaboratory Manual,第三版,2001冷泉港,纽约)。高度严格的条件的一个实例 包含在约42°C下在50%甲酰胺、5X SSC、5X Denhardt,s溶液、0. 5% SDS和100ug/ml变性 载体DNA中杂交,然后在室温下在2X SSC和0.5% SDS中漂洗两次,在42 °C下在0. IX SSC 和0. 5% SDS中漂洗另外两次。“编码序列”是编码多肽的DNA片段。如本文所用,“表达盒”指DNA构建体,其包含有效连接至适合的控制序列的蛋白质 编码区,该控制序列能够影响蛋白质在适合的宿主细胞中的表达。此类控制序列可以包含 引起转录的启动子、控制转录以产生mRNA的可选的操纵基因序列、编码适合的mRNA上的核 糖体结合位点的序列、增强子,和控制转录和翻译终止的其他序列。“宿主细胞的天然”多肽或多核苷酸具有与未被改变的宿主细胞中存在的多肽或 多核苷酸相同的氨基酸或核苷酸序列。在某些情况下,细胞可包含重组核酸,该重组核酸包 含该细胞的天然多核苷酸(例如编码序列)。在这些情况下,细胞在不同的基因座包含重组 核酸,该重组核酸包含具有也存在于未被改变的宿主细胞版本(即不包含任意基因敲除的 宿主细胞)中的核苷酸序列的多核苷酸。在某些情况下,细胞可包含编码细胞的天然多肽 的重组核酸。在这些情况下,细胞包含编码多肽的核酸,该多肽具有与见于未被改变的宿主 细胞版本(即不包含任意基因敲除的宿主细胞)中的多肽相同的氨基酸序列。术语“内源 的”与术语“天然的”是同义词。关于有效连接至其天然启动子的编码序列,“天然启动子”指野生型宿主细胞的启 动子,其在该细胞中有效连接至该编码序列。术语“同向重复”指在细胞中以相同取向存在并可以进行同源重组的至少两个序 列元件。同向重复具有超过至少50个核苷酸(例如至少100、至少200或至少500或更多 个核苷酸)的相同或几乎相同的核苷酸序列(例如至少98%或99%序列同一性)。术语“抑制剂”指通过竞争性抑制或非竞争性抑制(例如变构抑制)可逆地抑制 酶的化合物。术语“必需酶”是细胞生长必需的酶。
6
若细胞中内源必需酶的基因是野生型(即未失活),则术语“提供必需酶的显著表 达的表达盒”指提供超过内源必需酶水平50% (例如至少70%、至少90%或至少100%,高 达1000% )的必需酶表达水平的表达盒。术语“丙氨酸消旋酶”指催化L-丙氨酸和D-丙氨酸互变的酶。丙氨酸消旋酶具 有如EC 5. 1. 1. 1所述的活性(根据IUBMB酶命名法)。编码丙氨酸消旋酶的基因可以表示 为 “alr”、“alrA” 或 “dal” 基因。术语的其他定义可以在整篇说明书中出现。示例性实施方案的详述如上文所述,提供扩增基因座的方法。在图1中说明本方法的几个一般特征。参 照图1,在该方法中使用的细菌宿主细胞可以包含含有结构为A1-P-M-A2的扩增单位的基因 座,其中A1和A2是同向重复,P包含目的多肽的编码序列,M包含细胞必需的酶的编码序列。 式A1-P-M-A2旨在包含含有以相对于P和M的任一方向定位的同向重复的基因座。扩增单位提供目的多肽和必需酶在细胞中的表达。在某些情况下,P区和M区可 以分别独立地包含目的多肽和必需酶的表达盒(即有效连接至启动子的编码序列)。在一 些实施方案中,扩增单位包含用于表达目的多肽的第一表达盒和用于表达必需酶的第二表 达盒。在其他实施方案中,可以将P区的编码序列有效连接至存在于相邻同向重复中的启 动子。在此实施方案中和如将在下文中更详细地讨论,同向重复和必需酶编码序列的组合 核苷酸序列可以是细胞内源的,即其见于宿主细胞的基因组。在具体实施方案中,有效连接 至M区编码序列的启动子可以是该编码序列内源的或非内源的。在具体实施方案中,可以 由有效连接至P的编码序列的启动子驱动M区的编码序列。如显而易见,P和M在本文所述任意核酸中的方向可以是相反方向(即 A1-M-P-A2)。在此相反方向中和在一些实施方案中,可以将M区的编码序列有效连接至同向 重复A1中的启动子。备选地,可以将M区的编码序列有效连接至存在于M区中的启动子。将这类细胞的群体与必需酶的抑制剂接触,选择对抑制剂具有抗性的细胞(即 可以在抑制剂存在的情况下生长和分裂形成菌落的细胞)。如图1中所示,选择的细胞 具有多个拷贝包含扩增单位的基因座,该基因座可以通过式(A1-P-M)n-A2描述,其中A1和 A2是同向重复,η是至少2。η可以是例如2、3、4、5、6、7、8、9、10或至少10,例如在10-50 或50-100的范围内或更多。相对于未选择的细胞,选择的细胞在必需酶的编码序列(例 如在抑制剂的结合位点)中或在连接至该编码序列的启动子中无突变。然而,选择的细 胞在扩增单位的拷贝数上有增加,这允许细胞在抑制剂存在的情况下生长。在某些情况 下,可以对细胞群体进行几轮选择,每一轮选择使用浓度依次提高的抑制剂(例如抑制剂 浓度依次加倍)。在一些实施方案中,A1-P-M-A2扩增单位包含SEQ ID NO :7中所示的多 核昔酸序歹丨J :tccattttcttctRctatcaaaataacaRactcRtRattttccaaacRaRctttcaaaaaaRcc tctRccccttRcaaatcRRatRcctRtctataaaattcccRatattRRttaaacaRCRRCRcaatRRCRRCCRca tctRatRtctttRcttRRCRaatRttcatcttatttcttcctccctctcaataattttttcattctatccctttt CtRtaaaRtttatttttcaRaatacttttatcatcatRctttRaaaaaatatcacRataatatccattRttctca CRRaaRcacacRcaRRtcatttRaacRaattttttcRacaRRaatttRccRRRactcaRRaRcatttaacctaaa aaaRcatRacatttcaRcataatRaacatttactcatRtctattttcRttcttttctRtatRaaaataRttattt CRaRtctctacRRaaataRcRaRaRRtRatatacctaaataRaRataaaatcatctcaaaaaaatR GGTCTA
7ctaaaatattattcca TTTATT acaataaattcacaRaataRtcttttaaRtaaRtctactctRaattttttt aaaaggagagggtaaaga gtgaga^caaaaaat^tggatcagttt
gctgtttgctttagcgttaatctttacgatggcgttcggcagcacatcctctgcccaggcggcagggaaatcaaacggggaa
aagaaatatattgtcgggtttaaacagacaatgagcacgatgagcgccgctaagaagaaagatgtcatttctgaaaaagg
cgggaaagtgcaaaagcaattcaaatatgtagacgcagcttcagctacattaaacgaaaaagctgtaaaagaattgaaa
aaagacccgagcgtcgcttacgttgaagaagatcacgtagcacatgcgtacgcgcagtccgtgccttacggcgtatcacaa
attaaagcccctgctctgcactctcaaggctacactggatcaaatgttaaagtagcggttatcgacagcggtatcgattcttc
tcatcctgatttaaaggtagcaggcggagccagcatggttccttctgaaacaaatcctttccaagacaacaactctcacgga
actcacgttgccggcacagttgcggctcttaataactcaatcggtgtattaggcgttgcgccaagcgcatcactttacgctgt
aaaagttctcggtgctgacggttccggccaatacagctggatcattaacggaatcgagtgggcgatcgcaaacaatatgga
cgttattaacatgagcctcggcggaccttctggttctgctgctttaaaagcggcagttgataaagccgttgcatccggcgtcg
tagtcgttgcggcagccggtaacgaaggcacttccggcagctcaagcacagtgggctaccctggtaaatacccttctgtcat
tgcagtaggcgctgttgacagcagcaaccaaagagcatctttctcaagcgtaggacctgagcttgatgtcatggcacctgg
cgtatctatccaaagcacgcttcctggaaacaaatacggcgcgttgaacggtacatcaatggcatctccgcacgttgccgg
agcggctgctttgattctttctaagcacccgaactggacaaacactcaagtccgcagcagtttagaaaacaccactacaaa
acttggtgattctttctactatggaaaagggctgatcaacgtacaggcggcagctcag
taaaacataaaaaaccggccttggccccgccggttttttattatttttcttcctccgca
tgttcaatccgctccataatcgacggatggctccctctgaaaattttaacga
gaaacggcgggttgacccggctcagtcccgtaacggccaagtcctgaaacgt
ctcaatcgccgcttcccggtttccggtcagctcaatgccgtaacggtcggcggc
gttttcctgataccgggagacttttcgttagacatcg
tttccctttagcctttaattttagtatgatatgtaaatgatattgaata
aaagctaggaagtgtcgta atgagcacaaaacctttttacagagatacgtgggcggaaattgacttgtccgcga
8ggaaaatgtcagcaatatgaaaaaacatatcggtgaacatgtccacttgatggcagttgtgaaagcaaacgcctacgggcat ggtgatgcagaaacagcaaaggctgctcttgacgcaggtgcttcatgcttggccgtggccattttggatgaagcgatttcactgc
gcaaaaagggattgaaggcgcctatattggtgcttggcgcggttcccccggagtatgtggcaatcgctgctgagtatgacgtga
ccttaacaggttaitctgttgaatggcttcaggaggcagcccgccacacgaaaaaaggttctcttcattttcatctgaaggtcgat
acggggatgaacagacttggtgtaaaaacagaggaagaagttcagaacgtgatggcaattcttgaccgcaaccctcgtttaa
agtgcaaaggggtatttacccattttgcgacagcggatgaaaaagaaagaggctatttcttaatgcagtttgagcgctttaaaga
gctgattgctccgctgccgttaaagaatctaatggtccactgcgcgaacagcgccgctggactccggctgaaaaaaggcittttt
aatgcagtcagattcggcatcggcatgtatggccttcgcccgtctgctgacatgtcggacgagataccgtttcagctgcgtccgg
catttaccctgcattcgacactgtcacatgtcaaactgatcagaaaaggcgagagcgtcagctacggagccgagtacacagc
ggaaaaagacacatggatcgggacggtgcctgtaggctatgcggacggctggctccgaaaattgaaagggaccgacatcct
Wgaagggaaaacgcctgaaaattgccggccgaatttgcatggaccaatttatggtggagctggatcaggaatatccgccgg
gcacaaaagtcacatiaataggccggcagggggatgaatatatttccatggatgagattgcaggaaggctcgaaaccatiaa
ctatgaggtggcctgiacaataagttcccgigttccccgtatgtttttggaaaatgggagtatacUggaagtaagaaaicctttatt
gcaggtaaatataagcaattaa cctaatgactggc ttttataatatgagataatgccgactgtactttttacagtc
ggttttctaatgtcactaacctgccccgttagttgaagaaggtttttatattacagctccagatccatatccttctt
tttctgaaccgacttctcctttttcgcttctttattccaattgctttattgacgttgagcctcggaacccttaacaa
tcccaaaacttgtcgaatggtcggcttaatagctcacgctatgccgacattcgtctgcaagtttagttaagggttct
tctcaacgcacaataaattttctcggcataaatgcgtggtctaatttttatttttaataaccttgatagcaaaaaat
gccattccaatacaaaaccacatacctataatcgacctgcaggaattaattcctccattttcttctgctatcaaaat
aacagactcgtgattttccaaacgagctttcaaaaaagcctctgccccttgcaaatcggatgcctgtctataaaatt
cccgatattggcttaaacagcggcgcaatggcggccgcatctgatgtctttgcttggcgaatgttcatcttatttct
tcctccctctcaataattttttcattctatcccttttctgtaaagtttatttttcagaatacttttatcatcatgct
ttgaaaaaatatcacgataatatccattgttctcacggaagcacacgcaggtcatttgaacgaattttttcgacagg
aatttgccgggactcaggagcatttaacctaaaaaagcatgacatttcagcataatgaacatttactcatgtctatt
ttcgttcttttctgtatgaaaatagttatttcgagtctctacggaaatagcgagagatgatatacctaaatagagat
aaaatcatctcaaaaaaatg GGTCTA ctaaaatattattcca TTTATT acaataaattcacagaatagt
cttttaagtaagtctactctgaattttttta(SEQ ID NO :7)其中重复单位~和4以下划线显示,编码目的蛋白质(即枯草蛋白酶FNA)的多 核苷酸序列以黑体字母表示,编码必需酶(例如丙氨酸消旋酶)的多核苷酸序列以斜体显 示。启动子序列以黑体大写字母显示。由于通过该方法产生的宿主细胞包含第一表达盒的更多个拷贝,细胞可以产生比 具有单拷贝A1-P-M-A2扩增单位的宿主细胞更多的由第一表达盒编码的目的多肽。在具体 实施方案中,与具有单拷贝A1-P-M-A2扩增单位的其他相同宿主细胞相比,获得的宿主细胞 可以产生多至少20 %、至少40 %、至少60 %、至少80 %、至少100 %、至少2倍、至少3倍、至 少4倍、至少5倍或至少10倍、高达约100倍的蛋白质。在本方法中使用的抑制剂的浓度可以随所用必需酶和抑制剂潜能而变化。在具体 实施方案中,虽然考虑这些范围外的浓度,但抑制剂可以处于1 μ M-IOOmM范围内的浓度,例如在5μΜ-10πιΜ、20μΜ-1πιΜ的范围内。可以将抑制剂加入液体培养物,或抑制剂可以存 在于细菌生长于其上的固体培养基(例如琼脂培养基)中。如上文所指出,可以对细胞群 体进行几轮选择,每一轮选择使用浓度依次提高的抑制剂(例如抑制剂浓度依次加倍)。在具体实施方案中,扩增单位不包含抗生素抗性标记,且可以在无抗生素的培养 基中进行细胞选择。下文更详细地描述了第一和第二表达盒及宿主细胞。表送盒如上文所指出,扩增单位提供目的多肽和必需酶的表达。因此,扩增单位一般包含 至少两个表达盒用于目的多肽表达的第一表达盒和用于必需酶基因表达的第二表达盒。 每个表达盒包含处于有效连接中的启动子、编码序列和终止子。在某些情况下,扩增单位的 P区可以包含第一表达盒,扩增单位的M区可以包含第二表达盒。在其他情况下和如上文所 指出,邻近P区的同向重复可以包含有效连接至P区编码序列的启动子。在某些情况下,P 区和邻近P区的正向重复的连续的核苷酸序列可以是宿主细胞内源的(即存在于宿主细胞 基因组中)。在具体实施方案中,可以将M区的编码序列有效连接至P区的启动子。本文讨论的每一表达盒可以包含处于有效连接中的以下元件启动子、编码序列 和终止子序列,其中该表达盒足以在宿主细胞中产生蛋白质。如下文将更详细地讨论,第一 表达盒的编码序列可以编码重组蛋白质,例如治疗性蛋白质或所谓的“工业酶”。在具体实 施方案中,该编码序列可以编码具有提供蛋白质从细胞分泌的信号序列的蛋白质。如上文 所指出和如将在下文中更详细地讨论,第二表达盒提供必需酶的表达。若使用启动子、终止子和信号序列,则它们的选择主要取决于所使用的宿主细胞。 宿主细胞包含芽孢杆菌属物种宿主细胞、链霉菌属物种宿主细胞、大肠杆菌(E. coli)和 其他细菌宿主细胞。如上文所指出,在示例性实施方案中,可以使用链霉菌属宿主细胞, 在这种情况下,若使用信号序列,则其可以是celA信号序列。在某些情况下,celA信号序 列可以是如Klu印fel等(Nature Biotechnol. 199614 756-759)所述的由变铅青链霉菌 (S. Iividans)纤维素酶A基因CelA编码的信号序列。在使用芽孢杆菌属宿主细胞的其他示 例性实施方案中,信号序列可以是能够指导融合蛋白质进入芽孢杆菌属宿主细胞的分泌途 径的任意氨基酸序列。在某些情况下,可以使用的信号序列包含从野生型芽孢杆菌属细胞 分泌的蛋白质的信号序列。这类信号序列包含由α-淀粉酶、蛋白酶(例如aprE或枯草蛋 白酶E)或β -内酰胺酶基因编码的信号序列。示例性信号序列包含但不限于由α -淀粉酶 基因、枯草蛋白酶基因、β-内酰胺酶基因、中性蛋白酶基因(例如nprT、nprS、nprM)或来自 任意适合的芽孢杆菌属物种(包含但不限于嗜热脂肪芽孢杆菌(B. stearothermophiIus), 地衣芽孢杆菌(B. Iicheniformis)、克劳氏芽孢杆菌(B. clausii)、枯草芽孢杆菌 (B. subtilis)和解淀粉芽孢杆菌(B.amyloliquefaciens))的prsA基因编码的信号序 列。在一个实施方案中,信号序列由枯草芽孢杆菌的aprE基因编码(如Appl. Microbiol. Biotechnol. 200362 :369_73 中所述)。Simonen 禾口 Palva (MicrobiologicalReviews 1993 57 109-137)和其他参考文献描述了其他信号肽。适合用于芽孢杆菌属和链霉菌属宿主细胞中的启动子和终止子是已知的,包含 apr(碱性蛋白酶)、npr(中性蛋白酶)、amy ( α -淀粉酶)和β-内酰胺酶基因以及枯 草芽孢杆菌果聚糖蔗糖酶(levansucrase)基因(sacB)、地衣芽孢杆菌α-淀粉酶基因
10(amyL)、嗜热脂肪芽孢杆菌麦芽淀粉酶(maltogenic amylase)基因(amyM)、解淀粉芽孢 杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和 xylB基因的启动子和终止子;WO 93/10249、WO 98/07846和W099/43835中所述的启动子 和终止子。可以用描述于例如 Hopwood 等(Genetic Manipulation of Streptomyces :A Laboratory Manual ;冷泉港实验室,1985) ;Hopwood 等(Regulation of Gene Expression inAntibiotic-producing Streptomyces.在 Booth, I.禾口 Higgins, C.(编辑)Symposium of the Society for General Microbiology, Regulation of GeneExpression,剑桥大学 出版社,1986,251-276 页中);Fornwald 等(Proc. Natl. Acad. Sci. 198784 :2130_2134); Pulido 等(Gene. 198756 :277-82) ;Dehottay 等(Eur. J. Biochem. 1987166 :345_50); Taguchi(Gene. 198984 :279_86) ;Schmitt-John 等(Appl. Microbiol. Biotechnol. 199236 493-8) ;Motamedi (Gene 1995160 :25_31)和Binnie(Protein Expr. Purif. 199711 :271_8) 中的启动子和终止子构建用于链霉菌属宿主细胞中的表达盒。在一个实施方案中,可以使 用描述于WO 06/054997中的A4启动子,WO 06/054997在此引用作为参考。在某些实施方案中,可以针对目的多肽在所用宿主细胞中的表达,对任一编码序 列进行密码子优化。由于列出每一密码子在许多细胞中的使用的密码子选择表为本领域已 知(见例如Nakamura等,Nucl. Acids Res. 200028 292)或易于推导,给出待表达蛋白质的 氨基酸序列后可以容易地设计这类核酸。用于在链霉菌属和芽孢杆菌属宿主细胞中表达重组蛋白质的系统为本领域公知, 不需比上文所述更详细地对其进行讨论。第一表达盒第一表达盒可以包含启动子和编码目的蛋白质的多核苷酸(即编码序列),其中 启动子和多核苷酸有效连接,以使分离的核酸引起多核苷酸的转录和目的蛋白质的产生。所编码的目的蛋白质可以是所谓的“工业酶”、治疗性蛋白质、报道蛋白质、食品添 加剂或食品等。在一个实施方案中,目的蛋白质可以是例如酶,如糖酶,如液化和糖化α-淀粉 酶、碱性α-淀粉酶、β-淀粉酶、纤维素酶;葡聚糖酶、α-葡糖苷酶、α-半乳糖苷酶、葡 糖淀粉酶、半纤维素酶、戊聚糖酶、木聚糖酶、转化酶、乳糖酶、柚苷酶(naringanase)、果胶 酶或支链淀粉酶;蛋白酶,如酸性蛋白酶、碱性蛋白酶、菠萝蛋白酶、无花果蛋白酶、中性蛋 白酶、木瓜蛋白酶、胃蛋白酶、肽酶、粗制凝乳酶、凝乳酶(rermin)、凝乳酶(chymosin)、枯 草蛋白酶、嗜热菌蛋白酶、天冬氨酸蛋白酶或胰蛋白酶;脂肪酶或酯酶,如甘油三酯酶、磷脂 酶、pregastric esterase、磷酸酶、肌醇六磷酸酶、酰胺酶、亚胺酰基酶(iminoacylase)、谷 氨酰胺酶、溶菌酶或青霉素酰基酶;异构酶,如葡萄糖异构酶;氧化还原酶,例如氨基酸氧 化酶、过氧化氢酶、氯过氧化物酶、葡萄糖氧化酶、羟类固醇脱氢酶或过氧化物酶;裂合酶, 如乙酰乳酸脱羧酶、天冬氨酸β-脱羧酶、延胡索酸酶或组氨酸酶(histadase);转移酶,如 环糊精糖基转移酶;或连接酶。在具体实施方案中,蛋白质可以是例如氨肽酶、羧肽酶、几丁 质酶、角质酶、脱氧核糖核酸酶、α -半乳糖苷酶、β -半乳糖苷酶、β -葡糖苷酶、漆酶、甘露 糖苷酶、齿斑葡聚糖酶、果胶分解酶、多酚氧化酶、核糖核酸酶或转谷氨酰胺酶。在具体实施方案中,由第一表达盒编码的目的蛋白质是清洁剂添加剂蛋白质, 即a)从细胞分泌且b)将其加至衣物清洗剂的蛋白质(例如酶)。示例性清洁剂添加剂
11蛋白质包含蛋白酶,例如枯草蛋白酶、α-淀粉酶和脂肪酶。枯草蛋白酶(即胞外碱性 丝氨酸蛋白酶)尤其重要。枯草蛋白酶可以具有见于野生型基因组的氨基酸序列(即 枯草蛋白酶可以是天然存在的枯草蛋白酶),或可以是天然存在的枯草蛋白酶的变体, 从而可以包含与由野生型基因组编码的枯草蛋白酶至少80%、至少90%、至少95%或 至少98%—致的氨基酸序列。示例性枯草蛋白酶包含Alcanase (Novozymes)、 FNA (Genencor)、Savinase (NovOZymes)、Purafect (Genencor), KAP (Kao), Everlase (Novozymes)、Purafect OxP (Genencor)、FN4 (Genencor)、BLAP S (Henkel)、BLAP X (Henkel)、Esperase (Novozymes)、Kannase (Novozymes)和 Prosperase (Genencor)。在其他实施方案中,枯草蛋白酶可以是枯草蛋白酶168、枯草蛋 白酶BPN,、枯草蛋白酶0^1让吐8、枯草蛋白酶0¥、枯草蛋白酶147或枯草蛋白酶309 (见例 如 EP414279B、W089/06279 和 Stahl 等,J. Bacteriol. 1984159 :811_818)。在一些实施方 案中,由第一表达盒编码的枯草蛋白酶是FNA
VRSKKLWISLLFALALIFTMAFGSTSSAQAAGKSNGEKKYIVGFKQTMSTMSAAKKKDVI
SEKGGKVQKQFKYVDAASATLNEKAVKELKKDPSVAYVEEDHVAHAYAQSVFYG\SQ
IKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQDNNS
HGTHVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIA
NNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYP
GKYPSyiAVGAYDSSNQRASFSSVGPELDVMAPGVSIQSTLPGNKYGALNGTS
MASPHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLINVQAA
AQ(SEQIDNO: 8)。枯草蛋白酶的前原区(pre-pro region)以斜体显示,成熟区以
黑体字母显示(SEQ ID NO:12 )。编码FNA的多核苷酸实例是gtgagaagCaaaaaattgtg
gatcagtttgctgtttgctttagcgttaatctttacgatggcgttcggcagcacatcctctgcccaggcggcaggga
aatcaaacggggaaaagaaatatattgtcgggtttaaacagacaatgagcacgatgagcgccgctaagagaaagatg
tcatttctgaaaaaggcgggaaagtgcaaaagcaattcaaatatgtagacgcagcttcagctacattaaacgaaaaa
gctgtaaaagaattgaaaaaagacccgagcgtcgcttacgttgaagaagatcacgtagcacatgcgtacgcgcagtc
cgtgccttacggcgtatcacaaattaaagcccctgctctgcactctcaaggctacactggatcaaatgttaaagtag
cggttatcgacagcggtatcgattcttctctcctgatttaaaggtagcaggcggagccagcatggttccttctgaaa
caaatcctttccaagacaacaactctcacggaactcacgttgccggcacagttgcggctcttaataactcaatcggt
gtattaggcgttgcgccaagcgcatcactttacgctgtaaaagttctcggtgctgacggttccggccaatacagctg
gatcattaacggaatcgagtgggcgatcgcaaacaatatggacgttattaacatgagcctcggcggaccttctggtt
ctgctgctttaaaagcggcagttgataaagccgttgcatccggcgtcgtagtcgttgcggcagccggtaacgaaggc
acttccggcagctcaagcacagtgggctaccctggtaaatacccttctgtcattgcagtaggcgctgttgacagcag
caaccaaagagcatctttctcaagcgtaggacctgagcttgatgtcatggcacctggcgtatctatccaaagcacgc
ttcctggaaacaaatacggcgcgttgaacggtacatcaatggcatctccgcacgttgccggagcggctgctttgatt
ctttctaagcacccgaactggacaaacactcaagtccgcagcagtttagaaaacaccactacaaaacttggtgattc
tttctactatggaaaagggctgatcaacgtacaggcggcagctcagtaa(SEQ ID NO 9). 本文可以使用的示例性枯草蛋白酶和其他蛋白酶包含描述于W099/20770、WO99/20726、WO 99/20769、WO 89/06279、RE 34,606、美国专利号 4,914,031、美国专利号 4,980,288、美国专利号5,208,158、美国专利号5,310,675、美国专利号5,336,611、美国专 利号5,399,283、美国专利号5,441,882、美国专利号5,482,849、美国专利号5,631,217、 美国专利号5,665,587、美国专利号5,700, 676、美国专利号5,741,694、美国专利号 5,858,757、美国专利号5,880,080、美国专利号6,197,567和美国专利号6,218,165中的 枯草蛋白酶和其他蛋白酶。枯草蛋白酶一般详细地综述在Siezen(Protein Sci. 1997 6 501-523)中,清洁剂添加剂枯草蛋白酶综述于Bryan(Biochim. Biophys. Acta 2000 1543 203-222) ;Maurer(CurrentOpinion in Biotechnology 2004 15:330—334)禾口 Gupta(Appl MicrobiolBiotechnol. 2002 59:15-32)中。某些目的枯草蛋白酶具有如 EC 3.4.4. 16(根 据IUBMB酶命名法)所述的活性。在其他实施方案中,目的蛋白质可以是治疗性蛋白质(即具有治疗性生物学活性 的蛋白质)。适合的治疗性蛋白质的实例包含促红细胞生成素、细胞因子,如干扰素- α、 干扰素_ β、干扰素_ Y、干扰素-ο和粒细胞CSF、GM-CSF ;凝血因子,如VIII因子、IX因子 和人蛋白C、抗凝血酶III、凝血酶、可溶性IgE受体α -链、IgG、IgG片段、IgG融合蛋白质、 IgM、IgA、白细胞介素、尿激酶、糜蛋白酶和尿素胰蛋白酶抑制剂、IGF结合蛋白质、表皮生长 因子、生长激素释放因子、膜联蛋白V融合蛋白质、制管张素、血管内皮生长因子_2、骨髓祖 细胞抑制因子-1、护骨蛋白、α-1-抗胰蛋白酶、甲胎蛋白、DNA酶II、三环人纤维蛋白溶酶 原(kringle 3 ofhuman plasminogen)、葡糖脑苷脂酶、TNF结合蛋白质1、促卵泡激素、细 胞毒性T淋巴细胞相关抗原4-Ig、跨膜激活剂和钙调节剂和亲环蛋白配体、可溶性TNF受 体Fc融合蛋白质、胰高血糖素样蛋白质1和IL-2受体激动剂。抗体蛋白质(例如可以人 源化的单克隆抗体)尤其重要。在另一个实施方案中,目的蛋白质可以是报道蛋白质。这类报道蛋白质可以是 例如光学可检测的或生色的。在这个实施方案中,蛋白质可以是半乳糖苷酶(IacZ)、 β-葡萄糖醛酸酶(GUS)、荧光素酶、碱性磷酸酶、胭脂碱合酶(NOS)、氯霉素乙酰转移酶 (CAT)、辣根过氧化物酶(HRP)或荧光蛋白质,例如绿色荧光蛋白(GFP)或其衍生物。如上文所指出,编码序列可以编码融合蛋白质。在这些实施方案的一些中,融合蛋 白质可以提供目的蛋白质从其在其中表达的宿主细胞的分泌,因此,融合蛋白质可以包含 有效连接至目的蛋白质N端的信号序列,其中信号序列包含将蛋白质导向宿主细胞分泌途 径的氨基酸序列,其导致蛋白质从宿主细胞分泌进入宿主细胞在其中生长的培养基。目的 蛋白质分泌前从融合蛋白质切除信号序列。第二表达盒第二表达盒提供必需酶的表达,其中,如上文所指出,必需酶是细胞进行细胞生长 所需的。在具体实施方案中,必需酶可以是条件性必需的,由此其仅在某些条件下为细胞生 长所需(例如在缺乏使必需酶的任意丧失无效的外源化合物的情况下)。在某些情况下,通 过加入外源化合物(其在某些情况下可以是酶的产物或另一碳源),缺乏条件性必需酶活 性的细胞(其可以通过失活编码该酶的基因或通过将细胞与该酶的抑制剂接触来产生)可 以在培养物中生长。因此,在某些情况下,用于第二表达盒中的必需酶可以是当其从细胞中 缺失时使细胞成为特定化合物的营养缺陷型或不能利用一种或多种特定碳源的酶。这类必需酶/抑制剂组合的实例是已知的并包含例如涉及氨基酸合成的酶和它
13们各自的抑制剂;涉及特定碳源利用的酶和它们各自的抑制剂。下文给出了这类酶/抑制 剂组合的实例。编码涉及氨基酸合成的酶的基因的失活引起对该氨基酸的辅源营养。同样, 编码涉及特定碳源利用的酶的基因的失活引起对另一碳源的辅源营养。酶不切割抑制剂。 然而,抑制剂可逆和特异地竞争性或非竞争性抑制酶的催化活性。在一个实施方案中,酶可以是S-腺苷-甲硫氨酸合成酶(由metE编码;GenBank 检索号 U52812 ;见 Yocum 等,Cloning and characterization of themetE gene encoding
5-adenosylmethioninesynthetase from Bacillus subtilis. J. Bacteriol. 1996 178 4604),胃"SJMI^^F 畠 MSI (Chiang 等 Molecularcharacterization of Plasmodium falciparum S-adenosylmethioninesynthetase. Biochem J. 1999 344 571-6)以及甲 硫氨酸类似物、嘌呤类似物、8-氮鸟嘌呤和咪唑硫嘌呤(Berger等Characterisation of methionineadenosyltransferase from Mycobacterium smegmatis and Μ. tuberculosisBMC Microbiol. 2003 ;3 12)抑制。S-腺苷-甲硫氨酸合成酶基因的失活 引起甲硫氨酸辅源营养。在另一个实施方案中,酶可以是3-异丙基苹果酸脱氢酶,其催化3-羧基-2-羟 基-4-甲基戊酸向3-羧基-4-甲基-2-氧戊酸的转变。该酶由IeuB编码,IeuB缺陷的 菌株是亮氨酸营养缺陷型。3-异丙基苹果酸脱氢酶可以被例如0-isobutenyl oxalyl hydroxamate(Singh 等,The High-resolution Structureof LeuB (Rv2995c)from Mycobacterium tuberculosis, Journal ofMolecular Biology 2005 346 :1_11 页)抑制。在另一个实施方案中,酶可以是二氨基庚二酸脱羧酶,其催化内消旋_2,
6-diaminoheptanedioate向L-赖氨酸的转变,由IysA编码。IysA缺陷的菌株将是赖氨酸 营养缺陷型。二氨基庚二酸脱羧酶的抑制剂包含二氨基庚二酸的类似物,其包含但不限于 羊毛硫氨酸亚砜、羊毛硫氨酸砜的内消旋和LL异构体、羊毛硫氨酸、包含N-羟二氨庚二酸 4和N-氨基二氨庚二酸5的N修饰的类似物(见Kelland等J. Biol. Chem. 1986 Analogs ofdiaminopimelic acid as inhibitors of meso-diaminopimelate decarboxylasefrom Bacillus sphaericus and wheat germ 261 :13216-13223)。在另一个实施方案中,酶可以是谷氨酰-tRNA还原酶,其催化5-氨基乙酰丙酸的 合成,由hemA编码。hemA缺陷的菌株是5-氨基乙酰丙酸或氯化血红素的营养缺陷型。该酶 可以被戊二霉素抑制(Schauer 等 Escherichia coli Glutamyl-tRNA Reductase J. Biol. Chem. 2002 277 48657-48663)。在另一个实施方案中,酶可以是D-丙氨酸消旋酶,其催化L-丙氨酸和D-丙氨酸 的互变,由alr(也称为dal)编码。air缺陷的菌株是D-丙氨酸(其为细胞壁生物合成所 需)的营养缺陷型。D-丙氨酸消旋酶的抑制剂包含但不限于D-环丝氨酸、β-氯-D丙氨 酸和邻氨基甲酰-D-丝氨酸(见例如Manning等,Inhibition of Bacterial Growth by β -chloro-D-alaninePNAS 1974 71:417-421)。在一些实施方案中,第二表达盒包含多核 苷酸,例如atgagcacaaaacctttt tacagagata cgtgggcgga aattgacttg tccgcgataa aggaaaatgt cagcaatatg aaaaaacatatcggtgaaca tgtccacttg atggcagttg tgaaagcaaa cgcctacggg catggtgatg cagaaacagc aaaggctgct
14
cttgacgcag gtgcttcatg cttggccgtg gccattttgg atgaagcgat ttcactgcgc aaaaagggat tgaaggcgcctatattggtg cttggcgcgg ttcccccgga gtatgtggca atcgctgctg agtatgacgt gaccttaaca ggttattctgttgaatggct tcaggaggca gcccgccaca cgaaaaaagg ttctcttcat tttcatctga aggtcgatac ggggatgaacagacttggtg taaaaacaga ggaagaagtt cagaacgtga tggcaattct tgaccgcaac cctcgtttaa agtgcaaaggggtatttacc cattttgcga cagcggatga aaaagaaaga ggctatttct taatgcagtt tgagcgcttt aaagagctgattgetccget gccgttaaag aatctaatgg tccactgcgc gaacagcgcc gctggactcc ggctgaaaaa aggcttttttaatgcagtca gattcggcat cggcatgtat ggccttcgcc cgtctgctga catgtcggac gagataccgt ttcagctgcgtccggcattt accctgcatt cgacactgtc acatgtcaaa ctgatcagaa aaggcgagag cgtcagctac ggagccgagtacacagcgga aaaagacaca tggatcggga cggtgcctgt aggctatgcg gacggctggc tccgaaaattgaaagggacc gacatccttg tgaagggaaa acgcctgaaa attgccggcc gaatttgcat ggaccaattt atggtggagctggatcagga atatccgccg ggcacaaaag tcacattaat aggccggcag ggggatgaat atatttccat ggatgagattgcaggaaggc tcgaaaccat taactatgag gtggcctgta caataagttc ccgtgttccc cgtatgtttt tggaaaatgg
gagtataatg gaagtaagaa atcctttatt gcaggtaaat ataagcaatt aa (SEQ ID N0:10),其编码D-丙氨酸消旋酶MSTKPFYRDTWAEIDLSAIKENVSNMKKHIGEHVHLMAVVKANAYGHGDAETAKAALDAGASCLAVAILDEAISLRKKGLKAPILVLGAVPPEYVAIAAEYDVTLTGYSVEWLQEAARHTKKGSLHFHLKVDTGMNRLGVKTEEEVQNVMAILDRNPRLKCKGVFTHFATADEKERGYFLMQFERFKELIAPLPLKNLMVHCANSAAGLRLKKGFFNAVRFGIGMYGLRPSADMSDEIPFQLRPAFTLHSTLSHVKLIRKGESVSYGAEYTAEKDTWIGTVPVGYADGWLRKLKGTDILVKGKRLKIAGRICMDQFMVELDQEYPPGTKVTLIGRQ⑶EYISMDEIAGRLETINYEVACTISSRVPRMFLENGSIMEVRNPLLQVNISN (SEQ ID NO 11).可以对其使用抑制剂的其他必需酶包含例如木糖异构酶(xylA)、葡糖酸激酶 (EC 2. 7. 1. 12)、葡糖酸通透酶(gntK或gntP)、甘油激酶、甘油脱氢酶(例如glpP、glpF、 glpK或glpD)、阿拉伯糖异构酶(araA)。在具体实施方案中,第二表达盒提供必需酶的显著表达,由此若细胞中内源必需酶的基因是野生型的(即未失活),则必需酶以内源必需酶水平的超过50% (例如至少约 70%、至少约90%、高达至少约100% )的水平产生。在某些实施方案中,由M区编码的必需酶可以是天然存在的,由此其具有野生型 必需酶的氨基酸序列。在其他实施方案中,由M区编码的必需酶可以是天然存在的酶的变 体,例如其可以具有与天然存在的必需酶至少约80 %相同、至少约90 %相同、至少约95 % 相同、至少约98%相同或至少约99%相同的氨基酸序列。在具体实施方案中,必需酶可以具有天然存在的氨基酸序列,且在某些实施方案 中,其可以是宿主细胞内源的,由此其具有任意失活突变前的宿主细胞基因组编码的氨基 酸序列。在具体实施方案中,表达盒的核苷酸序列(即启动子、编码序列和终止子)可以属 于任意失活突变前的宿主细胞内源基因。这种基因可以位于与表达盒的基因座不同的基因座。虽然不是实施本方法所需的,但是可以通过突变失活必需酶的内源基因(即存在 于尚未包含A1-P-M-A2基因座的宿主细胞中的基因)。特异性失活细菌基因的方法(例如 通过缺失、置换或插入)为本领域公知。宿主细胞本文使用的细菌宿主细胞可以是革兰氏阳性菌或革兰氏阴性菌,并包含但不限 于芽孢杆菌属物种细菌,例如克劳氏芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌(Bacillus brevis)、环状芽抱杆菌(Bacillus circulans)、凝结芽抱杆菌(Bacillus coagulans)、 灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆 菌、巨大芽孢杆菌(Bacillusmegaterium)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金 芽孢杆菌(Bacillus thuringiensis)细菌;链霉菌属物种细菌,例如变铅青链霉菌、 (S. carbophilus)、淡蜡黄链霉菌(S. helvaticus)、锈赤链霉菌(S. rubiginosus)或鼠灰链 霉菌(S.murinus)细菌;假单胞菌属物种(Pseudomonas sp.)细菌和大肠杆菌。在具体情 况下,细菌宿主细胞可以是具有GRAS资格的(即FDA认定的公认为安全的)用来进行蛋白 质产生的历史的菌株。枯草芽孢杆菌宿主细胞包含但不限于描述于美国专利号5,264,366和 4, 760, 025 (RE 34, 606)中的枯草芽孢杆菌宿主细胞,以及 1A6 (ATCC39085)、168 (1A01)、 SB19、W23、Ts85、B637、PB1753 至 PB1758、PB3360、JH642、1A243 (ATCC 39,087)、ATCC 21332,ATCC 6051、MI113、DE100 (ATCC 39,094)、GX4931、PBT 110 禾口 PEP 211 菌株(见例如 Hoch 等,Genetics 197373 :215_228 ;美国专利号 4,450,235 ;美国专利号 4,302,544 ;和 EP 0134048)。例如Palva等和其他人也描述了枯草芽孢杆菌作为表达宿主的用途(见Palva 等,Gene 1982 19 :81_87 ;还见 Fahnestock 和 Fischer,J. Bacteriol. 1986 165 :796_804 ; 和 Wang 等,Genel988 69 :39_47)。在具体实施方案中,可以改造芽孢杆菌属宿主细胞以最大化蛋白质表达,因此, 芽孢杆菌属宿主细胞可以在以下基因的至少一个中包含失活改变degU、degS、degR和 degQo 见 Msadek 等(J. Bacteriol. 1990 172 :824_834)和 Olmos 等(Mol. Gen. Genet. 1997 253:562-567)。一个菌株属于枯草芽孢杆菌物种且携带degU32 (Hy)突变。在另一个实 施方案中,芽孢杆菌属宿主细胞可以在scoC4(见Caldwell等,J. Bacteriol. 2001 183
167329-7340)、spoIIE (见 Arigoni 等,Mol. Microbiol. 1999 31 1407-1415)、oppA 或 opp 操 纵子中的其他基因(见Perego等,Mol. Microbiol. 1991 5:173-185)中包含突变或缺失。可以通过将重组核酸插入细菌宿主细胞的基因组来产生用于本方法中的细菌细 胞。在具体实施方案中,可以使用类似于已建立的方法的方法,通过同源或非同源重组 来产生该细胞,该已建立的方法如Jung等(J. Gen. Appl. Microbiol. 1998 44 107-111); Tangney 等(FEMS Microbio. Lett. 1995125 107-114) ;Petit 等(EMBO J.1992 11: 1317-1326);美国专利5,733,753和已公开的美国专利申请20070134760中的方法。宿主细胞可以具有或不具有失活的编码必需酶的内源基因。蛋白质产生方法提供使用上述细胞的方法。在某些实施方案中,本方法包括培养细胞群体以产生 由第一表达盒编码的目的蛋白质。在某些实施方案中和如上文所讨论,目的蛋白质可以分 泌进入培养基。本方法的具体实施方案包含从培养基回收目的蛋白质的步骤。可以通过任意方便的方法从生长培养基回收目的蛋白质,例如通过沉淀、离心、亲 和力、过滤或本领域已知的任意其他方法。例如,可以使用亲和层析(Tilbeurgh等,(1984) FEBS Lett. 16 215);离子交换层析方法(Goyal 等,(1991)Biores. Technol. 36 37 ;Fliess 等,(1983)Eur. J. Appl. Microbiol. Biotechnol. 17 :314 ;Bhikhabhai 等,(1984) J. Appl. Biochem. 6 336 ;禾口 Ellouz 等,(1987)Chromatography 396 307),其包含使用具有高分 辨力的材料的离子交换(Medve等,(1998) J. Chromatography A808 153);疏水作用层析 (Tomaz 禾口Queiroz,(1999) J. Chromatography A865 123);两相分配(Brumbauer 等,(1999) Bioseparation 7 287);乙醇沉淀;反相HPLC ;二氧化硅或如DEAE的阳离子交换树脂上的 层析;层析聚焦;SDS-PAGE ;硫酸铵沉淀;和使用例如S印hadex G-75的凝胶过滤。在具体 实施方案中,清洁剂添加剂蛋白质可以在不从培养基的其他成分纯化的情况下使用。在某 些实施方案中,可以简单地浓缩培养基的成分,例如,然后在不进一步从生长培养基的其他 成分纯化蛋白质的情况下使用。在一些实施方案中,可以在分批或连续发酵条件下培养细胞。经典的分批发酵法 使用封闭系统,其中在发酵运行开始之前配制培养基,用所希望的一种或多种生物接种培 养基,并在随后未向培养基加入任意成分的条件下发生发酵。在某些情况下,可以在分批方 法的过程中改变生长培养基的PH和氧含量,而不改变碳源含量。分批系统的代谢产物和细 胞生物量不断变化直至发酵终止时。在分批系统中,细胞通常从静止的延迟期行进至高生 长对数期,并最终行进至其中生长速率降低或停止的稳定期,若不处理,稳定期中的细胞最 终死亡。概括地说,对数期中的细胞产生最多的蛋白质。“补料分批发酵”系统是标准分批系统的变异。在此系统中,只有当其在培养物中 的浓度降至阈值以下时,才加入营养物(例如碳源、氮源、盐类、O2或其他营养物)。补料分 批系统在分解代谢物阻抑有抑制细胞代谢的倾向时和希望培养基中具有有限量的营养物 时有用。根据可测量因素(如PH、溶解氧和废气(如CO2)的分压)的变化来估计补料分批 系统中实际营养物浓度的测量值。分批发酵和补料分批发酵是本领域常见和已知的。连续发酵是开放系统,其中不断地往生物反应器加入确定的培养基,同时移出等 量的条件培养基用于加工。连续发酵一般将培养物维持于恒定的高密度,其中细胞主要处 于对数期生长中。
17
连续发酵允许影响细胞生长和/或终产物浓度的一个因素或任意数目的因素的 调节。例如,在一个实施方案中,将如碳源或氮源的限制性营养物维持于固定比例,允许调 节所有其他参数。在其他系统中,可以不断改变影响生长的许多因素,同时保持通过培养基 浊度测量的细胞浓度恒定。连续系统力图维持稳态生长条件。因此,可以针对发酵中的细 胞生长速率来平衡培养基排出引起的细胞损失。已知调节连续发酵法的营养物和生长因素 的方法,以及用于最大化产物形成速率的技术。实验提供以下实施例的目的在于举例和进一步说明本发明的某些优选实施方案和方 面,不解释为限制其范围。材料和方法用来操作DNA的实验技术是分子生物学领域内的标准技术(Sambrook等 Molecular cloning :A Laboratory Manual)。用 Qiagen 试齐[J盒(Qiagen Inc.)制备质粒 和纯化插入片段。限制性内切酶和其他酶购自Roche Applied Science (Indianapolis, IN),并按厂商所推荐使用。按 Ferrari Ε.和 B. Miller 所述(Bacillus expression a Gram-Positive Model. InGene Expression Systems :Using Nature for the Art of Expression. 1999. Academic Press, N. Y.)制备感受态枯草芽孢杆菌细胞。按照厂商的说明用Herculase酶(Stratagene)进行PCR反应。反应包含 200nM的每种引物、1单位的Herculase和200μΜ的每种dNTP。按以下循环使用来自 Hybaid(Thermo)的 PxE Thermal Cycler :94°C变性 3 分钟,然后 30 个循环的 94°C变性 30 秒、55°C退火30秒和72°C延伸1分钟/Ikbp待扩增序列。然后在来自Invitrogen的0. 8% 琼脂糖e-gel上分析PCR反应。用Eppendorf Phase Lock Gel 管(Eppendorf)及其实验流程制备基因组 DNA。D-丙氨酸、D-环丝氨酸和β -氯-D-丙氨酸获自Sigma。枯草蛋白酶的测定枯草蛋白酶的测定如之前所述(Estell,D.V.,Graycar, T. P.,Wells, J. Α. (1985) J. Biol. Chem. 260,6518-6521)在含 1. 6mM N-琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基 苯胺(P-nitroanilide) (VegaBiochemicals)的 0. IM Tris 缓冲液,pH 8. 6 中进行。该测 定测量对硝基苯胺释放引起的在410nm处的吸光度的增加。在初始速度条件下进行测定。 蛋白酶单位定义为25°C下在光程为Icm的比色杯中,使上述标准溶液在410nm处的吸光度 每分钟增加1吸光度单位(AU)的蛋白酶的量。细菌菌株大肠杆菌(Escherichia coli)MM294 :endA thiA hsdR17 supE44。枯草芽孢杆菌菌株BG2190(alr-)and BG2189 (alr-CmR)由 Ferrari 和 Yang (1985) (Isolation of an alanine racemase gene from Bacillus subtilisand its use for plasmid maintenance in B. subtil is. Biotechnology, 3,1003-1007 [1985])描述。枯草芽孢杆菌菌株 BG3594 :nprE aprE spoIIE degU32 oppA。枯草芽孢杆菌菌株BG3594comK 这是如WO 02/14490中所述的包含 xylR-PxylA-comK构建体的枯草芽孢杆菌BG3594,该构建体使此菌株可被制备为超级感受 态(即细胞群体的超过是可以用染色体芽孢杆菌属DNA转化的)。
枯草芽孢杆菌菌株CP3490 此菌株是其中air被敲减(与BG2190中相同的突变) 的枯草芽孢杆菌菌株BG3594comK。枯草芽孢杆菌菌株CP35491 此菌株是其中air被敲除(与BG2190中相同的突变) 的枯草芽孢杆菌菌株BG3594。枯草芽孢杆菌菌株MDT01-138 此菌株是具有以下结构的可扩增盒的枯草芽孢杆 菌菌株BG3594 :aprE 5,-枯草蛋白酶FNA-氯霉素-aprE 5,。已将其扩增至Cm25。枯草芽孢杆菌菌株CP4010 此菌株是具有以下结构的可扩增盒的枯草芽孢杆菌 菌株BG3594 comK:aprE 5’ -枯草蛋白酶FNA-alr-aprE 5’。已用β -氯-D-丙氨酸对其 进行了扩增。枯草芽孢杆菌菌株CP4020 此菌株是具有以下结构的可扩增盒的枯草芽孢杆菌 菌株BG3594 :aprE 5,-枯草蛋白酶FNA-alr-aprE 5,。已用β -氯-D-丙氨酸对其进行了 扩增。枯草芽孢杆菌菌株Hyperl 具有编码枯草蛋白酶FNA且包含氯霉素标记的扩增
品.οCP3591 此菌株是在ορρΑ基因座中在aprE启动子之后具有1拷贝枯草蛋白酶 FNA(即总计1拷贝枯草蛋白酶)的BG3594。CP3592 此菌株是在ybdL和ybdM基因之间在aprE启动子之后具有额外的1拷贝 枯草蛋白酶FNA (即总计2拷贝枯草蛋白酶)的CP3591。CP3593 此菌株是在pps基因座中在aprE启动子之后具有额外的1拷贝枯草蛋白 酶FNA(即总计3拷贝枯草蛋白酶)的CP3592。CP3594 此菌株是在nprE基因座中在aprE启动子之后具有额外的1拷贝枯草蛋 白酶FNA(即总计4拷贝枯草蛋白酶)的CP3593。纖pDALsubl 已描述于 Ferrari 等 1985 中。此质粒表达 air。(Ferrari 和 Yang, Biotechnology,3,1003-1007[1985])pBSFNACm(Seq ID NO :1)此质粒是 pBluescript 的衍生物(Alting-Mees, Μ. Α.禾口Short,J. Μ· pBluescript II :gene mapping vectors. Nucleic Acids Res. 17(22), 9494 (1989)),其包含f I(IG)-噬菌体Π的整合区;r印(pMBl)-负责噬菌粒复制的pMBl复 制子;bla (ApR)-编码赋予氨苄青霉素抗性的β -内酰胺酶的基因;编码β-半乳糖苷酶N 端片段的IacZ基因的5'端部分;包含aprE 5’区、编码枯草蛋白酶(FNA)的基因、具有其 启动子的来自PC194的氯霉素抗性基因、aprE 5’区的重复的多肽表达盒。此质粒用于将 表达盒整合入5’ aprE区。pBSFNAalr (Seq ID NO 2)此质粒是上述pBSFNACm的衍生物。在此质粒中,具有 其自身启动子的枯草芽孢杆菌air基因替换氯霉素抗性基因。此质粒用于将表达盒整合入 5' aprE 区。培养基LB 禾Π LB 琼脂如 Ausubel,EM.等(编辑)"Current Protocols inMolecular Biology”. John Wiley 和 Sons,1995 中所述。LBG 1 %是补充 lOg/L 葡萄糖的 LB。LBSM 是 补充1.6%脱脂乳的LB琼脂。用来研究蛋白酶产生的FNII培养基描述于W005052146A2
19中。在LB琼脂+100mg/L D-丙氨酸上繁殖Alr-菌株。适合时,将氯霉素、氨苄青霉素、环丝氨酸或β _氯-D-丙氨酸加至平板或培养液。定量 PCR(aPCR)在 ABI Prism 7000 Sequence Detection System(Applied Biosystems, Foster City, CA)上进行定量编码待产生的目的多肽(例如枯草蛋白酶)的基因拷贝数的qPCR。 按厂商(Applied Biosystems,Foster City,CA)的说明使用Taq]Man Gene Expression Master Mix 试剂盒。2M.在37°C和250转/分下,于10ml管中将待测试菌株接种入5ml LBG%中。0D_ 为 1时,在250ml的Erlenmeyer摇瓶中用2. 5ml培养物接种25ml FNII培养基。在37°C 和250转/分孵育摇瓶,并定期取出培养液样品以测量枯草蛋白酶活性。实施例1枯草芽孢杆菌BG3594和BG3594、pDALsubl对β -氯-D-丙氨酸(CDA)的敏感件 阈倌的测定在第一个阶段中,通过将LB中生长的菌株BG3594的稀释液涂布在包含不同浓度 CDA的LB琼脂平板上,测定抑制枯草芽孢杆菌生长必需的β-氯-D-丙氨酸(CDA)的浓度。 如表1中所示,虽然BG3594在20mg/L的浓度下仍然可以生长,但是在50mg/L的浓度下生 长完全被抑制。在第二个阶段中,将PDalsubl转化入BG3594,以测定air的过量表达是否 可以回复在CDA抑制浓度上生长。如表1中所示,air表达质粒的存在允许在所测试的所 有CDA浓度上生长。此结果表明,只要发生扩增,包含染色体编码的表达盒“目的多肽-air” 的菌株可以在高于20mg/L的CDA浓度上生长。可以用其他丙氨酸消旋酶抑制剂(如环丝 氨酸)代替CDA。表 1BG3594和BG3594、pDALsubl对LB琼脂平板中浓度增加的β -氯-D-丙氨酸的抗
权利要求
扩增基因座的方法,其包括(a)将包含结构为A1 P M A2的基因座的细菌宿主细胞的群体与必需酶的抑制剂接触,其中A1和A2是同向重复,P包含目的蛋白质的编码序列,M包含所述必需酶的编码序列;和(b)选择对所述抑制剂具有抗性的细胞,其中对所述抑制剂具有抗性的细胞具有多个拷贝所述扩增单位。
2.权利要求1的方法,其中所述细菌宿主细胞是芽孢杆菌属物种细胞。
3.权利要求1或2的方法,其中所述必需酶是所述细胞内源的野生型酶。
4.权利要求1-3中任一项的方法,其中所述细菌宿主细胞还包含编码所述必需酶的失 活的基因,其中所述失活的基因是所述细胞内源的且位于与所述结构SA1-P-M-A2的基因 座不同的基因座。
5.权利要求1-4中任一项的方法,其中P包含表达盒。
6.权利要求1-5中任一项的方法,其中A1包含有效连接至P的编码序列的启动子。
7.权利要求1-6中任一项的方法,其中所述必需酶的所述编码序列连接至所述编码序 列内源的启动子。
8.权利要求1-7中任一项的方法,其中所述目的蛋白质是枯草蛋白酶。
9.权利要求1的方法,其中所述必需酶是D-丙氨酸消旋酶。
10.权利要求1-8中任一项的方法,其中所述必需酶是D-丙氨酸消旋酶且所述抑制剂 是β-氯-D-丙氨酸。
11.细菌宿主细胞,其包含含有结构为A1-P-M-A2的扩增单位的基因座,其中A1和A2是 同向重复,P包含目的蛋白质的编码序列,M包含必需酶的编码序列。
12.细菌宿主细胞,其包含多个拷贝含有结构SA1-P-M-A2的扩增单位的基因座,其中 A1和A2是同向重复,P包含用于目的蛋白质的第一编码序列,M包含用于必需酶的第二编码 序列,其中所述第一编码序列有效连接至存在于同向重复A1中的启动子。
13.权利要求11或12的细菌宿主细胞,其中所述目的蛋白质是枯草蛋白酶,且所述必 需酶是丙氨酸消旋酶。
14.权利要求11-13中任一项的细菌宿主细胞,其中所述扩增单位具有SEQID Ν0:7中 所示的序列。
15.细菌细胞培养物,其包含生长培养基;和权利要求11-14中任一项的细菌细胞的群体。
16.包括在适合产生所述目的蛋白质的条件下维持权利要求15的细胞培养物的方法。
17.权利要求16的方法,其还包括从所述培养基回收所述目的蛋白质。
全文摘要
此公开的某些方面涉及扩增基因座的方法。在某些实施方案中,该方法可以包括a)将细菌宿主细胞的群体与必需酶的抑制剂接触,其中所述细菌宿主细胞包含结构为A1-P-M-A2的基因座,其中A1和A2是同向重复,P包含多肽的编码序列,M包含所述必需酶的编码序列;和b)选择对所述抑制剂具有抗性的细胞;其中对所述抑制剂具有抗性的细胞具有多个拷贝的扩增单位。
文档编号C12P21/02GK101981193SQ200980111288
公开日2011年2月23日 申请日期2009年3月27日 优先权日2008年3月28日
发明者C·佩雷斯, E·费拉里 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1