产生和分泌多肽的构建体和方法

文档序号:580837阅读:389来源:国知局
专利名称:产生和分泌多肽的构建体和方法
技术领域
本文描述了通过细菌宿主细胞产生和分泌目的多肽的构建体和方法。特别地,本 发明涉及编码融合蛋白的多核酸,以及该多核酸用于通过细菌宿主细胞分泌异源或同源目 的多肽的用途。本发明还涉及此类多核酸编码的融合蛋白或其部分、含有所述多核酸的载 体和宿主细胞。本发明还涉及使用此类多核酸和融合蛋白通过细菌宿主细胞产生和分泌目 的蛋白的异源或同源多肽的方法。背景异源蛋白质分泌是工业上广泛使用的技术。可通过编码待分泌异源目的蛋白的核 酸转化细胞,并由此产生大量需要的蛋白质。与天然产生的量相比,这种技术可用于产生大 量蛋白质。目的蛋白是具有广泛工业应用的蛋白质,包括治疗和农业用途,以及在食品、化 妆品、清洁组合物、动物饲料等中的用途。因而,增加微生物产生的蛋白质的分泌具有普遍 的兴趣。细胞和分子生物学的进展使下述成为可能,即在某些情况下,鉴定编码所需蛋白 的基因,分离该基因,将该基因插入到宿主细胞内并在宿主细胞中表达该插入的基因以产 生所需的蛋白质。细菌作为宿主细胞已经被深入研究。然而,当细菌作为宿主细胞用于这 种异源基因表达时,经常遇到的问题是大多数细菌表达系统在细胞内产生蛋白质,并且通 常必需破坏细胞以保证产品的回收。上述问题可以通过使细菌将所需蛋白分泌到培养基内而得到解决。一种特别多文 献描述的指导蛋白质分泌的方法是使用分泌信号序列。当信号肽被融合到异源蛋白质的氨 基末端时,其将异源蛋白导向位于细胞膜的分泌装置。然后异源蛋白跨膜转位。任选地,特 异性蛋白酶(有时称为“信号肽酶”或“前导肽酶”)去除信号肽并且释放异源蛋白。蛋白质向周质空间的转位或向培养基的分泌受到多种参数的影响。典型地,对用 于分泌目的蛋白的载体进行工程化,以便将编码分泌信号序列的DNA置于编码目的蛋白的 DNA的5’端。为增加分泌,可以采用数种方式尝试数种不同信号序列,突变信号序列,或 改变宿主内的分泌途径。然而,在许多情况下,当仅仅利用一种信号肽保证分泌时,所分泌 的异源蛋白的量通常非常小,并且大量异源蛋白常常在其分泌后被降解。梭菌属(Clostridium)是革兰氏阳性菌属,其由多种多样的菌株代表。梭菌属细 菌是形成芽孢的厌氧菌。这一菌属包括产溶剂性(solventogenic)梭菌如丙酮丁醇梭菌 (C. acetobutylicum),该菌能够将多种糖和多糖转化成酸和溶剂,以及分解纤维素的梭菌, 如解纤维素梭菌(Clostridium cellulolyticum),该菌能够有效降解纤维素和相关植物细 胞壁多糖。更特别地,解纤维素梭菌产生并分泌大的分解纤维素的复合体,称为多纤维素酶 体(cellulosome),其有效降解纤维素和相关植物细胞壁多糖。这些复合体含有多种酶,这 些酶紧密结合到被称为“支架素(scaffoldin)”的无酶活性的大蛋白质上。酶在支架素上 的结合通过支架素上的粘合分子和酶上互补的锚定素(dockerin)结构域之间的相互作用 发生。锚定素和支架素之间这种高亲和性相互作用已经促成生物技术应用,例如重组蛋白 纯化(Craig 等人,2005,J. Biotechnol.(生物技术杂志)121 :165-173)。
相反,尽管丙酮丁醇梭菌在其基因组中含有一大簇编码纤维素分解酶和支架素的 基因,它不能在微晶纤维素上生长。将纤维素降解活性和溶剂产生结合在一种生物体中的一个策略是,将解纤维素梭 菌的编码多纤维素酶体的基因引入到丙酮丁醇梭菌内。Mingardon等人已经证明,通过来自 于解纤维素梭菌的甘露聚糖酶基因MaMK与也是来自于解纤维素梭菌的编码截短的支架 素的基因cipCl在丙酮丁醇梭菌中共表达,丙酮丁醇梭菌产生、装配并分泌微型多纤维素 酶体(minicellulosome) (Mingardon 等人,Applied Environm. Microbiol.(应用与环境微 生物学)2005,vol 71 (3) :1215-1222)。数个小组已经研究了下述可能性,S卩,通过摆弄多纤维素酶体复合体中存在的不 同分子,并在称作“设计的多纤维素酶体(designercellulosomes),,中组合不同类型的纤 维素酶来增加或改善多纤维素酶体复合体的纤维素分解活性。证明了包含嵌合支架素的 双功能和三功能设计的多纤维素酶体产生了对顽抗底物如稻草具有增强协同活性的多蛋 白复合体,所述嵌合支架素具有不同特异性的两种或三种黏结蛋白(cohesin)以及两种 或三种纤维素酶(每种纤维素酶带有与该黏结蛋白之一互补的锚定素)(Fierobe等人, 2002,J. Biol. Chem.(生物化学杂志)277,49621-19630 ;Fierobe 等人,2005,J. Biol. Chem. (生物化学杂志)280 (16) :16325-16334)。另外,发现此类多纤维素酶体可以包含细菌和 真菌酶的组合(Mingardon等人,2007,Appl. Environm. Microbiol.(应用与环境微生物 学)73(12) =3822-3832) 0在这些实验中,该多纤维素酶体通过在天然分泌这些蛋白质的解 纤维素梭菌中共表达编码多纤维素酶体不同部分的载体而产生,或者通过体外混合重组产 生并纯化的支架素和酶而产生。Mingardon等人描述了“共价多纤维素酶体”的产生,其在单多肽链中包含CBM,同 时具有家族48和家族9的催化组件。这种蛋白从过表达该蛋白的大肠杆菌(E.coli)中 回收,回收通过在弗氏细胞压碎器(French press)中破坏细胞并使用c_末端His标签纯 化重组蛋白进行。发现与相应的杂合多纤维素酶体相比,共价多纤维素酶体对微晶纤维素 (Avicel)底物的活性显著较低(Mingardon 等人,2007,Appl. Environm. Microbiol.(应用 与环境微生物学)73 (22) :7138-7149)。迄今为止,尚未广泛报道克隆编码分泌性蛋白的异源或同源基因,并且通过解纤 维素梭菌以外的细菌细胞(如梭菌属物种)(过量)产生和分泌此类异源或同源蛋白,这可 能是因为通过这些宿主保证重组蛋白分泌遇到问题。鉴于上述内容,清楚的是本领域存在改善通过细菌细胞的蛋白分泌的需要。发明概述本发明的目的在于提供一种通过细菌细胞(更特别地是革兰氏阳性细菌细胞)产 生和分泌异源目的多肽,和/或改善通过革兰氏阳性细菌细胞(特别是梭菌属细菌)产生 和分泌同源目的多肽的方法。本文还提供在本文提供的蛋白质分泌方法中有用的新分子和 构建体,以及制备此类分子和构建体的方法。本申请至少部分地基于微生物产生和输出目的多肽新方法的发现,该方法避免了 至少某些如上列举的与分泌相关的问题。根据本发明的分子、构建体和方法能够通过细菌 细胞(过量)产生和分泌目的多肽。特别地,本发明提供编码融合蛋白的多核酸,其中所述 融合蛋白具有运载结构域(carrier domain),该结构域对目的融合多肽的分泌具有功能效应。更特别地,发明人已揭示了融合蛋白的运载结构域的功能效应,即,控制(诱导和/或 改善)通过重组宿主细胞(细胞外)分泌同源或异源目的多肽,产生所述融合蛋白的能力。 所述运载结构域包含糖结合组件(carbohydrate bindingmodule, CBM)和亲水组件(X组 件),典型地为支架蛋白的组件,以及更特别地与分泌信号肽联合,保证(改善)目的多肽的 分泌。因此,本发明从而有利地还提供下述用途,即,至少支架蛋白的一部分(特别地为至 少下述组件该组件包含该支架蛋白的CBM和亲水组件),特别地与信号肽联合,用于控制 宿主细胞中与所述支架蛋白的部分融合的同源或异源目的多肽的分泌的用途。在第一方面,本分明因此提供编码由多肽序列组成的融合蛋白的多核酸,该多肽 序列以这种特定顺序包含-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖 结合组件融合到多纤维素酶体支架蛋白的至少一个亲水结构域;-至少一个肽接头,用于连接该运载结构域到该目的多肽,和-至少一个目的多肽。 在本发明的具体实施方案中,所述多核酸还包含用于分泌所编码融合蛋白的框内 (in frame)的核酸序列,并且优选地所述核酸序列编码多纤维素酶体支架蛋白的信号肽。因此,本发明提供编码由多肽序列组成的融合蛋白的多核酸,该多肽序列包含,更 特别地,以下列顺序包含-至少一个适当的信号肽,-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖 结合组件融合到多纤维素酶体支架蛋白的至少一个X组件;-至少一个目的多肽,和-至少一个肽接头,用于连接该运载结构域到该目的多肽。在本发明的具体实施方案中,肽接头包含蛋白酶切割位点,用于从剩余融合蛋白 切割所述目的多肽。在又一个具体实施方案中,多肽序列包含两个或多个X组件,更特别地为两个X组 件。在另一方面,本发明涉及本文定义的运载结构域的用途,更特别的是与信号肽联 合,用于控制通过宿主细胞分泌目的多肽,优选地分泌本文定义的多肽的用途。在另一方面,本发明涉及包含根据本发明的多核酸的载体。优选地提供下述载体, 其中多核酸在细菌细胞中表达该核酸的调节序列的控制之下。还有一方面,本发明提供包含根据本发明的多核酸或载体的宿主细胞。因此,本发明的具体实施方案涉及包含编码由多肽序列组成的融合蛋白的多核酸 的重组微生物,该多肽序列包含,更特别地以下列顺序包含(1)至少一个信号肽;( 运载 结构域,其包含至少一个糖结合组件(CBM),该CBM是多纤维素酶体支架蛋白的类型的CBM, 该CBM融合到多纤维素酶体支架蛋白的至少一个X组件;(3)至少一个目的多肽;和(4)至 少一个肽接头,用于连接该运载结构域到该目的多肽。本发明的微生物的特征在于它们分 泌目的多肽。在又一个具体实施方案中,提供下述微生物,其中多核酸编码包含两个或多个X 组件的多肽序列。
在具体实施方案中,提供下述微生物,其中多肽序列包含信号肽,该信号肽是多纤 维素酶体支架蛋白的信号肽。更特别地,该信号肽是解纤维素梭菌的CipC支架蛋白的信号 肽,或丙酮丁醇梭菌的CipA支架蛋白的信号肽。在具体实施方案中,提供下述微生物,其中多肽序列包含至少一个糖结合组件,该 糖结合组件是3a_型糖结合组件(CBM3a)。在具体实施方案中,提供下述微生物,其中多肽序列包含至少一个X组件,该X组 件是解纤维素梭菌的CipC支架蛋白的X2组件,或丙酮丁醇梭菌的CipA支架蛋白的X2组 件。更特别地,根据本发明提供的宿主细胞是革兰氏阳性菌,更特别地是梭菌的纲 (class)的成员。在又一个具体实施方案中,根据本发明的微生物是来自于梭菌属菌株的微 生物,该梭状芽胞杆菌属菌株选自包括丙酮丁醇梭菌和拜氏梭菌(C.beijerinckii)的组。根据本发明的微生物可以包含一个或多个核酸,其中每个核酸包含编码一种或多 种目的多肽的序列。在又一方面,本发明提供本发明的多核酸编码的融合蛋白。另外,本发明还提供融 合到本文定义的信号肽的融合蛋白。本发明还涉及通过宿主细胞,更特别地通过细菌宿主细胞,甚至更特别地通过梭 菌属宿主细胞,最特别地通过非-分解纤维素的梭菌属宿主细胞,产生和分泌生物学活性 形式的至少一种异源或同源目的多肽的方法,该方法包括在引起该编码的融合蛋白表达 的有效条件下,向所述宿主细胞引入根据本发明的多核酸或载体,其中该编码的融合蛋白 被该宿主细胞分泌到所述宿主细胞的环境中。在分泌过程中,信号肽任选地从该融合蛋白 切割。任选地,该目的多肽同时或另外从运载结构域切割。因此,在具体实施方案中,本发明提供,通过重组微生物产生和分泌至少一种异源 或同源目的多肽的方法,该方法包括在引起该编码的融合蛋白表达的有效条件下,向微生 物引入编码由多肽序列组成的融合蛋白的多核酸,该多肽序列包含,更特别地以下列顺序 包含(1)至少一个信号肽;(2)运载结构域,其包含多纤维素酶体支架蛋白类型的至少一 个糖结合组件(CBM),该糖结合组件融合到多纤维素酶体支架蛋白的至少一个X组件;(3) 至少一个目的多肽;和(4)至少一个肽接头,该肽接头用于连接该运载结构域到该目的多 肽,其中该编码的融合蛋白被该重组微生物分泌到该重组微生物的环境中。本发明的又一个方面包括根据本发明的多核酸、载体或宿主细胞用于产生和分泌 生物学活性形式的目的多肽的用途。在本发明不同方面的具体实施方案中,目的多肽包括酶,如植物细胞壁降解酶,并 优选地为纤维素酶。更特别地,该酶是解纤维素梭菌的纤维素酶,如Cel48F或Cel9G。另外 地或备选地,目的多肽包括S. degradans菌株2_40的纤维素酶CelH。在另一个实施方案中,根据本发明的目的多肽可包括治疗性蛋白。此类治疗性蛋 白可以是但不限于选自包括治疗性酶、细胞因子、和抗体的组的蛋白质,并且优选地为细胞 因子如11^_2或1咿0。在又一方面,本发明涉及用于治疗癌症的药物组合物,其包含根据本发明的多核 酸、融合蛋白、载体、或宿主细胞之一,以及至少一种药学上可接受的载体。更特别地,该药 物组合物包含表达根据本发明的多核酸的宿主细胞,最特别地为梭菌属宿主细胞。
本发明还涉及用作药物的根据本发明的多核酸、融合蛋白、载体或宿主细胞。另外,本发明涉及用于治疗癌症的根据本发明的多核酸、融合蛋白、载体或宿主细 胞。在又一方面,本发明提供治疗有其需要的受试者的癌症的方法,该方法包括向所 述受试者施用根据本发明的多核酸、载体、宿主细胞或药物组合物,并且优选地包括在所述 受试者的肿瘤位点注射所述多核酸、载体、宿主细胞或药物组合物。更特别地,本发明提供 治疗有其需要的受试者的癌症的方法,该方法包括向所述受试者施用表达根据本发明的多 核酸的宿主细胞。任选地,将所述宿主细胞注射在所述受试者的肿瘤位点。根据下述详细描述,本发明另外的方面将是明显的。


图1图示了根据本发明具体实施方案的不同构建体。这些构建体包含融合到运载 结构域和信号肽的目的多肽(纤维素酶Cel48F或Cel9G)。运载结构域包含来自于多纤维 素酶体支架蛋白的糖结合组件(CBM3a),该组件融合到来源于相同或不同多纤维素酶体支 架蛋白的一个或两个亲水结构域OCc或fe)。图1还标明了这些构建体通过丙酮丁醇梭菌 的分泌。图2图示了根据本发明具体实施方案的不同构建体。该构建体包含融合到运载结 构域和信号肽的目的多肽(纤维素酶“Cel5H”)。运载结构域包含来自于多纤维素酶体支 架蛋白的糖结合组件(CBM3a),该组件融合到一个或两个X组件(Xa)。纤维素酶Cel5H包 含糖苷水解酶家族5结构域(“5”)、聚丝氨酸接头(“sss”)、糖-结合组件家族6结构域 (“6”)、富含-谷氨酸-脯氨酸区(“印pv”)和C-末端结构域,该C-末端结构域被本发 明人鉴定为推测的糖-结合组件(“DZ”)。图3显示与对照菌株相比野生型Cel5H以及融合到运载结构域的Cel5H的 分泌。运载结构域包含多纤维素酶体支架蛋白的糖结合组件(CBM3a),该组件融合到 两个亲水结构域(Xa)。培养物上清的活性在可溶性底物对-硝基苯基-纤维二糖 (para-nitrophenyl-cellobiose)上须Ijfi0图4显示不同蛋白(包括根据本发明具体实施方案的融合蛋白)对纤维素的活 性与野生型Cel9G相比,包含Cel9G的蛋白质对微晶纤维素Avicel的活性。图例与图1 相同。图5显示不同蛋白(包括根据本发明具体实施方案的融合蛋白)对不同纤维质 底物的活性;(a)包含Cel5H的蛋白对可溶性底物对-硝基苯基-纤维二糖的活性;野 生型Cel5H(实线),与一个X组件融合(CBM-Xa-5H ;虚线),具有两个X组件的融合蛋白 (CBM-Xa-Xa-5H,阴影线)(b)包含cel5H的蛋白对微晶纤维素Avicel的活性。发明详述1. 一般定义当用于本文时,单数形式“一个”、“一种”、和“所述”既包括单数也包括复数指示 物,除非上下文另有清楚地说明。举例而言,“细胞”是指一个或多于一个细胞。当用于本文时,术语“包括”、“包含”以及“具有”(“comprisingWomprises” 和“comprised of”)与“含有”、“带有”(“including”、“includes” 或“containing,,、"contains")意思相同,是包括在内的或开放式的,并且不排除另外的、未列举的成员、元件或方法步骤。术语“大约”用于本文时,当指可测量的数值如参数、量、时间期间等时,意欲包括 与标示的数值有+/-20 %或更少,优选地/-10 %或更少,更优选地+/-5 %或更少,甚至更优 选地/-1%或更少,还更优选地+/-0. 或更少的差异,只要此类差异在所公开的发明中 的实施是适当的。通过端值记载的数值范围包括该范围内所包含的所有数字和部分,也包括所记载 的端值。本说明书中引用的所有文献通过引用完整地并入本文。特别地,本文具体引用的 所有文献的教导通过引用并入本文。本发明一般而言涉及通过宿主细胞产生和分泌多肽的多核酸、构建体、分子和方 法。在这一背景中,术语“分泌”是指目的多肽的细胞外递送,即宿主细胞外部的递送。 特别地这意味着目的多肽在宿主细胞中释放或在宿主细胞外部积累,例如在其中所述宿主 细胞生长所在的或存在的“环境”中。在相同背景中,转位是指递送目的多肽到周质空间中。术语“多肽,,和“蛋白,,在本文中可互换地使用,并一般是指氨基酸残基通过肽键 连接的聚合物,并且不限于最低长度的产物。因而,该定义中包括肽、寡肽、多肽、二聚体 (异-和同_)、多聚体(异-和同_),等等。该定义既包括全长蛋白也包括其片段。该术语 还包括多肽的表达后修饰,例如,糖基化、乙酰化、磷酸化等。此外,为本发明的目的,该术语 当包括修饰时还指此类,如对天然蛋白或多肽序列的缺失、添加和替换(例如,性质上保守 的)。术语“肽”当用于本文时,优选地是指基本上由≤50个氨基酸,例如≤ 45个氨基 酸,优选地≤ 40个氨基酸,例如≤ 35个氨基酸,更优选地≤ 30个连续氨基酸,例如≤25、 ≤20、≤15、≤10或≤5个氨基酸组成的本文中使用的多肽。当用于本文时,术语“异源多肽”是指并不天然存在于宿主细胞的多肽。术语“同 源多肽”是指自然或天然存在于宿主细胞的多肽。在一个实施方案中,本发明包括通过重组 DNA技术产生同源多肽的宿主细胞。重组蛋白是指被已经引入宿主的多核酸编码的任何蛋 白。术语“多核酸”和“核酸”在本文中可互换地使用,一般是指任何长度的基本上由核 苷酸(例如,脱氧核糖核苷酸和/或核糖核苷酸)构成的聚合物。核酸可包含嘌呤和/或嘧 啶碱基,和/或其它天然、化学或生物化学修饰的(例如甲基化的)、非-天然、或衍生的核 苷酸碱基。核酸骨架可包含糖和磷酸基团,这典型地可在RNA或DNA中发现,和/或一个或 多个修饰的或取代的(如,2' -0-烷基化的,例如,2' -0-甲基化的或2' -0-乙基化的; 或2' -0,4' -C-烷基化的,例如,2' -0,4' -C-乙基化的)糖或一个或多个修饰的或取 代的磷酸基团。例如,核酸中的骨架类似物可包括磷酸二酯、硫代磷酸酯、二硫代磷酸酯、甲 基膦酸酯、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3'-硫缩醛(3’-thi0acetal)、亚甲基 (甲基亚氨)、3' -N-氨基甲酸酯、吗啉代氨基甲酸酯和肽核酸(PNAs)。术语“多核酸”还尤其包括DNA、RNA和DNA/RNA杂合分子,尤其包括hnRNA、 前-mRNA、mRNA、cDNA、基因组DNA、基因、扩增产物、寡核苷酸、和合成(例如化学合成)DNA、RNA或DNA/RNA杂合体。术语“核糖核酸”和“RNA”当用于本文时意思是由核糖核苷酸构成 的任何长度的聚合物。术语“脱氧核糖核酸”和“DNA”当用于本文时,意思是由脱氧核糖核 苷酸构成的任何长度的聚合物。术语“DNA/RNA杂合体”当用于本文时,意思是任何长度的 由一个或多个脱氧核糖核苷酸和一个或多个核糖核苷酸构成的聚合物。核酸可以天然存在,例如,存在于自然界或从自然界分离,可以是重组的,即通过 重组DNA技术产生,和/或可以是,部分地或全部地,化学或生物化学合成的。核酸可以是 双链的,部分双链的,或单链的。当是单链的时,核酸可以是正义链或反义链。另外,核酸可 以是环形的或线性的。术语“寡核苷酸”当用于本文时,表示单链核酸(核苷酸多聚体),具有2个核苷 酸以上长度,并且优选地达到200个核苷酸长度,更优选地大约10至大约100个核苷酸长 度,甚至更优选地大约12至大约50个核苷酸长度。寡核苷酸可以通过本领域任何已知的 方法合成,例如通过化学或生物化学合成,例如,固相亚磷酰胺化学合成,或从重组核酸分 子(例如细菌或逆转录病毒载体)体外或体内表达。当用于本文时,“重组核酸”是下述情况下的分子,即编码目的多肽的核酸分子已 经被体外修饰,从而其序列不是天然存在的,或对应于天然存在的序列,该天然存在的序列 并未如基因组中未经修饰的该序列的同样放置。术语“信号序列”或“分泌信号序列”或“分泌信号肽”或“信号肽”表示如下多肽, 该多肽作为更大多肽的组分,指导该更大多肽通过宿主细胞(该更大多肽在其中合成)的 分泌途径。更大多肽在通过分泌途径的运输中通常被切割以除去分泌信号肽。因而,当信 号肽融合到异源蛋白的氨基-末端时,它将该蛋白导向宿主细胞的分泌器。然后该异源蛋 白跨膜转位,特异性蛋白酶(有时称为“信号肽酶”)除去信号肽并释放该蛋白(在本案中 为根据本发明的融合蛋白)。术语“多纤维素酶体支架蛋白”或“支架素”当用于本文时,意指包含于多纤维素 酶体中的支架蛋白。“多纤维素酶体”是存在于某些分解纤维素的微生物中的细胞外多酶复 合体,含有分解糖所需的多拷贝的酶。特别地,多纤维素酶体由支架蛋白构成,该支架蛋白 附着到多种纤维素酶、半纤维素酶、和果胶酶,它们协同作用降解复杂的细胞壁分子,并且 这种复合体允许生物体十分有效地降解植物细胞壁。支架蛋白将多种其它蛋白聚集在信号 途径中并允许它们相互作用。术语”蛋白酶切割位点”或“蛋白酶靶序列”,其包含于本文定义的多肽接头的序列 中,是指能够被特异性蛋白酶识别的氨基酸序列。在这一位点的切割导致目的多肽的释放。 应当指出接头多肽可以是任何含有蛋白酶切割位点的合成多肽,只要在这一位点的切割导 致从目的多肽除去剩余结构域。可在编码如本文描述的融合蛋白的多核酸中使用的适当蛋 白酶靶序列,包括但不限于能够被丝氨酸蛋白酶(如纤维蛋白溶酶、凝血酶、因子Xa或胰蛋 白酶)识别的序列。当用于本文时,术语“运载结构域”或“运载组件”意指这样的多肽序列,功能结构 域可以根据本发明融合到该多肽序列。术语“功能结构域”或“功能组件”用于本文是指如 下多肽序列,该多肽序列包含根据本发明待产生和分泌的目的多肽。所述运载结构域或和 所述功能结构域之间的融合可借助于接头组件完成。 在本发明的背景中“至少一个”的表述意思是至少两个、至少三个、至少四个、至少五个、至少六个等,并直至至少十个,并且也包括一个。 2.核苷酸序列在第一方面,本发明涉及编码融合蛋白的多核酸,用于促进通过宿主细胞(优选 地为细菌宿主细胞)产生和分泌目的多肽,以及该多核酸的多种用途。尤其是,已经发现编 码本文定义的融合蛋白的多核酸允许通过宿主细胞有效产生多肽并且允许其细胞外递送。在具体实施方案中,本发明提供编码由多肽序列组成的融合蛋白的多核酸,该多 肽序列包含-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖 结合组件融合到多纤维素酶体支架蛋白的至少一个X组件或亲水组件;-至少一个目的多肽,和-至少一个肽接头,用于连接该运载结构域到该目的多肽。在又一个具体实施方案中,本发明提供编码由多肽序列组成的融合蛋白的多核 酸,该多肽序列包含-适当的分泌信号肽-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖 结合组件融合到多纤维素酶体支架蛋白的至少一个X组件或亲水组件;-至少一个目的多肽,和-至少一个肽接头,用于连接该运载结构域到该目的多肽。在具体实施方案中,本发明提供编码由多肽序列组成的融合蛋白的多核酸,该多 肽序列包含i)至少一个适当的分泌信号肽ii)多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),iii)多纤维素酶体支架蛋白的至少一个X组件或亲水组件,该组件融合到所述 CBM ⑴,iv)至少一个目的多肽,ν)至少一个肽接头,用于连接该X组件或亲水组件(ii)到目的多肽(iii)。因而在具体实施方案中,编码如本文描述的融合蛋白的多核酸包含框内的核酸分 泌序列,该序列用于将编码的融合蛋白导向宿主细胞外部。因而分泌导致产物,即整个融合 蛋白(例如CBM-X-酶),存在于或积累在包含宿主细胞的环境(例如培养基)中。因而,在更具体的实施方案中,本发明提供编码由多肽序列组成的融合蛋白的多 核酸,该多肽序列包含_适当的分泌信号肽,-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖 结合组件融合到多纤维素酶体支架蛋白的至少一个X组件或亲水组件;-至少一个目的多肽,和-至少一个肽接头,用于连接该运载结构域到该目的多肽。更特别地,该序列以它们如上所列举的顺序排列。更特别地,本发明提供编码由多肽序列组成的融合蛋白的多核酸,该多肽序列包 含
i)多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),ii)多纤维素酶体支架蛋白的至少一个X组件或亲水组件,该组件融合到所述 CBM ⑴,iii)至少一个信号肽,例如来自于细菌支架蛋白的信号肽,iv)至少一个目的多肽,ν)至少一个肽接头,用于连接该X组件或亲水组件(ii)到目的多肽(iii)。因此,本发明提供多核酸序列,该多核酸序列包含可操作地连接的(更特别地为 共价连接的)编码如上所描述的各个组件的单个序列,从而表达该多核酸序列产生如本文 所描述的融合蛋白。可用于编码如本文所描述的融合蛋白的多核酸中的分泌信号序列的适当的核酸 序列在本文其它地方描述,并且包括但不限于多纤维素酶体支架蛋白的信号肽,如例如解 纤维素梭菌ATCC 35319(基因库(gene bank)U40345)的CipC支架蛋白的信号肽,或丙酮 丁醇梭菌ATCC 824(基因库AE007606或AE001437)的CipA支架蛋白的信号肽。在具体实施方案中,本文定义的融合蛋白可在分泌过程中被切割,从而分泌导致 目的多肽存在于或积累在包含宿主细胞的环境(例如培养基)中。为达到该目的,本发明 的融合蛋白也可以被工程化以含有帮助回收蛋白的切割位点。因此在具体实施方案中,本 发明提供编码如本文所描述的融合蛋白的多核酸,该多核酸具有包含蛋白酶切割位点的肽 接头。3.融合蛋白在另一方面,本发明涉及根据本发明的多核酸编码的融合蛋白。该融合蛋白也可以表示为嵌合蛋白。“融合”是指在框内将编码目的多肽的多核酸 和编码运载结构域(其包含一个或多个组件)的多核酸连接在一起。表达该连接的多核酸 产生嵌合蛋白,此后也称为“融合蛋白”。本发明的融合蛋白可包含上游酶或化学切割位点 (优选地邻近目的多肽的N-末端),和/或下游酶或化学切割位点(优选地邻近目的多肽 上游提供的结构域的C-末端),由此提供通过使用切割试剂从融合蛋白回收目的多肽的方 式。一般而言,根据本发明的融合蛋白由多肽序列组成,该多肽序列包含-运载结构域,其优选地包含多纤维素酶体支架蛋白的至少一个糖结合组件 (CBM),该糖结合组件融合到多纤维素酶体支架蛋白至少一个亲水结构域;和-功能结构域,其包含至少一个目的多肽。更特别地,根据本发明的融合蛋白由多肽序列组成,该多肽序列包含_适当的信号肽序列,-运载结构域,其优选地包含多纤维素酶体支架蛋白的至少一个糖结合组件 (CBM),该糖结合组件融合到多纤维素酶体支架蛋白的至少一个亲水结构域;和-功能结构域,其包含至少一个目的多肽。运载结构域借助于接头组件连接到功能结构域。 应当进一步指出,根据本发明的特定实施方式,融合蛋白是已被切割的蛋白构建 体,因而不再包含信号肽。在这些实施方案中,融合到融合蛋白的信号肽在分泌过程中从所 述融合蛋白切割。任选地,如果上面提及的多肽接头含有蛋白酶切割位点,目的多肽可从融合蛋白的剩余部分经适当的蛋白酶(一个或多个)作用进一步切割,该蛋白酶能够识别所 述蛋白酶切割位点并在该位点切割多肽序列。因此,术语“融合蛋白”当用于本文时,可以 指细胞内合成的多肽序列(即包含信号序列),或者分泌后的多肽序列,由此该信号序列任 选地从该多肽序列被释放或被切割。 以根据本发明的融合蛋白的形式产生目的多肽的目的是保证或增加目的多肽的 分泌。在具体实施方案中,本发明的融合蛋白具有特别改善的属性,如例如与分离的目 的多肽相比增加的活性。例如,在具体实施方案中,例如当目的多肽是酶时,融合蛋白中 存在一个或多个糖结合组件和/或一个或多个亲水组件,可与分离的酶相比增加该酶的活 性。因此,在具体实施方案中,本发明涉及包含根据本发明的运载结构域的融合蛋白,该融 合蛋白与目的多肽相比具有改善的属性。在备选的具体实施方案中,融合蛋白活性与天然多肽相比相似或降低。下文将更详细地讨论本融合蛋白及其部分(如运载结构域和功能结构域)中包含 的本文定义的单独组件。A.糖结合组件根据本发明的运载结构域中,或融合蛋白中的第一组件包括糖结合组件。术语“糖结合组件”,“糖结合分子”;“糖结合蛋白”和“糖结合结构域”在本文中作 为同义词使用,是指能够结合多糖底物(如例如纤维素)的蛋白或必需部分,或其同源物。 糖结合组件(CBMs)是功能上独立的组件,在自然界经常发现其与涉及生物质降解的蛋白 相关。这些组件定义为作用于糖的酶中存在的,显示出三维结构和糖结合能力的氨基酸序 列。糖结合组件优选地包括多纤维素酶体支架蛋白的糖结合组件。在这一背景中,术语“其必需部分”是指糖结合组件的能够结合糖的部分。术语糖结合蛋白的“同源物”当用于本文时是指下述蛋白,该蛋白具有的氨基酸 序列与糖结合蛋白的氨基酸序列的功能部分具有至少30%的同一性,优选地至少40%、 50 %、60 %、70 %、80 %或90 %的同一性,最优选地至少95 %的同一性。应当理解,根据本发 明,不使用% “同一性”,而使用相应的% “相似性”也可以用来定义同源性。在具体实施方案中,根据本发明的运载结构域或融合蛋白包含来自于多纤维素酶 体支架蛋白的糖结合组件(如上所定义)。在又一个具体实施方案中,运载结构域包含来自 于酶的糖结合组件,但是其与来自于多纤维素酶体支架蛋白(例如CBM3b)的糖结合组件相 似。在又一个具体实施方案中,根据本发明的运载结构域或融合蛋白包含的糖结合组 件是CBM3组件,即3-型糖结合组件。糖_结合组件根据序列同源性已被分类到40个以上 的家族。数种分解纤维素的酶共享大约150个氨基酸残基的保守区,CBM3结构域。CBM3结 构域已被分类为三种不同亚型,称为家族Ilia、IIIb和IIIc。在优选地实施方案中,根据 本发明的运载结构域或融合蛋白包含的糖结合组件是IIIa或IIIb型的CBM3组件。在又 一个具体实施方案中,根据本发明的运载结构域或融合蛋白包含的糖结合组件是IIIa型 的CBM3组件。家族IIIa的糖结合组件结合到微晶纤维素。根据本发明的运载结构域或融合蛋白中包含的糖结合组件的特别实例包括但不 限于选自包括热纤梭菌(Clostridium thermocellum)(基因库X67406或X67506)的多纤维素酶体整合蛋白A(CipA)、解纤维素梭菌(基因库U40345)的多纤维素酶体整合蛋白 C(CipC)、食纤维梭菌(Clostridium cellulovorans)(基因库M73817)的纤维素结合蛋 白A(CbpA)、和丙酮丁醇梭菌(基因库AE007606或AE001437)的多纤维素酶体整合蛋白 A(CipA)的组的多纤维素酶体支架蛋白的糖结合组件。 根据本发明的运载结构域或融合蛋白中包含的糖结合组件的特别实例是解纤维 素梭菌(基因库U40345)的支架蛋白CipC的糖结合组件。解纤维素梭菌的多纤维素酶体 围绕支架蛋白CipC组织,支架蛋白CipC允许不同多纤维素酶体的酶通过锚定素-黏结蛋 白结构域的相互作用而结合。在具体实施方案中,糖结合组件包括解纤维素梭菌的支架蛋白CipC的糖结合组 件的同源物。因此,根据又一个实施方案,本发明还涉及如上所描述的运载结构域或融合蛋 白,其中所述至少一个糖结合组件包含下述多肽,该多肽与解纤维素梭菌的支架蛋白CipC 的糖结合组件具有至少30 %的同一性,优选地至少40 %、50 %、60 %、70 %、80 %或90 %的 同一性,最优选地至少95%的同一性。应当理解,根据本发明,不使用% “同一性”,而使用 相应的% “相似性”也可以用来定义同源性。B. X 组件根据本发明的融合蛋白的另一个组件包括至少一个X组件,更特别地为亲水组 件,并且优选地为多纤维素酶体支架蛋白的亲水组件。术语“亲水结构域”、“亲水组件”和“X组件”在本文中作为同义词使用,是指多纤 维素酶体支架蛋白的亲水结构域。在具体实施方案中,X-组件是嗜温的梭菌属多纤维素酶 体支架蛋白的χ-组件。因而在具体实施方案中,根据本发明的融合蛋白包含的X组件是细菌来源的,优 选地来自于梭菌属的细菌,更特别地为嗜温的梭菌(mesophilic Clostridia),例如来自于 热纤梭菌、解纤维素梭菌、丙酮丁醇梭菌、约氏梭菌(Clostridium josui)或食纤维梭菌。应 当指出丙酮丁醇梭菌、解纤维素梭菌、食纤维梭菌、约氏梭菌中发现的X组件可称为“X2”组 件,而热纤梭菌中发现的X组件可称为“XI,,组件。根据本发明的运载结构域或融合蛋白中包含的X组件的特别实例包括但不限 于选自包括热纤梭菌(基因库X67406或X67506)的多纤维素酶体整合蛋白A(CipA)、解 纤维素梭菌(基因库U40345)的多纤维素酶体整合蛋白C(CipC)、食纤维梭菌(基因库 M73817)的纤维素结合蛋白A(CbpA)、约氏梭菌(基因库AB004845)的多纤维素酶体整合 蛋白A(CipA)和丙酮丁醇梭菌(基因库AE007606或AE001437)的多纤维素酶体整合蛋白 A(CipA)的组的多纤维素酶体支架蛋白的亲水结构域。根据本发明的运载结构域或融合蛋白中包含的X组件的特别实例是解纤维素梭 菌(基因库U40345)的支架蛋白CipC的X2组件。根据本发明的融合蛋白中包含的X组件的另一个特别优选的实例是丙酮丁醇梭 菌(基因库AE007606或AE001437)的支架蛋白CipA的X2组件。在又一个实施方案中,X-组件是与本文描述的X组件同源的组件。在具体实施方案中,X组件是解纤维素梭菌的支架蛋白CipC的或丙酮丁醇梭菌的 支架蛋白CipA的亲水组件的同源物。因此,根据又一个实施方案,本发明还涉及如上文所 描述的融合蛋白、编码它们的核酸序列和宿主细胞、更特别地为重组微生物,其中所述至少一个X组件包含下述多肽,该多肽与解纤维素梭菌的支架蛋白CipC或丙酮丁醇梭菌的支架 蛋白CipA的亲水组件具有至少30%的同一性,优选地至少40%、50%、60%、70%、80%或 90%的同一性,最优选地至少95%的同一性。应当理解,根据本发明,不使用% “同一性”, 而使用相应的% “相似性”也可以用来定义同源性。还应当指出,根据本发明,应用于根据本发明的运载结构域或融合蛋白中的CBM 组件和X组件可以来源于相同或不同的多纤维素酶体支架蛋白。在一个具体实施方案中,本发明涉及编码具有运载结构域的融合蛋白的多核酸, 该运载结构域包含多纤维素酶体支架蛋白的糖结合组件(CBM),该糖结合组件融合到相同 或不同多纤维素酶体支架蛋白的一个X组件。在另一个具体实施方案中,本发明涉及编码 具有运载结构域的融合蛋白的多核酸,该运载结构域包含多纤维素酶体支架蛋白的糖结合 组件(CBM),该糖结合组件融合到相同或不同多纤维素酶体支架蛋白的两个相同或两个不 同的X组件。在具体实施方案中,融合蛋白包含两个X组件,三个X组件,或四个或更多X组件。 这些可相互相邻地置于融合蛋白中或被融合蛋白的一个或多个其它组件所分开。C.信号肽在具体实施方案中,包含保证根据本发明的目的多肽分泌的运载结构域的融合蛋 白,还包含编码分泌信号序列的序列。在根据本发明这些实施方案的构建体中,这种分泌信 号序列被连接到该构建体的其它序列之一(即编码CBM结构域、X组件的序列或者编码目的 多肽的序列)从而信号序列和目的多肽可操作地连接,更特别地为共价连接。关于此,“可 操作地连接”表示编码信号序列的序列和编码待分泌的多肽的序列在框内(inframe)或同 相(in phase)连接,从而在表达时,信号肽促进如此连接到该信号肽的多肽的分泌。应当理解,适当的信号序列可取决于期望在其中进行分泌的微生物的类型。例如, 不同革兰氏阳性菌可能需要不同信号序列。举例而言,但非限制性的,革兰氏阳性菌中的分 泌,特别是梭菌属如丙酮丁醇梭菌中的分泌,可使用如下信号序列完成,该信号序列为解纤 维素梭菌(示例序列=Genbank登录号AAA51444,1994年10月31日修改的序列版本1)的 Cel5A前体多肽的信号序列,或解纤维素梭菌(示例序列=Genbank登录号AAC28899, 2005 年12月5日修改的序列版本2)的CipC前体支架蛋白的信号序列,或丙酮丁醇梭菌(示例 序列=Genbank登录号AAK78886, 2006年1月19日修改的序列版本1)的CipA前体支架蛋 白的信号序列。还应当理解可以使用将要通过本文教导的微生物表达的多肽的天然(或同源、内 源)信号肽,只要它们在所述微生物中是有功能的。因此,举例而言,可以使用解纤维素梭 菌的CipC支架蛋白完成解纤维素梭菌Cel48F或Cel9G的分泌。相似地,可以使用Cel5H 前体多肽的内源或同源分泌信号序列完成Cel5H或相关多肽在异源生物体中的分泌。P.目的多肽根据本发明的本融合蛋白或其功能结构域还包含将要通过本文提供的构建体和 方法产生和分泌的目的蛋白。通过本文定义的宿主(优选地细菌宿主)产生和分泌的蛋白 可以是任何目的蛋白。在优选的实施方案中,该蛋白是异源蛋白,即对宿主是异源的。备选 地,该蛋白是同源的。 术语“目的多肽”和“目的蛋白”在本文中作为同义词使用,是指通过本文定义的宿主细胞产生和分泌的蛋白。 本发明不受可根据本发明产生和分泌的目的多肽的类型或功能的限制。目的蛋白 的性质由应用的核酸以及包含它们的宿主细胞决定。在一个实施方案中,所述目的多肽是酶,优选地选自包括但不限于蛋白酶、还原 酶、脂肪酶、激酶、磷酸酶、氧化酶和糖酶的组。例如,所述目的多肽是选自下述组的酶,该组包括但不限于转移酶(EC. 2),异 构酶(EC. 5),氧化还原酶(EC. 1),该氧化还原酶包括但不限于EC 1. 10. 3的组的酶,该EC 1. 10. 3的组包括漆酶或过氧化物酶(EC 1. 11. 1),该过氧化物酶(EC 1. 11. 1)包括木质酶 和木质素过氧化物酶,和水解酶(EC. 3),该水解酶包括但不限于羧酸酯水解酶(EC 3. 1. 1) 和糖苷酶(EC3. 2. 1),该羧酸酯水解酶(EC 3. 1. 1)包括半纤维素酶,该糖苷酶包括内切-葡 聚糖酶、外切_葡聚糖酶、α “淀粉酶、葡萄糖淀粉酶、果胶酶、内切_葡萄糖苷酶H、纤维素 酶、纤维二糖水解酶、和内切-持续性纤维素酶(endo-processive cellulase)。在具体实施方案中,所述目的多肽是植物细胞壁降解酶。通过微生物分泌此类酶 在降解植物材料的背景下是有利的,例如在生物燃料生产的背景下。术语“植物细胞壁降解 酶”用于本文是指催化纤维质或木质纤维材料切割的酶,包括但不限于纤维素酶、半纤维素 酶、漆酶、纤维二糖水解酶和其它涉及将纤维素和半纤维素破坏成单糖(如葡萄糖、木糖、 阿拉伯糖、甘露糖和半乳糖)的酶。在具体实施方案中,所述多肽是纤维素酶。这一术语包括持续性(processive) 和非持续性(non-processive)纤维素酶。持续性纤维素酶将连续与单多糖链相互作用, 非-持续性纤维素酶将相互作用一次然后离开并作用于另一多糖链。明确地但并非唯 一地,术语纤维素酶中包括下述那些酶,属于酶分类(Enzyme Classification)标题EC 3.2. 1.4酶,也称为β-1,4-内切葡聚糖酶,其沿纤维素链随机切割β-1,4-糖苷键,EC 3. 2.1.91酶,也称为纤维二糖水解酶或外切葡聚糖酶,其从纤维素链的一个末端顺次释放 纤维二糖或葡萄糖,和EC 3.2. 1.4/EC 3.2. 1.91酶,也称为内切-持续性纤维素酶,其表现 出混合的作用模式(内切和外切葡聚糖酶两者)。根据具体实施方案,本发明中使用的植物细胞壁降解酶是微生物来源, 例如真菌或细菌来源,优选地为细菌来源,例如来自于下述的细菌交替单胞菌 禾斗(Alteromonadaceae)的属例如 Saccharophagus degradans 菌株 2-40,热单抱 菌属(Thermomonospora)例如来自于褐色热单孢菌(T. fusca),纤维素单胞菌科 (Cellulomonadaceae)的属例如粪碱纤维单胞菌(C. fimi),梭菌属例如来自于热纤梭菌、 解纤维素梭菌、丙酮丁醇梭菌、食纤维梭菌、约氏梭菌。在另一实施方案中,本发明中使用的 植物细胞壁降解酶是真菌来源,例如来自于下述的真菌=Neocallimastigomycota属,例如 * 自 N. patriciarum Orpinomyces 白勺·禾中胃tt PC—2。适合用于根据本发明的融合蛋白或其功能结构域中的纤维素酶的具体实例包括 但不限于-解纤维素梭菌的纤维素酶,选自包括Cel48F、Cel9G、Cel9R、Cel9P、Cel9E、 Cel9H、Cel9J、Cel9M、Cel8C、Cel5N、和 Cel5A 的组;-热纤梭菌的纤维素酶,选自包括Cel9D、Cel9J、CBH9A、Cel9H、Cel9K、Cel5E、 Cel48S、Cel9F、Cel9N、Cel9Q、Cel50、Cel5B、Cel5G、Cel8A、Cel5C 和 Cel9I 的组;
-丙酮丁醇梭菌的纤维素酶,选自包括Cel48A、Cel9G、Cel9R、Cel9P、Cel9E、 Cel9H、Cel9J、Cel9M,和 Cel5A 的组;-S. degradans 菌株 2-40 的纤维素酶,选自包括 Cel9A、Cel9B、Cel5J、Cel5I、 Cel5F、Cel5H、Cel5D、Cel5B、Cel9G、Cel5E、Cel5A、Cel5C 和 Cel6A 的组。-来自于假单胞菌属(Pseudomonas)物种ND137的推测的纤维素酶,如Acla。在又一个特别实例中,适合用于根据本发明的融合蛋白或其功能结构域的纤维素 酶包括解纤维素梭菌的纤维素酶Cel48F或Cel9G。在又一个特别实例中,适合用于根据本发明的融合蛋白或其功能结构域的纤维素 酶包括S. degradans菌株2-40的纤维素酶Cel5H。在又一个具体实施方案中,根据本发明将要产生和分泌的目的多肽是治疗性蛋 白。“治疗性蛋白”当用于本文时,是指蛋白、肽、糖蛋白或糖肽,其可施用于受试者以治疗该 受试者的疾病或机能障碍或改善健康。其既包括本身显示治疗效应的分子,也包括作用于 其他分子或与其他分子联合显示治疗效应的分子,如复方药的一部分或前药转化酶。在具 体实施方案中,该受试者是动物或人类。在又一个优选实施方案中,治疗性蛋白是人类蛋白 或动物蛋白,例如来自啮齿动物例如大鼠、小鼠。还有一个具体实施方案中,疾病或机能障 碍包括癌症。因此,在具体实施方案中,目的多肽是抗肿瘤剂。在具体实施方案中,治疗性蛋白是活性蛋白,例如具有酶活性或生物学活性,如结 合配体或受体的活性,激活细胞内信号转导途径的能力,或激发动物(例如人类)中免疫应 答的能力。治疗性蛋白可以通过一种或多种糖基转移酶在体外进行糖基化修饰或其他修 饰。在具体实施方案中,用于根据本发明的融合蛋白或其功能结构域的目的蛋白是下 述治疗性蛋白,其选自包括治疗性酶、细胞因子、和抗体(包括所有已知形式的抗原结合分 子)的组。应当指出根据本发明,术语抗体也包括“催化抗体”。在又一个具体实施方案中,治疗性蛋白选自包括细胞因子如但不限于IL-2、 IL-12、GM-CSF (细胞-巨噬细胞集落刺激因子)、TNF (肿瘤坏死因子)-α等的组。更特别地预见到治疗性蛋白用于本文描述的本发明的治疗性应用的用途。在又一个具体实施方案中,目的多肽是诊断多肽,如抗体。这些在本发明的宿主细 胞的诊断用途中可能是有利的。Ε.接头组件根据本发明的融合蛋白典型地包含另一个组件,该组件由至少一个肽接头组成, 该肽接头用于连接该蛋白的运载结构域到目的多肽的功能结构域。优选地连接糖结合组件到亲水组件的肽序列是本领域已知的序列并可以在多纤 维素酶体支架蛋白中方便地找到。所述接头多肽优选地包含至少3、优选地至少4或5、最优选地至少7、和更优选地 至少12个氨基酸的多肽。优选地所述接头是包含3至15个氨基酸的多肽。优选地所述接 头是包含非_带电氨基酸如甘氨酸、丝氨酸、半胱氨酸、天冬酰胺、酪氨酸、谷氨酰胺、丙氨 酸、缬氨酸、脯氨酸、苏氨酸并且优选地为甘氨酸或丝氨酸的多肽。 接头多肽的适当实例包括在细菌细胞多纤维素酶体支架蛋白,如但不限于丙酮丁 醇梭菌(ΑΕ007606)的CipA、解纤维素梭菌(U40345)的CipC、热纤梭菌(X67406或X67506)的CipA、食纤维梭菌(M73817)的CbpA、约氏梭菌(AB004845)的CipA中发现的接头多肽。 如上所述,本文定义的肽接头可包含蛋白酶切割位点。在这一位点的切割导致目 的多肽的释放。4.载体根据本发明的又一方面,提供了表达构建体,以促进向宿主细胞(优选地为细菌 细胞)引入和/或促进表达和/或促进维持编码根据本发明的融合蛋白的多核苷酸序列。 表达构建体可插入到商业上可获得的质粒或载体中。“载体”的意思为可向其中插入或克隆多核苷酸的多核苷酸分子,优选地DNA分子, 其来源于例如质粒、噬菌体、或植物病毒。载体优选地含有一个或多个单一限制性位点,并 能够在定义的宿主细胞中自主复制,或可与定义的宿主基因组整合从而可重复产生所克隆 的序列。载体的选择将典型地取决于载体与将要向其中引入该载体的宿主细胞的相容性。根据本发明的实施方案,表达构建体是下述表达载体,其适合用于转化到宿主生 物体(优选地为细菌),并适合用于在所转化的宿主细胞中维持和表达根据本发明的融合 蛋白。“表达载体”是可用于转化选定的宿主细胞并提供编码序列在该选定的宿主中表 达的构建体。表达载体例如可以是克隆载体、双元载体或整合载体,本发明因而还涉及包含 任何如上所描述的核酸的载体。所述载体还可以包含控制核酸在所述宿主细胞中表达的调 节序列。在实施本发明中特别有用的是下述表达载体,即提供编码本文定义的融合蛋白的 核酸在细菌细胞表达的表达载体。一般而言,表达涉及使用能够在宿主细胞中有效复制的 表达载体,从而宿主细胞积累许多拷贝的该表达载体,并相应地合成高水平的由该表达载 体编码的所需产物(融合蛋白)。本文中使用的术语“调节序列”和“控制序列”应在宽泛背景中理解,是指这样的 调节核酸序列,即能够驱动和/或调节它们所连接(共价连接的)和/或可操作地连接的 序列的表达的调节核酸序列。控制序列根据目标宿主生物体和待表达序列的性质而不同。 为在原核生物中表达蛋白,控制序列一般包括启动子、核糖体结合位点和终止子。在真核生 物中,控制序列一般包括启动子,终止子,和在某些情况下增强子,和/或5’和3’非翻译序 列。术语‘控制序列’意图最少包括所有表达必需的元件,以及还可包括另外有利的元件。 根据本发明优选的实施方案,控制序列在细菌(优选地为革兰氏阳性菌)中是可操作的;优 选地该控制序列是来源于革兰氏阳性菌的序列。术语“控制序列”包括启动子或能够在宿 主细胞中激活或增强核酸分子的表达的序列。根据本发明的一个实施方案,表达构建体是适合转化进入细菌中并适合在所转化 的细菌细胞中维持和表达根据本发明的融合蛋白的细菌表达载体。本发明因而还涉及包含 任何如上所描述的核酸的载体。所述载体还可包含在细菌细胞中控制核酸表达的调节序 列。表达和克隆载体通常含有被宿主生物体识别的启动子并(共价地和)可操作地 连接到编码目的多肽的核酸。启动子是位于结构基因起始密码子上游(5')(—般在大约 100至IOOObp以内)的非翻译序列,启动子控制它们可操作地连接的特定核酸序列(如编 码本文定义的融合蛋白的核酸序列)的转录和翻译。此类启动子典型地属于两类,可诱导 型的和组成型的。可诱导型的启动子是应答培养条件某些变化(例如存在或缺失养分或温度变化)而起始它们控制下的核酸的增加水平的转录的启动子。目前,多种潜在的宿主细 胞识别的大量的启动子是众所周知的。通过使用限制性酶消化,除去来自于来源核酸的启 动子,并将分离的启动子序列插入到载体中,将这些启动子可操作地连接到编码目的多肽 的核酸。既可使用天然存在的启动子序列,也可使用许多异源启动子来指导目的多肽的扩 增和/或表达。一般而言,含有来源于与宿主细胞相容物种的启动子和控制序列的质粒载 体与这些宿主一起使用。载体通常载有一个或多个复制位点以及标记序列,后者能够在所 转化的细胞中提供表型选择。 适合与原核生物宿主一起使用的启动子示例性地包括β -内酰胺酶和乳糖启动 子系统,碱性磷酸酶,色氨酸(trp)启动子系统和杂合启动子如tac启动子。然而,其他有 功能的细菌启动子是合适的。它们的核苷酸序列是普遍已知的,由此使得技术人员使用接 头或连接子可操作地将它们连接到编码本文定义的蛋白分泌分子的核酸,从而提供任何需 要的限制位点。用于细菌系统中的启动子。还应将Shine-Dalgarno序列可操作地连接到 编码本文定义的蛋白分泌分子的核酸。根据本发明的一个实施方案,载体包含组成型启动子。适合于根据本发明的构建 体和方法的组成型启动子的实例包括但不限于CaMV35S启动子、G0S2、肌动蛋白启动子、泛 素启动子、硫解酶启动子。根据本发明的另一个实施方案,载体包含可诱导型启动子。适合于根据本发明的 构建体和方法的可诱导型启动子的实例包括但不限于Iac启动子或木糖可诱导启动子。任选地,本表达载体将还含有终止转录和稳定mRNA必需的序列,因而可以含有一 个或多个转录终止序列。术语“转录终止序列”包括转录单位末端的控制序列,其给出3'加 工和终止转录的信号。另外的调节元件,如转录或翻译增强子,可以包含于表达构建体中。本发明的表达构建体还可以包含复制起点,其对在具体细胞类型中维持和/或 复制是需要的。一个实例是表达载体需要在细菌细胞中作为附加体遗传元件(印isomal genetic element)(例如质粒或粘粒分子)维持时。优选的复制起点包括但不限于f l_ori、 colEl ori、和革兰氏阳性菌复制起点。表达构建体可以任选地包含可选择的标记基因。当用于本文时,术语“可选择的标 记基因”包括任何基因,该基因赋予其表达所在的细胞表型从而促进对使用本发明的表达 构建体转染或转化的细胞的鉴定和/或选择。适当的标记可选自赋予抗生素或除草剂抗性 的标记或可视标记。可选择的标记基因的实例包括编码新霉素磷酸转移酶(nptll)、潮霉素 磷酸转移酶(hpt)或Basta基因。适当的可选择的标记基因的又一个实例包括针对氨苄青 霉素(AmpR)、四环素(TcR)、卡那霉素(KanR)、草胺膦和氯霉素或甲砜霉素(CAT)的抗性基 因。其它适当的标记基因提供代谢性状,例如manA。还可以使用可视标记基因,包括例如 β-葡萄糖苷酸酶(GUS)、荧光素酶和绿色荧光蛋白(GFP)。利用标准连接技术构建含有一个或多个上述列举的元件并包含所需编码和控制 序列的适当载体。以所需的形式切割、剪裁、和重连接分离的质粒或核酸片段以产生需要的 质粒。5.宿主细胞根据一方面,本发明涉及包含本文定义的多核酸或载体的宿主细胞。术语“宿主细胞”是指那些能够在培养基中生长并能够表达本文定义的多核酸,并因而能够产生和分泌本文定义的融合蛋白的细胞。本发明的宿主细胞包括体外细胞培养并 包括原核细胞。在具体实施方案中涉及微生物。根据本发明可以使用的宿主细胞的特别实 例包括细菌细胞。应当指出术语“宿主细胞”意图包括宿主细胞生活史的所有形式如芽孢。在具体实施方案中,本发明背景中预见的宿主细胞是细菌细胞,特别是革兰氏 阳性细菌细胞。术语“革兰氏阳性菌”意图包括本领域对这一术语公认的定义。革兰 氏阳性菌包括但不限于芽胞杆菌属(Bacillus)、地芽孢杆菌属(Geobacillus)、梭菌属 (Clostridium)、链球菌属(Str印tococcus)、纤维单胞菌属(Cellulomonas)、棒状杆菌属 (Corynebacterium)、乳酸杆菌属(Lactobacillis)、乳球菌属(Lactococcus)、酒球菌属 (Oenococcus)禾口真杆菌属(Eubacterium)。根据本发明的具体实施方案,所述宿主细胞是梭菌的纲的革兰氏阳性细菌细胞成 员,更优选地为梭菌属的成员。更特别地,预见的可进行遗传操作的梭菌菌株如但不限于丙酮丁醇梭菌、产芽孢 梭菌(C. sporogenes)、拜氏梭菌等。可以根据预见的应用选择宿主细胞。更特别地,本发明可用于分泌目的多肽成问 题的菌株。在一个实施方案中,所述宿主细胞是包括产溶剂性(即产生溶剂)梭菌菌株的组 的成员。根据本发明这种实施方案特别优选的宿主细胞是产生溶剂的梭菌菌株,该菌株 选自包括丙酮丁醇梭菌,例如丙酮丁醇梭菌菌株ATCC824,和拜氏梭菌,例如拜氏梭菌菌株 ATCC17778 的组。在另一实施方案中,所述宿主细胞是包括产芽孢细菌的组的成员,如但不限于芽 胞杆菌属、梭菌属(更特别地为治疗性应用,这时施用芽孢是有利的)的细菌。根据本发明 这种实施方案特别优选的宿主细胞是梭菌菌株,该菌株选自包括产芽孢梭菌,例如产芽孢 梭菌菌株DSM767,和丙酮丁醇梭菌,例如丙酮丁醇梭菌菌株ATCC824的组。根据本发明的多核酸分子或载体可以整合进入宿主细胞的基因组中,或者可以某 种形式在染色体外维持。更特别地,宿主细胞可通过本发明的表达载体转化并在常规营养培养基中培养, 该培养基进行适当修饰以用于诱导启动子、选择转化体或扩增基因。“转化”意思是将核酸 引入生物体中,从而该核酸作为染色体外元件或者通过染色体整合而是可复制的。本文中 使用的用于转化宿主细胞的方法是技术人员熟知的。培养条件如温度、PH等等是以前选择 用于表达的宿主细胞使用的那些条件,对于普通技术人员是清楚的。6.产生和分泌多肽的方法在另一方面,本申请涉及用于通过宿主细胞(优选地为细菌宿主细胞)产生和分 泌生物学活性形式的至少一个异源或同源目的多肽的方法,该方法包括在引起该编码的 融合蛋白表达的有效条件下,向所述宿主细胞中引入根据本发明的多核酸或载体,其中所 编码的融合蛋白被宿主细胞分泌到所述宿主细胞的环境中。 在分泌过程中,信号肽优选地从所述融合蛋白切割,从而将融合蛋白释放在宿主 环境(例如培养基)中。在另一方面,蛋白酶靶序列引入接头中,该接头连接运载结构域到 本文定义的功能结构域,并且目的蛋白通过蛋白酶(一个或多个)切割从而在宿主环境中释放从剩余融合蛋白切割的目的蛋白。 优选地所述宿主细胞是如上文定义的细菌宿主细胞。所述宿主细胞的环境意指其中所述细菌生长的空间。在一个实施方案中,所述细 菌的环境可以是其中所述细菌生长的培养基。在另一实施方案中,所述细菌的环境可以是 活体的组织,例如人类或动物组织,特别是在本发明涵盖的治疗性应用的情况下。本发明还涉及根据本发明的多核酸、载体或宿主细胞用于产生和分泌生物学活性 形式的目的多肽的用途。本发明还涉及本文定义的运载结构域用于控制目的多肽(优选地为本文定义的 多肽)的分泌的用途。在这一背景中,应当指出术语“控制分泌”意图包括产生、诱导和/或 改善分泌。更特别地,本发明涉及融合到本文定义的信号肽的本文定义的运载结构域用于 控制目的多肽(优选地为本文定义的多肽)通过宿主细胞分泌的用途。“改善分泌”的意思是,与使用没有运载结构域融合到本文定义的信号肽控制分泌 所获得的量相比,分泌的目的多肽的量更高,并且优选地至少2. 5、或5或10%更高。7.非治疗件应用在一个实施方案中,目的多肽是本文定义的酶。在此类实施方案中,本发明涉及根 据本发明的融合蛋白的多种非治疗性用途。在一个实施方案中,所述目的多肽优选地是本文定义的酶。在另一实施方案中,所述目的多肽优选地是本文定义的植物细胞壁降解酶,并且 甚至更优选地是本文定义的纤维素酶。在更具体的实施方案中,本发明提供根据本发明的多核酸、载体或宿主细胞的 下述用途,即,产生和分泌本文定义的植物细胞壁降解酶,并且甚至更优选地是如上文所 定义的微生物来源的纤维素酶,优选地是细菌来源,例如来自于下述细菌,交替单胞菌科 的属例如Saccharophagusdegradans菌株2-40,热单孢菌属例如来自于褐色热单孢菌, 纤维素单胞菌科的属例如粪碱纤维单胞菌,梭菌属例如来自于热纤梭菌、解纤维素梭菌、 丙酮丁醇梭菌。在另一实施方案中,纤维素酶是真菌来源的,例如来自于下述的真菌 Neocallimastigomycota 属例如来自于 N. patriciarum 或 Orpinomyces 的物禾中菌株 PC-2。甚至更优选地,本发明涉及根据本发明的多核酸、载体或宿主细胞产生和分泌生 物学活性形式的下述纤维素酶的用途,即如上文定义的解纤维素梭菌的、热纤梭菌的、丙酮 TIIitliiW^ Saccharophagus degradans在特别优选的实施方案中,本发明涉及根据本发明的多核酸、载体或宿主细胞产 生和分泌解纤维素梭菌的纤维素酶Cel48F的用途。在特别优选的实施方案中,本发明涉及根据本发明的多核酸、载体或宿主细胞产 生和分泌解纤维素梭菌的纤维素酶Cel9G的用途。在又一个特别优选的实施方案中,本发明涉及根据本发明的多核酸、载体或宿主 细胞产生和分泌Saccharophagus degradans的纤维素酶Cel5H的用途。8.治疗性应用本发明的又一个方面涉及根据本发明的运载构建体和包含运载构建体的宿主细 胞的治疗性应用。在具体实施方案中,目的多肽是本文定义的治疗性蛋白。在此类实施方案中,本申请优选地涉及根据本发明的融合蛋白的多种治疗性用途。 已经显示经典治疗难以到达的实体瘤中的无血管缺氧/坏死区,该区为专性厌氧 菌的生长和繁殖提供了适当的环境。更特别地已经证明,静脉注射梭菌的芽孢在全身扩 散,但仅仅遇到实体瘤缺氧环境的那些继续萌发和繁殖(Mose和Mose,1964 ;Carey等人, 1967)。因而梭菌的芽孢是癌症中药物递送的理想载体。然而,通过梭菌的药物-递送遇到 的主要问题是分泌性蛋白的水平。本发明通过提供下述系统从而提供了解决这种问题的方 法,该系统允许包含目的多肽的融合蛋白通过微生物(如梭菌)分泌。因此,本发明提供根据本发明的多核酸、载体或宿主细胞用于产生和分泌本文定 义的治疗性蛋白的用途。在具体实施方案中,治疗性蛋白选自包括治疗性酶、细胞因子、和 抗体的组。根据具体实施方案,本发明涉及编码融合蛋白(其包含根据本发明的治疗性蛋 白)的多核酸和包含该多核酸的宿主细胞的下述用途,即用于通过重组微生物产生和分泌 细胞因子(更特别地为生物活性形式的细胞因子)的用途。更特别地,本发明涉及编码融合蛋白(其包含根据本发明的治疗性蛋白)的多核 酸和包含该多核酸的宿主细胞的下述用途,即用于通过重组微生物产生和分泌选自包括 IL-2、IL-12、GM-CSF和TNF- α的组的细胞因子的用途。在又一个实施方案中,治疗性蛋白是前药转化酶。在又一方面,本发明涉及药物组合物,该药物组合物包含治疗活性量的根据本发 明的多核酸、载体或宿主细胞、更特别地为重组微生物,和至少一种药学上可接受的载体, 该载体即,例如一种或多种药学上可接受的载体物质和/或添加剂,例如缓冲液、载体、赋 形剂、稳定剂等。更特别地,重组微生物是细菌芽孢的形式,最特别地为梭菌芽孢。术语“治疗有效量”当用于本文时意思是多核酸、载体或宿主细胞(即重组微生物 或其芽孢)在组织、系统、动物或人类中激发研究者、兽医、医学博士或其他临床医生所寻 求的生物学或医学反应的量。术语“药学上可接受的”当用于本文时与本领域中一致,意思是与药物组合物的其 他成分相容并且对其接受者无害。适当的药学上可接受的载体是本领域技术人员熟知的, 例如可以选自蛋白如胶原或明胶,糖如淀粉、多糖、糖(右旋糖、葡萄糖和蔗糖),纤维素衍 生物象钠或钙羧甲基纤维素、羟丙基纤维素或羟丙基甲基纤维素,预胶化淀粉,果胶琼脂, 角叉藻聚糖,粘土,亲水胶(金合欢树胶、瓜尔豆胶、阿拉伯胶和黄单胞菌胶),海藻酸,藻酸 盐,透明质酸,聚乙醇酸和聚乳酸,葡聚糖,果胶,合成聚合物如水溶性丙烯酸聚合物或聚乙 烯吡咯烷酮,蛋白聚糖,磷酸钙等等。药学制剂还可以包含添加剂,例如填充剂、崩解剂、粘合剂、润滑剂、润湿剂、稳定 齐U、乳化剂、分散剂、防腐剂、甜味剂、着色剂、调味剂、芳香剂、增稠剂、稀释剂、缓冲物质、溶 齐 、增溶剂、获得储藏效果的试剂、改变渗透压的盐、包被剂或抗氧化剂。所使用的本文定义的多核酸、载体或宿主细胞的剂量或量取决于个体案例,按惯 例将根据个体情况调整以获得最佳效果。因而,其取决于待治疗病症的性质和严重性,也取 决于待治疗的人类或动物的性别、年龄、体重和个体反应性,取决于所用化合物的效应和作 用时间长度,取决于治疗是否为急性或慢性或预防性的,或取决于除了本文定义的多核酸、 载体或宿主细胞外是否施用其它活性化合物。
药物化合物的制备可根据本身已知的方式进行。为此目的,将本文定义的多核酸、 载体或宿主细胞和一种或多种固体或液体药学载体物质和/或添加剂(或辅助物质)一 起,并且如果需要,联合其它具有治疗或预防作用的药学活性化合物,制成适当的施用形式 或剂型,其然后可在人类医学中作为药物使用。根据本发明的药物组合物优选地胃肠外施用,例如以注射或输注液的形式皮下、 肌内或静脉内施用。其它适当的施用形式是例如微型胶囊剂、埋植剂或栓剂。用于制备溶液(例如注射液)的适当的载体是,例如水,生理氯化钠溶液,醇类如 乙醇,甘油,多元醇,蔗糖,转化糖,葡萄糖,甘露醇,植物油等。还可以冻干本文定义的宿主 细胞并使用产生的冻干物,例如用于制备注射用制剂。微型胶囊剂、埋植剂或栓剂的适当的载体是,例如羟基乙酸和乳酸的共聚物。在特别优选的实施方案中,根据本发明的药物组合物是可注射的。组合物可以例 如在肿瘤位点施用(注射)。此类应用使得包含在药物组合物中的产品(即本文定义的多 核酸、载体、宿主细胞)能够递送到肿瘤细胞。向肿瘤细胞递送的化合物(例本文定义的多 核酸、载体、宿主细胞)优选地在数月,或甚至数年的过程中每周注射一次或数次。在另一个特别优选的实施方案中,为了递送产品(即本文定义的多核酸、载体、宿 主细胞)到癌症类型的细胞的肿瘤中,根据本发明的药物组合物可使用贮存器(如微泵) 递送。另外,本发明涉及作为药物使用的根据本发明的多核酸、载体或宿主细胞。换言 之,本发明还涉及根据本发明的多核酸、载体、或宿主细胞作为药物的用途。在又一个实施方案中,本发明涉及用于治疗癌症的根据本发明的多核酸、载体、或 宿主细胞。更特别地,本发明涉及根据本发明的多核酸、载体、或宿主细胞在制备治疗癌症 的药物中的用途。在一个实例中,由于梭菌芽孢能够在肿瘤附近萌发和发育,如本文公开的经工程 化的重组梭菌可用于癌症治疗。根据本发明可治疗多种类型的癌症。本发明因此还涉及治疗有其需要的受试者的 癌症的方法,该方法包括向所述受试者(优选地在所述受试者中的肿瘤位点)引入根据本 发明的宿主细胞。实际上,本发明因而包括在有其需要的受试者中的肿瘤位点引入能够表 达根据本发明的多核酸的重组宿主细胞;并且因而能够在宿主中的肿瘤位点产生根据本发 明的目的多肽。本发明因而提供将包含在本文定义的多核酸、载体、宿主细胞或药物组合物 中的产品(即治疗性蛋白(如例如细胞因子))选择性递送到肿瘤细胞中。基于如下事实, 即实体瘤在它们发展的某些阶段具有严重缺氧和坏死的特征,此类输送系统被认为是有价 值的抗癌策略。由于直接递送产品到肿瘤,相信此类治疗可避免对正常组织的毒性并改善 对肿瘤细胞的杀灭。参照下述非限制性实例将更进一步理解本发明。 实施例除非另有说明,本发明的实施将利用重组DNA技术、分子生物学、生物学试验等等 中使用的常规技术,这属于本领域的技术范围,此类技术在文献中有完全的说明。 实施例1 异源和有毒的纤维素酶的分泌
这一实施例示例性说明通过丙酮丁醇梭菌分泌根据本发明的目的多肽,特别是纤 维素酶。进行了多种构建,并且这些中最相关的构建图示于图1中。 在第一构建体中,编码从解纤维梭菌获得的纤维素酶Cel48F的多核酸融合到编 码运载结构域的多核酸,该运载结构域包含解纤维素梭菌的CipC的CBM3a组件、X组件 (Xe)、和黏结蛋白1组件。该构建体还含有解纤维素梭菌的CipC支架蛋白的信号肽。使用 适当的接头序列将不同组件相互连接。在第二构建体中,编码从解纤维素梭菌获得的纤维素酶Cel48F的多核酸融合到 编码运载结构域的多核酸,该运载结构域包含解纤维素梭菌的CipC的CBM3a和一个X组件 (Xe)。该构建体还含有解纤维素梭菌的CipC支架蛋白的信号肽。使用适当的接头序列将 不同组件相互连接。在第三构建体中,编码从解纤维素梭菌获得的纤维素酶Cel9G的多核酸融合到编 码运载结构域的多核酸,该运载结构域包含解纤维素梭菌的CipC的CBM3a和一个X组件 (Xe)。该构建体还含有解纤维素梭菌的CipC支架蛋白的信号肽。使用适当的接头序列将 不同组件相互连接。作为对照,制备下述构建体,该构建体包含下述多核酸,该多核酸编码从解纤维素 梭菌获得的纤维素酶Cel48F、并且编码解纤维素梭菌的CipC支架蛋白的信号肽、但没有运 载结构域或/和X组件,并且制备另一个构建体,该构建体包含下述多核酸该多核酸编码 从解纤维素梭菌获得的纤维素酶Cel9G、并且编码解纤维素梭菌的CipC支架蛋白的信号 肽,并且该多核酸融合到编码CBM3a组件但没有X组件的多核酸。另外,制备具有和不具有 C-末端锚定素结构域的构建体。上述多种构建体如下构建使用重叠延伸PCR技术(Overlap Extension PCR technique)并克隆在穿梭表达载体pS0S952 (其对抗生素红霉素赋予抗性)中,由此分别产 生质粒 pS0S952-CBM-Xc-黏结蛋白 _48F ;pS0S952-CBM-Xc_48F 和 pS0S952-CBM-Xc_9G。该 构建体通过测序验证,并在体内甲基化。随后甲基化的载体用于电转化丙酮丁醇梭菌菌株 ATTC824。显示携带前两个构建体的丙酮丁醇梭菌菌株在它们的培养基中以大约0. 5mg/L 的量分泌含有纤维素酶Cel48F的融合蛋白。此外,携带第三构建体的丙酮丁醇梭菌菌株在 其培养基中也以大约0. 5mg/L的量分泌含有纤维素酶Cel9G的融合蛋白。然而,没有运载 结构域(CBM+X组件)仅仅包含具有信号序列的纤维素酶的构建体对细胞是有毒的(即无 分泌)。C-末端锚定素结构域的存在没有改变这一点。这些结果显示,当通过基因工程将纤维素酶Cel9G或Cel48F融合到来自于解纤维 素梭菌的支架素CipC的信号序列和两个组件(CBM和X)或三个组件(CBM、X和黏结蛋白) 时,该嵌合酶被丙酮丁醇梭菌产生并分泌在培养基中。工程化纤维素酶的分泌产量估计在 大约0. 3-0. 5mg/L。这些数值是基于培养物上清对纤维素的活性。备选地,培养物上清中异 源纤维素酶的浓度也通过变性条件下聚丙烯酰胺凝胶电泳分析然后通过密度计分析来估 计。CBM存在的优点是允许目的蛋白快速地在微晶纤维素柱上从培养物上清纯化。实施例2 使用多个X组件分泌根据本发明的异源和有毒纤维素酶这是另一实施例,示例性说明根据本发明通过丙酮丁醇梭菌分泌目的多肽,特别是纤维素酶。进行了多种构建并图示于图1(下面一组),其中使用了从不同支架蛋白获得 的组件。在一个构建体中,编码从解纤维素梭菌获得的纤维素酶Cel9G的多核酸融合到编 码运载结构域的多核酸,该运载结构域包含从解纤维素梭菌的CipC蛋白获得的CBM3a和来 自于丙酮丁醇梭菌的CipA蛋白的一个X组件(Xa)0该构建体还含有解纤维素梭菌的CipC 支架蛋白的信号肽。使用适当的接头序列将不同组件相互连接。在第五构建体中,编码从解纤维素梭菌获得的纤维素酶Cel9G的多核酸融合到编 码运载结构域的多核酸,该运载结构域包含从解纤维素梭菌的CipC蛋白获得的CBM3a和 丙酮丁醇梭菌的CipA的第一(Xa)和第二(Xa’)X组件。该构建体还含有解纤维素梭菌的 CipC支架蛋白的信号肽。使用适当的接头序列将不同组件相互连接。这些构建体如下构建使用重叠延伸PCR技术并克隆在穿梭表达载体 pS0S952(其对抗生素红霉素赋予抗性)中,由此分别产生质粒pS0S952-CBM-Xa-9G和 pS0S952-CBM-Xa-Xa’-9G。该构建体通过测序验证,并在体内和体外甲基化。随后甲基化的 载体用于电转化丙酮丁醇梭菌菌株ATTC 824。显示携带这两个构建体的丙酮丁醇梭菌菌株在它们的培养基中以相关的量产生 含有纤维素酶Cel9G的融合蛋白。这些结果也显示,当通过基因工程技术将纤维素酶Cel9G 融合到来自于解纤维素梭菌的支架素CipC的信号序列和CBM,并且融合到来自于丙酮丁醇 梭菌的CipA的一个或两个X组件时,嵌合酶被丙酮丁醇梭菌产生并分泌在培养基中。这表 明来自于丙酮丁醇梭菌的CipA的X组件也具有与丙酮丁醇梭菌分泌有关的运载属性。申 请人还显示使用多于一个X组件对分泌具有有益效果。对装载有载体pS0S952-CBM-Xa-9G 和pS0S952-CBM-Xa-Xa’-9G的菌株,融合纤维素酶的分泌产量估计分别在1. 9和3. 5mg/L。 培养物上清中异源纤维素酶的浓度也通过变性条件下聚丙烯酰胺凝胶电泳分析然后通过 密度计分析来估计。^mm 3. emmm^B^^mmmm^m这是另一实施例,示例性说明根据本发明通过丙酮丁醇梭菌分泌目的多肽,特别 是来自于Saccharophagus degradans的纤维素酶。进行了多种构建并图示于图2,其中使 用了从不同支架蛋白获得的组件。在第一构建体中,将适合于丙酮丁醇梭菌密码子偏好并编码来自于 Saccharophagus degradans的纤维素酶Cel5H的合成多核酸融合到编码运载结构域的多 核酸,该运载结构域包含从丙酮丁醇梭菌的CipA蛋白获得的CBM3a组件、第一(Xa)和第二 (Xa’)X组件和解纤维素梭菌的CipC支架蛋白的信号肽。使用适当的接头序列将不同组件 相互连接。天然Cel5H多肽的结构域结构可概括为GH5-PSL-CBM6-EPR-DZ,其中GH5代表其 糖苷水解酶家族5结构域,PSL代表聚丝氨酸接头,CBM6代表糖-结合组件家族6结构域, EPR代表富含_谷氨酸_脯氨酸区,以及不被这种解释所限制,DZ表示被本发明人鉴定为推 测的糖_结合组件的C-末端结构域。 这种构建体如下构建使用重叠延伸PCR技术并克隆在穿梭表达载体pS0S952(其 对抗生素红霉素赋予抗性)中,由此产生质粒pS0S952-CBM-Xa-Xa’-5H。该构建体通过测序 验证,并在体内和体外甲基化。随后甲基化的载体用于电转化丙酮丁醇梭菌菌株ATTC 824。
通过丙酮丁醇梭菌分泌的附加有来自于解纤维素梭菌的支架素CipC的信号肽的 野生型Cel5H蛋白为0. 5-0. 9mg/L(数值是基于培养物上清对于对-硝基苯基-纤维二糖 苷(para-nitrophenyl-cellobioside)的活性)。然而,携带两个编码融合蛋白的构建体 (该融合蛋白包含连接到运载结构域的Cel5H蛋白)的丙酮丁醇梭菌菌株在它们的培养基 中以显著更高的量(更特别地达到6. lmg/L)分泌含有纤维素酶5H的融合蛋白(数值是基 于培养物上清对于对-硝基苯基-纤维二糖苷的活性,参见图3)。这些结果又一次证明,当 通过基因工程将异源(即,非-梭菌的)纤维素酶Cel5H融合到来自于解纤维素梭菌的支 架素CipC的信号序列和CBM,并且融合到来自于丙酮丁醇梭菌的CipA的一个或两个X组件 时,嵌合酶被丙酮丁醇梭菌产生并分泌在培养基中。棚列4. iif日月擁H日月細千麵白■牛。使用分子生物学技术将编码实施例2和3中描述的不同蛋白构建体的DNA扩增并 克隆在大肠杆菌表达载体(pET22b(+),NOVagen)中。使用所产生的载体转化大肠杆菌菌株 BL21(DE3) (Novagen)。在所有案例中,在重组蛋白的C-末端终端移植六个His密码子以促 进它们在镍树脂(Ni-NTA,Qiagen)上的纯化。重组菌株在LB培养基(Luria Bertani medium)中培养并且克隆基因的表达使用 IPTG作为诱导物触发。通过变性聚丙烯酰胺凝胶电泳(SDS-PAGE)验证重组蛋白的合成。 离心培养物并在弗氏细胞压碎器(French press)中破坏收获的细胞。通过在Ni-NTA(Qiagen)上装载粗提取物纯化重组蛋白,使用渐增浓度的咪唑 鐵盐(imidazolium)洗脱目的蛋白。使用 FPLC Q_s 印 harose (Hitrap Q HP resin, GE Healthcare)完成纯化。纯化的酶的活性在微晶纤维素(Avicel)上使用标准条件(37°C )测试。结果显示 于图4和5b中。备选地,活性在对-硝基苯基-纤维二糖苷上测量,结果表示于图5a中。实施例5 治疗性蛋白的分泌。这是另一实施例,示例性说明根据本发明通过丙酮丁醇梭菌分泌目的蛋白,特别 是来自于大鼠的治疗性蛋白白细胞介素2。进行了构建,其中使用从不同支架蛋白获得的组 件。在构建体中,编码来自于大鼠的白细胞介素2(IL2)的多核酸融合到编码运载结 构域的多核酸,该运载结构域包含从解纤维素梭菌的CipC蛋白获得的CBM3a和丙酮丁醇梭 菌的CipA的第一(Xa)和第二(Xa’)X组件。该构建体还含有解纤维素梭菌的CipC支架蛋 白的信号肽。使用适当的接头序列将不同组件相互连接。该构建体如下构建使用重叠延伸PCR技术并克隆在穿梭表达载体pS0S952(其对 抗生素红霉素赋予抗性)中,由此产生质粒pS0S952-CBM-Xa-Xa’-IL2。该构建体通过测序 验证,并在体内甲基化。随后甲基化的载体用于电转化丙酮丁醇梭菌菌株ATTC 824。显示携带这种构建体的丙酮丁醇梭菌菌株在它们的培养基中以相关的量分泌含 有大鼠白细胞介素2的融合蛋白。这些结果也显示,当通过基因工程技术将大鼠的白细胞 介素2融合到来自于解纤维素梭菌的支架素CipC的信号序列和CBM,并且融合到来自于丙 酮丁醇梭菌的CipA的两个X组件时,嵌合蛋白被丙酮丁醇梭菌产生并分泌在培养基中。这 表明来自于解纤维素梭菌的CipC的CBM和来自于丙酮丁醇梭菌的CipA的X组件也具有 与丙酮丁醇梭菌分泌来自于哺乳动物的治疗性蛋白有关的运载属性。通过在微晶纤维素Avicel柱上装载外部培养基, 从培养物上清中纯化含有大鼠IL2的融合蛋白。使用纯化水 Oiiilli(^K)从Avicel上洗脱融合蛋白,并通过质谱分析以及N-末端微序列测定确认所纯 化的重组蛋白的完整性。
权利要求
1.一种重组微生物,其包含编码由多肽序列组成的融合蛋白的多核酸,该多肽序列以 下列顺序包含-至少一个信号肽;-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖结合 组件融合到多纤维素酶体支架蛋白的至少一个X组件上;-至少一个目的多肽;-至少一个肽接头,用于连接该运载结构域到该目的多肽,其中所述微生物分泌所述目的多肽。
2.根据权利要求1的重组微生物,其来自于梭菌(Clostridia)的纲。
3.根据权利要求1或2的重组微生物,其中所述多肽序列包含两个或多个X组件。
4.根据权利要求1至3的任意一项,其中所述多纤维素酶体支架蛋白的所述信号 肽是解纤维素梭菌(C.cellulolyticum)的CipC支架蛋白的信号肽,或丙酮丁醇梭菌 (C. acetobutylicum)的CipA支架蛋白的信号肽。
5.根据权利要求1至4中任意一项的重组微生物,其中所述至少一个糖结合组件是 3a-型糖结合组件(CBM3a)。
6.根据权利要求1至5中任意一项的重组微生物,其中所述至少一个X组件是解纤维 素梭菌的CipC支架蛋白的X2组件,或丙酮丁醇梭菌的CipA支架蛋白的X2组件。
7.根据权利要求1至6中任意一项的重组微生物,其中所述至少一个目的多肽是细胞 壁降解酶。
8.根据权利要求1至7中任意一项的重组微生物,其中所述至少一个目的多肽是纤维素酶。
9.根据权利要求8的重组微生物,其中所述酶是解纤维素梭菌的纤维素酶。
10.权利要求8的重组微生物,其中所述酶是Cel48F或Cel9G。
11.根据权利要求8的重组微生物,其中所述酶是S.degradans菌株2_40的纤维素酶 Cel5H。
12.根据权利要求1至6中任意一项的重组微生物,其中所述至少一个目的多肽是选自 包括治疗性酶,细胞因子和抗体的组的治疗性蛋白。
13.根据权利要求12的重组微生物,其中所述治疗性蛋白是IL-2。
14.根据权利要求2的重组微生物,其中所述微生物是来自于选自包括丙酮丁醇梭菌 和拜氏梭菌(C. beijerinckii)的组的梭菌属(Clostridium)菌株。
15.一种通过重组微生物产生和分泌至少一种异源或同源目的多肽的方法,该方法包 括,在有效引起编码的融合蛋白表达的条件下,向所述微生物引入编码由多肽序列组成的 融合蛋白的多核酸,该多肽序列包含-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖结合 组件融合到多纤维素酶体支架蛋白的至少一个X组件上;-至少一个目的多肽;-至少一个肽接头,用于连接该运载结构域到该目的多肽,和-至少一个信号肽; 其中该编码的融合蛋白被该重组微生物分泌到所述重组微生物的环境中。
16.根据权利要求15的方法,其中所述重组微生物是梭菌的纲的微生物。
17.—种编码由多肽序列组成的融合蛋白的多核酸,该多肽序列包含-运载结构域,其包含多纤维素酶体支架蛋白的至少一个糖结合组件(CBM),该糖结合 组件融合到多纤维素酶体支架蛋白的至少一个X组件上; -至少一个目的多肽;-至少一个肽接头,用于连接该运载结构域到该目的多肽,和 -至少一个信号肽。
18.根据权利要求17的多核酸,其中所述多肽序列包含两个或多个X组件。
全文摘要
本发明描述了用于通过宿主细胞,优选地通过细菌宿主细胞,更优选地通过革兰氏阳性菌产生和分泌目的多肽的分子、构建体和方法。特别地,本发明涉及编码融合蛋白的多核酸,以及该多核酸用于通过细菌宿主细胞,优选地梭菌属(Clostridium)的细菌分泌异源或同源目的多肽的用途。本发明还涉及使用此类多核酸和融合蛋白通过宿主细胞产生和分泌目的蛋白的异源或同源多肽的方法和构建体。
文档编号C12N15/74GK102112606SQ200980130684
公开日2011年6月29日 申请日期2009年7月30日 优先权日2008年7月31日
发明者亨利-皮埃尔·菲耶罗布, 安热莉克·沙纳尔-维亚尔, 弗洛伦斯·曼加顿 申请人:国家科学研究中心, 国立应用科学学院, 地中海大学, 普罗旺斯大学, 道达尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1