用于昆虫细胞的合成的表达载体的制作方法

文档序号:570471阅读:599来源:国知局

专利名称::用于昆虫细胞的合成的表达载体的制作方法
技术领域
:本发明总的来说涉及用于在昆虫细胞中产生异源蛋白质的经改良的表达载体的设计。所述经改良的表达载体由一系列调控元件组成,所述调控元件是合成起源的,或者以提供高水平的重组蛋白质表达的方式进行优化和装配。此外,本发明还涉及利用这些经改良的表达载体来产生重组亚单位蛋白质以用于在疫苗制剂中使用。
背景技术
:已开发出了许多异源细胞表达系统来表达和分泌重组蛋白质。一般而言,使用基于真核宿主细胞的系统来表达需要正确的折叠和翻译后修饰的真核蛋白质,从而允许产生"天然样"蛋白质。存在有4种主要的通常利用的真核宿主细胞类型真菌(包括酵母)、昆虫、植物和哺乳动物。待采用的重组蛋白质表达系统的选择依赖于所需的应用。所选择的系统必须符合关键标准例如所需蛋白质产物的正确折叠和加工、一致'〖生和生产率(成本效益)(Schmidt,爿/v人#/'cro6/o/.5/ofec力/20/.(2004)65:363-372)。基于易于培养、更高的在大规模培养过程中对于重量摩尔渗透压浓度和副产物浓度的耐受性、以及一般地更高的表达水平,基于昆虫细胞的表达系统具有满足容量需求的潜力(Ikonomou等人,」;7p/.#/croWo/W0&c力/20人(2003)62:1-20)。近来,使用基于昆虫细胞的表达系统已变得更常见。这些系统提供了真核系统的所需特征中的大多数,但具有附加的益处例如更低的商品成本。昆虫细胞系统基于用昆虫病毒载体(例如杆状病毒)感染宿主细胞,或者基于通过将表达质粒整合到宿主细胞的基因组中来产生稳定的细胞系。杆状病毒表达系统(BES)已作为用于重组蛋白质表达的主要昆虫细胞培养系统而出现。这种系统基于使用源自称为杆状病毒的昆虫病毒的栽体。将这些载体用于产生编码所需蛋白质产物的重组病毒。将所述重组病毒用于感染宿主昆虫细胞,所述宿主昆虫细胞随后表达所需重组蛋白质。尽管对于这种系统来说在易于克隆和"至产物的时间"方面存在有优点,但也存在有几个缺点。在使用BES中的主要挑战是,它基于宿主细胞的病毒感染。这导致在感染后72-96小时的细胞裂解和细胞死亡(Farrell等人,Wotec/.S/oge/j.(1998)60:656-663;Deo和Park,A/ofec/wo7.^//."2'oc力e迈.(2006)43:129—135)。因此,在感染的后期过程中,昆虫细胞的加工机制被损害至所需产物的加工也被损害的程度。这限制了细胞可以产生产物的时间,并且可能更重要地导致出现正产生出的产物的经改变的形式。此外,细胞的裂解释放出细胞酶,这些细胞酶还可以影响所需产物的品质。将稳定转化的昆虫细胞用于表达重组蛋白质是对于使用BES来说的备选方案。基于稳定转化的昆虫细胞系的表达系统是非裂解性的,并且使得能够稳定地长期生产需要正确的折叠和翻译后修饰的分泌型料,并且允许最:的i白;产二用基本方法进行純化。这导致获得具有更高品质的产物(Kirkpatrick和Shatzman,Ceie^r/7res"'aoiys^e迈s.'^y/刀g^afwre尸orf力e^^rpress/o"(1999)pp289-330)。黑腹果蝇(/^wo;力y7a迈e/a;30^2Wer)细胞表达系统("果蝇表达系统")是已建立的异源蛋白质表达系统,其基于使用包含果蝇启动子的表达载体和果蝇S2细胞("S2细胞")(Schneider,f/z^iyo/.^T.#0/77力.(1972)27:353-365)。用这些载体转化S2细胞,以便建立稳定细胞系,该稳定细胞系表达相应于被引入载体中的异源序列的蛋白质(Johansen,H.等人,Ce/z"Zer.(1989)3:882-889;Ivey—Hoyle,M.,O/rr.6^//."/ofec/wo/.(1991)2:704—707',Culp,J.S.等人,WWec/wo/og/^V"(1991)9:173-177;美国专利5,550,043;5,681,713;5,705,359;6,046,025)。这种昆虫细胞表达系统已显示出成功产生了来自不同来源的许多蛋白质。已在果蝇S2细胞系统中成功表达的蛋白质的例子包括HIVgpl20(Culp,J".S.,等人,WWec力/7o/c^/(1991)9:173-177;Ivey-Hoyle,M.,倫fe由o人(1991)2:704-707)、人多巴胺p-水解酶(Bin等人,"/oc力e瓜/.(1996)313:57-64)、人血管细胞粘着蛋白(Bernard等人,O^ofec/wo/.(1994)15:139-144)。在这些例子的每一个中,表达水平大于先前所利用的其他表达系统。除了高水平的表达外,果蝇表达系统已显示能够表达保持了天然样生物学功能的异源蛋白质(Bin等人,"/oc力e瓜/.(1996)313:57-64),(Incardona和Rosenberry,A/o厶Ce//.(1996)7:595-611)。借助于X射线晶体学研究,更近期的例子显示,这种表达系统能够产生具有天然样结构的分子(Modis等人,yVs〃.力c".蹈(2003)100:6986-6991),(Modis等人,#"謡(2004)427:313-319),(Xu等人,Cr/"a"(^t.频o厶CiT"a"o《r(2005)61:942-950)。两个其他的近期出版物也证明了果绳表达系统产生高品质产物的能力。在第一篇报道中,Schmetzer等人(/.//z朋wl(2005)174:942-952)就蛋白质折叠和天然构象而言将由杆状病毒表达的EpCAM蛋白与由果蝇表达的EpCAM蛋白进行比较。特别地,将由BES表达的EpCAM和由果蝇表达的EpCAM与变性的由果蝇表达的EpCAM进4亍比较。确定了,相对于未变性的和变性的由果蝇表达的EpCAM蛋白而言,由BES表达的EpCAM处于部分折叠的状态。这编码,由BES表达的蛋白质处于不完全折叠的状态。另一方面,由果蝇表达的EpCAM蛋白采取更完全折叠的状态。这篇文章的作者认为由果蝇表达的蛋白质处于"天然的"状态,而由杆状病毒表达的蛋白质则不是。在第二篇报道中,Gardsvoll等人(尸rW.户"r/尸.(2004)34:284—295)证明,尿激酶型纤溶酶原激活物受体(uPAR)在S2细胞中的表达导致6在糖基化(5个N-联位点)方面比在CH0细胞中表达的uPAR更均一的产物。基于利用果蝇S2细胞作为宿主细胞来表达异源蛋白质的一批工作,清楚地知晓,这些细胞具有许多在表达系统中所希望的特征。在对于利用这些细胞来产生重组蛋白质的公开报道所进行的综览中,蛋白质产物的表达水平通常为5-50jig/ml。为了具有可以满足生物技术制造的严苛需要的蛋白质生产系统,希望更高的表达水平。为了达到始终如一地较高的表达水平,要求优化下列中的任何一个或全部宿主细胞系、生长培养基或表达载体。任何异源蛋白质表达系统的开发要求将各种调节控制元件(下文,备选地称为"调控元件"或"控制元件",或者简单地称为"元件",包括各自的单数形式)装配到驱动所需重组蛋白质产物的表达的表达载体中。这些调节控制元件包括转录激活子和增强子、转录起始和终止元件、翻译起始和终止元件、以及分泌信号前导序列。用于分泌重组蛋白质产物的表达载体的5种主要的调节控制元件为l)近侧启动子,2)核心启动子,3)5,非翻译区,4)分泌信号肽,和5)3,非翻译区。对于这些元件中的每一种,必须首先独立地进行任何优化。一旦独个元件进行了优化,它们就必须进行装配和测试,以确保给定元件的装配是相容的并且能够指导所需重組蛋白质产物的有效表达。在元件的各种组合的装配中,还重要的是,这些元件是"有效连接的"。"有效连接的,,是指各种元件之间以这样的方式的功能性连接,所述方式保留了各个元件的功能以及组合的元件的功能,因为许多转录和翻译功能是从一个元件到下一个元件进行处理的结果。因此,"有效连接的"意指,各种元件的核酸序列是相连接和邻接的,并且在需要时邻接地进行连接以保持合适的编码蛋白质的读码框。尽管已开发了许多成功的表达载体,但经完全优化的系统较不常见。此外,大多数开发出的系统基于使用天然存在的序列,即各种调控元件取自现有的(天然存在的)基因序列。经过过去数年,合成序列的使用已被用作用于开发经优化的表达载体的手段。"启动子"由两个基本部分(核心启动子和近侧启动子)组成。启动子位于给定基因的编码序列的上游。核心启动子被定义为能够指导给定基因的精确转录起始的最小核苷酸序列。真核生物中的核心启动子负责指导通过RNA聚合酶II复合物的起始。一般将核心启动子描绘为跨越转录起始位点(INR)的序列,更具体而言INR上游和下游35至45个核苷酸的序列(总长度70-90个核苷酸)。由核心启动子所界定的区域可以包含一种或多种下列保守的调节基序TFIIB识别元件(BRE)、TATA盒、起始子(initiator)(INR)、基序10元件(motiftenelement)(MTE)、下游启动子元件(DPE)和下游核心元件(DCE)。尽管在调节控制元件内的某些核苷酸序列具有包括词语"元件"的本领域公认的名称,但此类序列在本文中笼统地称为"基序";特别的本领域公认的名称(例如,BRE、MTE、DPE和DCE)在本文中具有与在所引用的参考文献中一样的含义,尽管它们在本文中被称为"基序",例如"MTE基序"。核心启动子及其组成性独个基序的作用和组成已由0hler等人(Ce/2咖e,(2002)3:1-12),Smale和Kadonaga(WeF.A/oc力e/z.(2003)72:449—479),FUzGerald等人(Ge/2歸S/o/.(2006)7:R53),Gershenzon等人(MC*Ce/2o/77/cs(2006)7:161)和Juven-Gershon等人("2'oc力e/z/.5Vc.rra/^.(2006)34:1047-1050)进行了综述。还已经报道了定义了DPE基序(Kutach和Kadonaga,Ce7/.S/o/.(2000)20:4754-4764)和MTE基序(Lim等人,Ce"esZer.(2004)18:1606-1617)的研究。尽管大多数基因的核心启动子包含以各种组合的这些基序中的一种或多种,但存在有不包含任何这些基序的小部分的基因。在来自几种生物体的核心启动子的综览中,清楚的是,不存在通用核心启动子,或者通用的包含核心启动子的基序子集;然而,INR基序是在核心启动子中发现的最常见的基序(FitzGerald等人,fe"咖e"/o人(2006)7:R53)。真核生物中的近侧启动子一般被定义为紧在核心启动子上游的序列。近侧启动子的长度是高度可变的。近侧启动子由征募转录因子的转录激活子基序组成,而所述转录因子又激活与核心启动子区结合的聚合酶起始复合物。转录激活子基序的性质和数目对于给定启动子来说是高度变化的。可以通过系统性地置换和测试各种元件或基序,使用合成启动子文库,或者随机置换独个调控元件或基序来进行启动子的优化。已报等人(W"wre贝o"c力/o人(1999)17:241-245)的工作中,报道了对随机装配的转录因子结合位点驱动肌特异性启动子的转录进行评估的方法。Edel歸n等人(/Voc.5W.(2000)97:3038-3043)描述了高通量选择操作程序,以选择增强核心启动子的转录活性的合成的近侧启动子。Tornoe等人(Ce/e(2002)297:21-32)建立了一組用于在哺乳动物细胞中使用的合成启动子,其将病毒和人启动子元件相组合。所述合成的哺乳动物启动子通过下列方式来进一步进行优化置换共有序列并使其他非共有序列随机化,以获得具有可变活性的启动子。在开发用于在乳杆菌("c^6aci//^)中进行基因表达的合成启动子中,Rud等人(#/cro6.(2006)152:1011-1019)利用了列随机化,以改良启动子的性能。以这种方式,他们能够鉴定具有增力口的活性的合成启动子。在由Juven-Gershon等人(Mature#e^c>^s(2006)3:917-922)进行的工作中,经优化的核心启动子的开发通过将来自不同果蝇和病毒基因的核心启动子基序相组合来完成。这项工作集中于使用核心启动子的MTE基序(Lim等人,Ce/7esZer.(2004)18:1606-1617)。这种策略导致具有增加的转录活性的核心启动子。基于这些报道,清楚的是,需要通过实验来确定什么调控元件和组成性基序构成了功能性启动子。这包括使用何种基序组合,基序以何种顺序进行装配,以及基序和元件以何种方向插入。无论所利用的基序或元件基于合成的序列还是基于经优化的序列,这都是必需的。尽管启动子的优化已导致在表达方面的改良,但启动子仅代表了在完全功能性的和经优化的表达载体中所需要的调控元件的一个方面。信使RNA(mRNA)的5,非翻译区(5,UTR)的序列在来自真核mRNA的基因表达的转录后调节中起重要作用。mRNA的5'UTR区的序列的可变性以及各种基序和特征的重要性已得到证明(Kozak,/.#o7.5/o入(1994)235:95-110)和(Kozak,Ce/7e(2005)361:13-37)。5,UTR的性质在信息稳定性和翻译效率中起作用。给定mRNA的稳定性和可翻译性将影响有效地表达重组蛋白质的能力。因此,用于最佳地产生重组蛋白质的表达栽体的设计要求,就其在给定宿主细胞系统中以有效的方式起作用的能力来评估5,UTR。所描述的5'UTR是mRNA的一个重要部分,其由在基因启动子的3,末端中所包含的DNA序列编码。因此,在定义启动子的DNA序列的情况下,一般包括了5,UTR序列(从INR到起始甲硫氨酸密码子的区域)。mRNA的3,非翻译区(3,UTR)连同5,UTR的序列一起在基因表达的转录后调节中起重要作用。3,UTR的性质在信息稳定性、从细胞核转运至细胞质以及亚细胞定位中起作用。这些因子中的每一个可以对于给定信息的翻译效率具有影响和最终对于蛋白质表达水平具有影响。因此,用于最佳地产生重组蛋白质的表达载体的设计要求,就其在给定宿主细胞系统中以有效的方式起作用的能力来评估3,UTR。从细胞中分泌出的大多数蛋白质包含指导蛋白质进入细胞的分泌途径的N-末端信号序列。在真核细胞中,分泌信号或信号肽与内质膜相互作用以起始分泌过程。已将真核信号序列分成3个结构区域(碱性的、疏水性的和极性的),分别从N-末端开始并进行至C-末端(vonHeijne,#uc.Jc油細.(1986)14:4683-4690)和(Bendtsen等人,/.Sio人(2004)340:783-795)。经过数年,已鉴定了许多分泌信号,并用于指导重组蛋白质的分泌。尽管已使用了许多不同的信号序列并且它们显示是有功能的,但已报道了对于给定细胞类型定义了最佳序列的少数研究。充分建立了与所述三个结构区域相关的一般特征和准贝'j,々口由vonHeijne(#〃c.爿c/c^(1986)14:4683-4690)和Bendtsen等人(/.颜.A/。人(2004)340:783-795)所详细描述的,然而,关于什么构成了最佳分泌信号存在很少的比较10实验数据。大多数公开的报道涉及革兰氏阳性细菌或酵母分泌信号的表征和优化(LeLoir等人,Ce7/,ac^.(2005)4:2,以及Hofmann和Schultz,Ce/ze(1991)101:105-111)。描述了IL-2分泌信号的优化的一篇报道明确地证明了优化的益处(Zhang等人,/."e歸.(2005)7:354-365)。经优化的表达载体(其用于在昆虫细胞中使用以产生能够生产大量高品质重组蛋白质的稳定细胞系)的开发要求鉴定合适的调控元件,包括但不限于核心启动子元件,其可以用于驱动待表达的异源蛋白质的转录和翻译。此外,可以设计并利用合成的调控元件,以进一步优化表达载体的功能性。Lim等人,"脂齡.(2004)18:1606-1617;Kutach和Kadonaga,Ce//.A/o/.(2000)20:4754-4764;和Juven—Gershon等人,^/ocAe/w.Soc.rra/7S.(2006)34:1047-1050的公开内容局限于核心启动子元件,并且特别地局限于TATA盒、INR、MTE和DPE基序的新型或异源序列和/或间隔。重组蛋白质的表达的调节控制的完全优化要求,优化核心启动子中的多个调控元件,而不仅仅是基序。尽管许多调控元件对于果蝇以及其他昆虫来说是已知的,但什么构成了用于在昆虫细胞中表达异源蛋白质的最佳元件是未知的。目前的技术和方法提供了基于目前的知识体系将调控元件装配到表达载体中的可能。尽管存在这种可能,但是作为公知常识,并非如此进行的所有尝试都导致成功。在一种细胞类型中起作用的重组表达调控元件不一定在另一种细胞类型中起作用。例如,Olsen等人(0^o"c力/o/.(1992)10:157-167)评估了一系列启动子在S2细胞中驱动异源蛋白质表达的能力,并且发现仅果蝇MtnA导致微克产量的产物,尽管所测试的所有启动子显示出在其他细胞类型中起作用。在另一个例子中,基于在鳞翅目昆虫细胞中良好工作的IE启动子(Farrell等人,"/ofec力/20/."/oe/g.(1998)60:656-663)的家香(Ao/z^/i迈or/)表达载体无法足够地驱动异源蛋白质在S2细胞中的表达(未公开的数据)。因此,需要系统性的评估以确定使用S2细胞来始终如一地表达高水平的高品质异源蛋白质的潜力。在生物
技术领域
中,在有利的商品成本下有效地生产重组蛋白质的能力是获得成功的关键。为了达到使用果蝇S2细胞这个目标,需要进一步开发合适的表达载体。将多个调控元件以达到额外益处这样的合适方式进行组合可以进一步增强表达载体的效用。因此,待解决的技术问题是(l)鉴定用于包括在表达载体中的调控元件,所述表达载体能够在昆虫细胞中驱动大量高品质重组蛋白质的表达,(2)设计合成形式的功能性调控元件,其具有改良的功能,和(3)确定多个调控元件的最佳组合,从而使得该组合导致在蛋白质表达的生产率方面的额外增加。在稳定的昆虫表达系统中的进一步改良可以潜在地为其中需要大量高品质蛋白质的蛋白质制造提供新的平台,例如在用于生产亚单位疫苗(针对传染病例如流感或者具有生物恐怖主义潜力的生物体)的基于细胞的系统中。发明概述述调控元件相组合以提供在经稳定转化的昆虫细胞中异源重组蛋白质的高水平表达。特别地,本发明旨在当将黑腹果蝇S2细胞用作宿主细胞时表达异源蛋白质。下文所描述的pHBI-10(SEQ.ID.NO:10)和pHBI-ll(SEQ.ID.NO:11)表达载体由5种调控元件组成近侧启动子、核心启动子、5,UTR、分泌信号序列和3,UTR。使所述5种元件有效连接以形成表达盒。使包含在该表达盒中的调节控制元件各自就在果蝇S2细胞中的使用进行优化;然而,由于这些序列的经优化或合成的性质,在果蝇基因组序列中没有天然地发现定义了本发明的调控元件的核苷酸序列。本发明的表达载体能够指导异源蛋白质的高水平表达和分泌到经转化的细胞的培养基中。特别地,所描述的表达载体包含l)合成的经优化的诱导型近侧启动子,2)合成的经优化的RNA聚合酶II核心启动子,3)截短的且经优化的5,UTR序列,4)合成的经优化的分泌信号序列,和5)经优化的3,UTR序列。本发明还提供了用于将异源基因序列克隆到所述经优化的表达载体中并利用所述经优化的表达载体来转化昆虫细胞的方法,这导致分泌出高水平的保持了天然样结构的重组蛋白质。附图简述图1。3XRMRE-3XRMRE-SCPl-TolloMTE-A111合成启动子的序列。标明了近侧和核心启动子区中的每个调节基序。图2。3XRMRE-3XRMRE-SCP7合成启动子的序列。标明了近侧和核心启动子区中的每个调节基序。图3。pMTtPA、pHBI-10和pHBI-11表达栽体的比较。关于每种载体的调节控制元件在表3中列出。图4。pHBI-10质粒图谦。显示了完整质粒的质粒图谱。pHBI-10载体包含合成的核心启动子TolloMTE-Alll。图5。pHBI-ll质粒图谱。显示了完整质粒的质粒图i普。pHBI-ll载体包含合成的核心启动子SCP7。发明详述本发明提供了已组合到表达载体中的一系列经优化的调控元件,所述表达载体用于驱动从昆虫细胞进行高水平的高品质蛋白质的表达,所述昆虫细胞已用携带待表达的蛋白质的基因序列的这些表达载体稳定转化。在单个表达载体中使用合成的且经优化的调控元件导致获得这样的能力,即以提供关于所表达的产物而言有利的商品成本的水平在稳定的昆虫表达系统中可靠且快速地产生重组蛋白质。术语"调控元件"(或"调节控制元件"或"控制元件",或者简单地"元件")是指表达载体的这样的区段,该区段在给定基因序列的所得蛋白质产物的表达中所牵涉的转录和/或翻译过程之中具有已知功能。调控元件不同于术语"调节基序,,(或简单地"基序"),术语"调节基序"是指用作结合位点或标记出过渡位点的指定序列。一般而言,调控元件由多个调节基序组成。术语"合成的"调控元件是指未被发现天然存在的序列。更具体而言,本文所描述的合成的元件未在果蝇的基因组序列中发现。术语"经优化的"调控元件是指这样的序列,其源自天然存在的序列并且已被改变以增强其功能。经优化的调控元件的特定序列不代表所述经优化的序列所源自的序列的天然存在的变体;因此,经优化的调控元件(和其中的基序)也可以被称为是合成的。"表达盒"意指启动子元件与有效连接的其他转录和翻译调节控制元件的组合。可以将异源基因序列插入到表达盒中以用于表达所述基因序列的目的。表达盒能够指导转录,该转录导致产生关于所需基因产物的mRNA。将表达盒插入到质粒中以产生表达载体。这样的表达载体指导异源蛋白质在宿主细胞中的表达。术语"经转化的"是指由DNA介导的细胞转化。这是指在所引入的DNA整合到细胞的基因组中后而产生稳定细胞系的过程之中将质粒DNA引入到昆虫细胞中。这个术语用于代替常常在相同情况下使用的术语"转染"。我们对于将质粒DNA引入到培养的细胞中使用术语"转化",以区别于最初称为转染的将病毒DNA引入到培养的细胞中。因为在本发明的表达载体中不存在病毒DNA序列并且将这些表达载体引入到细胞中不导致产生病毒样颗粒或细胞裂解,所以术语"经转化的,,是优选的。"表达"或"表达的"意指使用表达载体和宿主细胞例如果蝇S2细胞来产生蛋白质以生产重组蛋白质产物,所述重组蛋白质产物可作到「^.、-'、土、ia"分泌"意指表达出的重组蛋白质从培养的宿主细胞中分泌到培养基中。经表达和分泌的蛋白质是下列操作的结果将给定基因序列14200880021845.1与表达盒有效连接,从而使得所述序列编码给定蛋白质。术语"产物"指由宿主细胞表达的任何重组蛋白质(全长或其亚基),在所述宿主细胞中引入了携带编码该产物的基因序列的表达载体。昆虫细胞是备选的真核表达系统,其提供表达经正确折叠和翻译后修饰的蛋白质的能力,而同时提供简单且相对廉价的生长条件。使用经稳定转化的昆虫细胞表达系统提供了超过基于宿主昆虫细胞的杆状病毒感染的那些表达系统的益处。在此基础上,选择S2细胞作为所选择的昆虫宿主细胞。因此,对于经稳定转化的昆虫细胞而言来优化进行的分析的数据。在本发明的一个优选的实施方案中,表达载体的核心启动子被定义为跨越转录起始位点UNR)的序列,更具体而言INR上游和下游35至45个核苷酸的序列(总长度70-90个核苷酸)。将INR基序的"A"(腺噪呤)核苷酸指定为+1。本发明的核心启动子包含有在自然界中未发现的基序组合。这些核心启动子由已知的调节基序组成;然而,基序的组合是独特的,并且几个在本发明的核心启动子中的基序基于共有序列并且进一步地当相组合从而形成核心启动子调控元件时就最佳功能进行调整。在本文所描述的表达载体的核心启动子中重要的已知区域是TATA盒、转录起始位点(INR)、基序10元件(MTE)和下游启动子元件(DPE)。本发明的启动子(其具有包含这4种核心调节基序中的至少3种的合成的核心启动子)呈现在SEQ.ID.NO:1、NO:2和NO:3中。在本发明中,当与合适的上游调控元件例如近侧启动子相连接时,所述合成的核心启动子(SEQ.ID.NO:2和NO:3)能够驱动高水平的表达。在本发明的另外一个优选的实施方案中,5'UTR序列被定义为这样的序列,该序列从INR基序的"A"(腺嘌呤)核苷酸到紧在起始甲硫氨酸密码子之前的序列中的核苷酸。本发明的5,UTRs具有比较短的5'UTR并且在3,末端处包含果蝇共有Kozak序列。在SEQ.ID.NO:415和N0:5中呈现了这样的序列,所述序列定义了mRNA的5,UTR,所述mRNA起因于由本发明的两种合成的核心启动子所指导的转录。在本发明的另一个优选的实施方案中,在驱动核心启动子转录并且导致高水平表达的近侧启动子中所包含的上游调控元件是由多个金属应答元件(MRE)组成的合成序列。该合成的近侧启动子由通过11个核苷酸间隔开的2组3XMREs组成。所有MREs的方向为相对于转录起始而言的相反方向,如图1和2中所描绘的。这种合成的近侧启动子的序列呈现在SEQ.ID.NO:6中。在本发明的另外一个优选的实施方案中,提供了经优化的分泌信号肽序列。通过改变总长度、N-末端碱性区域以及疏水性区域的组成,设计并合成了经优化的信号肽序列以用于指导表达出的蛋白质分泌到经转化的细胞的培养基中。还设计了限制位点并且将其掺入到分泌信号序列中,所述限制位点允许将蛋白质编码序列克隆到与分泌信号相同的读码框,并且不会负面地影响分泌信号切割位点。所述合成的分泌信号的氨基酸序列以及编码该肽的核苷酸序列呈现在SEQ.ID.NO:7和NO:8中。在本发明的另外一个优选的实施方案中,由本发明的表达载体所产生的mRM转录物的3,UTR序列是优化形式的天然果蝇3,UTR序列,所述天然果蝇3'UTR序列源自编码高度表达且分泌的称为壳多糖酶样蛋白的蛋白质的基因(Kirkpatrick等人,C(1995)153:147-154)。壳多糖酶样蛋白是S2细胞中最丰富地表达且分泌的蛋白质之一。为此,选择编码壳多糖酶样蛋白(CLP)的基因作为用于优化3'UTR的基础。来自CLP基因的3'UTR不包含典型的多腺苷酸化信号基序AATAAA。对该3,UTR进行的修饰和截短导致更高水平的表达。本发明的3'UTR的序列呈现在SEQ.ID.NO:9中。在本发明的一个更优选的实施方案中,公开了将上文所描述的5种调控元件组合(包括转录和翻译元件)到指导在S2细胞中的高水平表达的功能性表达盒中。仅在所利用的核心启动子序列中发生变化的两种所装配的表达盒的序列呈现在SEQ.ID.NO:IO和NO:11中。16因此,本发明提供了由合成的且经优化的调控元件组成的表达载体,其能够驱动高水平的异源蛋白质表达。当用于在S2细胞中表达异源蛋白质时,所述合成的表达载体使得能够经济地生产大量的高品质蛋白质。所有合成的调节控制元件,或者合成的和野生型的调节控制元件的组合,或合成的和共有的调节控制元件的组合,或合成的、野生型的和共有的调节控制元件的组合可以在表达盒中使用。下面的实施例显示了,使用所有合成的元件产生(或"驱动")了最高水平的异源蛋白质表达。当少于所有的调节控制元件是合成的时,其余的元件采取为本领域已知对给定类型的宿主细胞起作用的野生型元件(未经优化的)。尽管上文所呈现的描述和随后的实施例主要针对将经优化的表达载体与果蝇S2细胞一起进行使用,但所述载体和方法可以应用于其他昆虫细胞系,所述其他昆虫细胞系导致在用质粒DNA转化宿主细胞后获得稳定的细胞系。作为举例说明,而不是作为限制,提供了下面的实施例。实施例下面的实施例描述了用于在昆虫细胞中使用的合成的表达载体的开发。所述实施例证明了,以在商业上适合于产品开发的水平在果蝇S2细胞中有效地表达异源蛋白质的能力。所述实施例表明了独个调控元件增强在S2细胞中表达蛋白质的能力的能力,以及为了确定何种变化促成了这些元件的增强的功能而作出的努力。下面所呈现的结果证明,不同的元件和这些元件的修饰可以导致高水平的表达或者很少或无法检测的表达。因此,功能性且有效的调控元件的选择必须通过实验来确定。因此,本文所描述的本发明是独特的,因为所描述的表达盒在组成上来说主要是合成的并且指导高水平的蛋白质表达。实施例1将非果蝇启动子用于在果蝇S2细胞中驱动异源蛋白质的表达在为了鉴定能够在S2细胞中驱动高水平的高品质产物的备选表达载体的努力中,评估了包含源自其他昆虫的启动子的表达载体。对于这个工作,利用了用于培养和转化S2细胞的标准方法(VanderStraten,#e^o&a力cT"/o人(1989)1:1-8;Culp等人,"/"e由o7og/(1991)9:173-177;Kirkpatrick和Shatzman,Ce/eimpress/'0/2te历s.'^s//2gfy_re尸ort力e力rfoT^rpre^s/o",编辑Fernandez和Hoeffler,AcademicPress,(1999)289-330)。利用了从ATCC获得的果蝇S2细胞(Schneider,/.^6iTo/.JA77.#077力.(1972)27:353-365)。S2细胞已适应于在Excel1420培养基(SAFC,StLouis,M0)中生长,并且本文所描述的所有操作程序和培养都在Excell420培养基中进行。培养物通常以1><106个细胞/ml的密度进行接种,并且在第5和7天之间进行传代。所有培养物均于26-27。C进行温育。借助于磷酸钙法,将其中插入了目的基因的表达质粒转化到S2细胞中。以20jig表达质粒对1jigpCoHygro的比率,用pCoHygro质粒共转化S2细胞,以便用潮霉素B进行选择。在转化后,选择出对于0.3mg/ml潮霉素具有抗性的细胞。一旦选择出稳定的细胞系,就对它们就合适产物的表达进行评估。为了评估表达,以2x1(^个细胞/ml接种5ml所选细胞系的培养物,并且在O.2mM硫酸铜存在下于26。C培养7天。在与细胞相联合的级分和培养基中,就重组蛋白质的表达来对培养物进行评估。通过SDS-PAGE来分开蛋白质,并且用考马斯蓝染色或者印迹至硝酸纤维素。将对于所表达的蛋白质特异的抗体用于探测Western印迹。通过SDS-PAGE凝胶的考马斯染色,在S2培养物中容易地检测到1fig/ml(1mg/L)或更大的表达水平。所测试的第一种昆虫启动子是家蚕(蚕蛾)细胞质肌动蛋白A3启动子。这种启动子已在被设计用于经稳定转化的家蚕细胞的高水平表达的表达载体中使用。除了肌动蛋白A3启动子外,表达载体pIEl/153A还包含家蚕核型多角体病毒(BmPNV)立即早期(ie-l)转录因子和BmNPV的同源重复序列3(HR3)区域(Farre11等人W"ec力.A'oe/^.(1998)60:656-663)。在转化鳞翅目昆虫细胞后,这种表达载体显示出驱动重组蛋白质的高水平表达。将编码亚单位蛋白质例如流感血凝素(HA)胞外域(H3HA-Ecto)和痴疾裂殖子表面蛋白1p42C-末端片段(MSPl-p42)的各种基因克隆到pIE/153A载体中,并且随后将所得到的重组质粒用于转化S2细胞。H3HA-Ecto序列源自H3N2流感毒林A/Fujian/411/02全长HA基因序列(HAO),其编码具有566个氨基酸残基的蛋白质。特别地,所利用的序列源自在登录号ISDN38157(ISD,www.flu.lanl.gov)中的核苷酸序列。HAO蛋白质序列包含有在N-末端的16氨基酸分泌信号序列以及C-末端的膜锚着点。为了表达可溶性H3HA-Ecto,表达了N-和C-截短的分子,其被包含在全长蛋白质的Glnn至Gly526(HA2的残基175,类似于X31晶体结构的C-末端,Wilson等人,#a"re(1981)289:366-373)的序列中。H3HA-Ecto的核苷酸和氨基酸序列以及表达详细公开在W02007/022425中。疟疾MSPl-p42序列源自恶性疟原虫(户7as/BO(^.w/z7/^/c/parw/z)的FUP才朱(Genbank登^己号M37213)。通过PCR扩增而获得的MSP-1p42编码序列编码MSP-1蛋白的氨基酸Ala^3至Ser。5。MSPl-p42的核苷酸和氨基酸序列以及表达详细公开在WO2006/026625中。当由PIE/153A载体来驱动表达时,流感和痴疾亚单位蛋白质的表达水平在S2细胞中小于1jig/ml。根据这些结果,当用于转化S2细胞时,pIE/153A载体不指导重组亚单位蛋白质的高水平表达。所测试的第二种昆虫启动子是冈比亚按蚊(^0/7/e/es^2/z6/ae)(蚊子)金属硫蛋白1启动子。为了就其在S2细胞中驱动高水平表达的能力来测试这种启动子,从果蝇表达载体pMTtPA中除去黑腹果蝇金属硫蛋白启动子区(MtnA),并且用按蚊(^70/7力e/es)启动子替代。pMTtPA表达载体以及关于将其用于在培养的果蝇细胞中表达重组蛋白质的方法描述在下列美国专利中5,550,043;5,681,713;5,705,359;6,046,025。在美国专利5,681,713中描述的质粒pCoHygro用于在共转化S2细胞后进行潮霉素选择。pMTtPA表达载体包含下述元件果蝇金属硫蛋白启动子(MtnA)、人组织纤溶酶原激活物(tPA)前原(pre-pro)信号序列、和SV40早期多腺苷酸化信号(Culp等人,Biotechnol.(1991)9:173-177)。pCoHygro质粒提供了关于潮霉素的选捧才示i己(vanderStraten等人,//#o/.j/7f/Ce//A/o/.(1989)1:1-8)。潮霉素基因处于果蝇COPIA转座元件长末端重复序列的转录控制之下。通过缺失长度为15个碱基对的^威I片段来对pMTtPA载体进行修饰,所述A/nHI片段包含外来的位点。这种被称为pMTtAXho的经修饰的载体允许利用独特的BglII和J力o/位点来定向地克隆插入片段。通过紧在tPA前原信号序列的起始曱硫氨酸密码子之前添加"'//dill限制位点和添加果蝇"共有Kozak序列"(Cavener,Y"c.Jc油b.(1987)15:1353-1361)来进一步修饰载体。特别地,将紧在ATG之前的在pMTtPA中的长度为12个核苷酸的序列TGTGAAGCAATC变成AAGCTTAACAAC(前6个核苷酸代表了^7/2din限制位点,和后6个核苷酸代表了果蝇共有Kozak序列)。该经进一步修饰的载体称为pMT-KtAXho。"'"dill限制位点允许克隆紧在tPA前原信号序列的翻译起始密码子之前的启动子序列。按蚊金属疏蛋白启动子片段源自在按蚊基因组数据库(www.ensembl.org/Anopheles—gambiae/)中的序列。特别地,长度为1833个核苷酸的启动子片段代表了在冈比亚按蚊金属硫蛋白l基因(UniProtKB/TrEMBL登录名Q52P92-ANOGA)的翻译起始密码子上游的序列。该基因可以在染色体2R上在位置11,911,992-11,912,384处发现,并且是果蝇MtnA基因的同源物。采用化学方法来合成(DNA2.0,MenloPark,CA)该核苷酸序列,其中在5,末端处添加//7/2l限制位点和在3,末端处添加i^/Kiin限制位点。用&力1和iW/3din消化pMT-KtAXho载体,以去除果蝇启动子并且用按蚊启动子替代。所得到的质粒称为pAgMT-KtAXho。然后,将H3HA-Ecto序列克隆到pAgMT-KtAXho载体中。将编码H3HA-Ecto亚单位蛋白质的pAgMT-KtAXho表达质粒用于转化S2细胞。在选择出稳定的细胞系后,就当在硫酸铜存在下进行培养时分泌形式的H3HA-Ecto蛋白质的表达来对细胞进行筛选。由按蚊金属硫蛋白启动子驱动的H3HA-Ecto亚单位的表达导致具有预期分子量的均匀的产物。尽管由按蚊启动子驱动的H3HA-Ecto的表达大于由蚕(Ao/^/jr)启动子驱动的表达,但表达水平仍被认为是低的,大约1ng/ml。这个水平比当利用果蝇MtnA启动子时H3HA-Ecto表达的水平(大约30fig/ml)低得多。实施例2设计用于果蝇S2细胞的合成的核心启动子核心启动子被定义为能够指导给定基因的转录起始的最小核苷酸序列。真核生物中的核心启动子负责指导通过RNA聚合酶II复合物的起始。一般将核心启动子描绘为跨越转录起始位点(INR)的序列,更具体而言INR上游和下游35至45个核苷酸的序列(总长度70-90个核苷酸)。5,UTR编码序列在INR处开始并且延伸直至翻译起始ATG密码子。5,UTR编码序列在长度方面是可变的,从相对较短的50个核苷酸到相当长的几百个核苷酸。如先前所描述的,核心启动子一般包含一种或多种下列序列基序TFIIB识别元件(BRE)、TATA盒、起始子(INR)、基序10元件(MTE)、下游启动子元件(DPE)和下游核心元件(DCE)。在来自几种生物体(包括果蝇)的核心启动子的综览中,清楚的是,不存在通用核心元件;然而,INR基序是最常见的(FitzGerald等人,f7e層e飾7.(2006)7:R53)。在为了制备能够指导转录(所述转录导致高水平的重组蛋白质表达)的强核心启动子的努力中,设计了用于果蝇的合成的核心启动子,其掺入有所有这些元件。利用了关于构成核心启动子的各种果蝇调节基序的共有序列。这些共有调节基序由0hler等人,Ce層"/o/o^r(2002)3:1-12;Kutach和Kadonaga,#。厶Ce/人5/o人(2000)20:4754-4764;Smale和Kadonaga,h/2.Woc力e瓜(2003)72:449-479;Lim等人,Ce/zes"e7.(2004)18:1606-1617;FUzGerald等人,Ce/20/e"/o/.(2006)7:R53;Gershenzon等人,厨Ce層i"(2006)7:161进行了描述。为了构建果蝇合成启动子,设计了包含下述果蝇共有调节基序的核心启动子包含GGGCGCC的BRE,包含TATAAA的TATA,包含TCAGTC的INR,包含CGAACGGAAC的MTE,和包含GGTTCG的DPE。将合成的核心启动子融合至按蚊金属硫蛋白15,UTR的部分。按蚊金属硫蛋白15,UTR与核心启动子的融合导致INR相对于翻译起始ATG的位置类似于果蝇MtnA启动子的那种。釆用化学方法来合成这种合成启动子,并且将其称为合成的核心启动子l(SCP1)。SCP1启动子的序列作为SEQ.ID.NO:1列出。化学合成的SCP1在其5'末端处包括J6al位点并且在其3,末端处包括iW/2dIII位点以用于克隆到现有的表达载体中。通过在MtnA启动子的TATA盒序列上游7个核苷酸处插入限制位点来进一步修饰实施例1中所描述的pMT-KtAXho表达载体。这种质粒-故称为pMT-X-KtAXho。这允许通过用J&I和"/"dill限制酶进4亍消化并且插入备选的核心启动子和5'UTR序列,来去除MtnA核心启动子(包括5,UTR)。以这种方式,将SCP1插入到pMT-X-KtAXho表达载体中。实施例3设计包含能够在果蝇S2细胞中驱动异源蛋白质表达的转录激活子元件的近侧启动子在为了上调核心启动子中的转录水平(而这又导致在S2细胞中高水平的表达)的努力中,将合成的近侧启动子设计为包含各种转录激活子元件。选择开发合成的近侧启动子而不是利用天然存在的近侧启动子以在S2细胞中使用基于在使用两种昆虫启动子的实施例1中的结果,以及还基于Olsen等人(0^Wec力/7o7o^T(1992)10:157-167)的工作,其中证明哺乳动物和病毒起源的启动子在S2细胞中并不良好地工作。因此,合成的近侧启动子被设计为包含源自果蝇启动子的调节基序。近侧启动子设计牵涉装配独个调节基序共有序列的重复或者不同共有调节基序的组合。就其当与核心启动子相连接时指导高水平转录的能力来对合成的近侧启动子进行评估。所评估的第一种类型的转录调控元件是果蝇DM复制相关元件(DRE)。编码DNA复制相关蛋白质的果蝇基因的启动子包含共有DRE序列5,-TATCGATA。特异的DRE结合因子、DNA复制相关元件因子或DREF结合至DRE,并且正向调节在DRE控制下的基因且导致高水平的表达。果蝇启动子的计算机研究(Ohler等人,^/o历e"/o/og/(2002)3:1-12)已显示,DRE元件在许多果蝇启动子中被发现。事实上,它是最常见的转录元件之一。在Hirose等人(/our/a/o尸"/'Wog/ca/CAe/z//"r/(1993)268:2092-2099)的工作中,装配了多个拷贝的DRE,并且将其连接至控制萤光素酶报道基因的果蝇MtnA核心启动子。所述DREs上调萤光素酶表达,其中表达水平随着加入的DREs的数目而增加。在包含近侧启动子的合成的DRE的设计中,使用序列CTGCCTGCW"GATTCAGG(DRE共有序列为斜体并加有下划线)。合成的DRE近侧启动子设计如下1XDRE、2XDRE和4XDRE。通过去除MtnA近侧启动子(J/wI-J6al)并且紧在MtnA核心启动子上游插入备选的近侧启动子,将包含DRE的近侧启动子克隆到实施例2中所描述的pMT-X-KtAXho载体中。DRE重复都以相同的正向方向(5,至3,)。将这些载体称为pDRE-X-KtAXho。为了评估使用这些DRE表达质粒的重组蛋白质的表达,将实施例1中所描述的H3HA-Ecto基因序列插入到这些载体中并用于评估表达水平。将编码H3HA-Ecto亚单位蛋白质的pDRE-X-KtAXho表达质粒用于转化S2细胞。在选择出稳定的细胞系后,就分泌形式的H3HA-Ecto蛋白的表达来对它们进行篩选。所有DRE近侧启动子构建体无法导致<壬{可可测量的H3HA-Ecto表达。所评估的第二种类型的转录调控元件是果蝇GAGA元件。果蝇GAGA转录调控因子因其结合交替的(GAr或(CTT序列(GAGA元件)的能力而得名。这种转录因子被认为通过重塑在受影响的基因周围的染色质结构来增加基因表达(Granok等人,C〃rreWWo/og/(1995)5:238-241)。GAGA元件在多种果蝇基因的启动子中被发现。它在这些基因的远侧、近侧和甚至核心启动子中被发现(Soeller等人,#0厶6W入5A/o^f(1993)13:7961-7970)。在Soeller等人(1993)的工作中,证明了多个GAGA元件可以驱动核心启动子的转录。设计了两种近侧启动子,其中将单个GAGA元件与DRE元件相组合。这两种设计如下GAGA-2XDRE和2XDRE-GAGA-2XDRE。与使用DRE近侧启动子一样,将这些近侧启动子插入在表达载体pMT-X-KtAXho中的MtnA核心启动子的上游。为了评估使用这些DRE-GAGA表达质粒的重组蛋白质的表达,将实施例1中所描述的H3HA-Ecto基因序列用作报道分子。将编码H3HA-Ecto亚单位蛋白质的具有DRE-GAGA组合启动子的表达载体用于转化S2细胞。在选择出稳定的细胞系后,就分泌形式的H3HA-Ecto蛋白的表达来对细胞进行筛选。这两种构建体也无法导致任何可测量的蛋白质表达。所评估的笫三种类型的转录调控元件是果蝇金属应答元件(MRE)。特异的MRE结合因子、金属应答转录因子或MTF-1结合至MRE,并且正向调节在MRE控制下的基因且导致高水平的表达。由MTF-1调节的果蝇基因的启动子包含共有MRE序列5,-TGCACAC。已证明,4个拷贝的MREs可以驱动最小启动子的转录(Zhang等人,6W人Wo人(2001)21:4505-4514)。在pMTtPAAXho表达载体中MtnA近侧启动子的缺失分析表明,具有序列5,-TCTTT^i^GCCGGC(共有序列为斜体并加有下划线)的MRE的缺失对于MtnA启动子的强度具有最大影响。因此,设计了包含一个或多个拷贝的mre序列Tcrnrg(:淵(XCCGGc的合成的近侧启动子。合成的MRE近侧启动子设计如下2X、3X、4X、5X、6X、8XMREs。这些近侧启动子设计中的MREs都以5,至3,(正向)头尾相接的方式排列。与使用DRE近侧启动子一样,将MRE近侧启动子插入在表达载24体pMT-X-KtAXho中的MtnA核心启动子的上游。为了评估使用这些合成的MRE启动子表达载体的重组蛋白质的表达,将实施例1中所描述的H3HA-Ecto基因序列插入到载体中。将编码H3HA-Ecto亚单位蛋白质的具有MRE近侧启动子的表达质粒用于转化S2细胞。在选择出稳定的细胞系后,就分泌形式的H3HA-EctQ蛋白的表达来对细胞进行篩选。因为这些构建体包含MREs,所以表达的评估要求,用0.2mMCuS04来对培养物进行诱导,并且于26。C培养7天。这些S2转化体的分析揭示,随着MRE单元的数目增加,基因表达的水平也增加,直至在使用6XMRE时达到最大值。在使用8X时,表达水平减少。因此,利用合成的MRE近侧启动子的表达的进一步分析基于6XMRE设计。使用6XMRE合成的近侧启动子,制备了一系列表达构建体,其允许将天然的MtnA近侧启动子与合成的6XMRE近侧启动子进行比较。在该一系列的表达构建体中,使这两种近侧启动子连接至三种不同的最小或核心启动子1)果蝇MtnA,2)按蚊MtnA,和3)实施例2中所描述的SCP1。然后,将所得到的6种构建体与H3HA-Ecto报道基因相连接。当比较给定独个核心启动子中的每一种时,6XMRE和DmMtnA近侧启动子都能够驱动flu基因的表达水平至相等的水平。例如,6XMRE近侧-MtnA核心和DmMtnA近侧-MtnA核心导致H3HA-Ecto蛋白的相等水平的表达。使用6XMRE近侧启动子的这个数据表明,可以设计出功能性的合成的近侧启动子,尽管使用在这个实施例中所测试的前两种转录激活子时遭到失败。6XMRE与DraMtnA近侧启动子的比较还揭示,在包含MtnA核心启动子的构建体中H3HA-Ecto的表达水平为包含SCP1的那些构建体的大约4倍。因此,作出了努力,以评估备选的核心启动子(如实施例4中所描述的)以及进一步优化合成的核心启动子(如实施例5中所描述的)。实施例4对"超级核心启动子"在果蝇S2细胞中驱动异源蛋白质表达进行评估Juven-Gershon等人("re#e(2006)3:917-922)描述了称为"超级核心启动子"的核心启动子的设计和分析,该核心启动子在后生动物宿主细胞中指导高水平的通过RNA聚合酶II的RNA转录。相同的"超级核心启动子"的使用也公开于PCT申请PCT/US2006/020394(Kadonaga和Gershon,优先权日为2005年5月25日)中。这些出版物中所描述的"超级核心启动子"将被称为"Kadonaga核心启动子"或"KCP"。Kadonaga核心启动子由最小启动子组成,所述最小启动子包含INR和MTE元件,并且任选地包含TATA和/或DPE元件,它们源自几种不同的果蝇和病毒基因。在KCP核心启动子和本说明书中所描述的核心启动子之间在设计方面存在有相似性,因为两者都严重依赖于首先描述了果蝇MTE调节基序的"GenesandDevelopment"的文章(Lim等人,Ce編紋(2004)18:1606-1617)。Kadonaga核心启动子被描述为可用于在后生动物宿主细胞中的异源蛋白质表达,所述后生动物宿主细胞包括果蝇S2细胞。因此,我们在HawaiiBiotech,Inc.制备了包含Kadonaga核心启动子的3种构建体,以测试Kadonaga核心启动子在经稳定转化的S2细胞中表达异源蛋白质的情况下的功能性。合成Kadonaga核心启动子,其中具有合适的侧翼限制位点。将KCP合成序列插入到实施例9中所描述并且由SEQ.ID.NO:10所定义的HBI-IO表达载体中,从该表达栽体中去除了近侧和核心启动子序列。所得到的KCP/HBI-10杂合表达载体包含与1R5L(SEQ.ID.NO:7)分泌信号、H3HA-Ecto报道基因和0p-CLP-3,UTR(SEQ.ID.NO:9)连接的KCP。KCP/HBI-10载体不包含近侧启动子。因此,从这种"基础KCP/HBI-10杂合载体"制备了两种额外的构建体,除了KCP外,在第一种额外的构建体中还包含6xMRE近侧启动子("6xMRE/KCP/HBI-10"),以及在第二种额外的构建体中,还包含26巨细胞病毒(CMV)增强子("CMV/KCP/HBI-10");每种近侧启动子插入在紧在KCP序列上游处。所述CMV增强子与在Juven-Gershon等人(A"wreVeMo^y(2006)3:917-922,对于其来说Dr.Kadonaga是相应的作者)中所使用的相同。将这三种构建体一式三份地转化到果蝇S2细胞中,并且测定H3HA-Ecto的表达水平。单独的(无近侧启动子或增强子)两种构建体CMV/KCP/HBI-10和KCP/HBI-10显示出最低水平的H3-HA-Ecto表达,即<1ng/ml。因此,这个数据表明,l)单独的KCP提供了低水平的分泌型蛋白质表达,和2)这个表达水平在经转化的果蝇S2细胞中并没有通过CMV增强子而得到增强或增加。6xMRE/KCP/HBI-10构建体导致以在粗制上清液中2-3ug/ml的水平表达和分泌出H3-HA-Ecto蛋白。使用6xMRE-SCPl的类似构建体的先前实验导致以10ug/ml或者以连接至相同6XMRE近侧启动子的KCP的约略2-3倍的水平表达出相同的H3-HA蛋白。因为这两种构建体之间的差异仅是核心启动子,所以可以得出结论,实施例2和3中所描述的SCP1提供了这样的分泌型异源蛋白质的表达水平,所述表达水平为在经转化的果蝇S2细胞中由于使用Kadonaga核心启动子和6xMRE近侧启动子而产生的表达的大约2-3倍。在Lim等人(Ce扁齡.(2004)18:1606-1617)或Juven-Gershon等人(射訓(2006)3:917-922)参考文献中未公开MRE或基于MRE的近侧启动子的使用。就在哺乳动物细胞中的使用,对Kadonaga核心启动子进行优化。关于在HeLaS3细胞中使用KCP所呈现的数据局限于瞬时转染和使用灵敏的荧光测定法;因此,基于在稳定转化果蝇细胞后用KCP核心启动子获得的结果,瞬时转染和灵敏的报道分子测定法的使用并不表示在所有细胞类型中以高水平表达和分泌异源蛋白质的能力。KCP的设计包括病毒启动子例如CMV和AdML的元件,它们已传统地用于在哺乳动物细胞中表达蛋白质。然而,相对于KCP而言通过使用SCP1使在果蝇细胞中分泌型异源蛋白质的稳定表达增加至2-3倍是值得注意的且出乎意料的。实施例5就在果蝇S2细胞中表达异源蛋白质来对合成的核心启动子进行优化实施例2中所描述的原始SCP1设计包含具有BRE、TATA盒、INR、MTE和DPE的核心启动子。独个地去除这些基序中的每一种,并且评估它们的去除对于表达的影响。在每种情况下,表达水平看起来略微降低。尝试着通过独个地将BRE、TATA、INR、MTE和DPE基序交换成备选的序列来进一步优化SCP,所述备选的序列包含代表了给定调节基序的备选序列或者具有在核心启动子中的等价位置处缺乏调节基序的序列。例如,野生型果蝇MtnA核心启动子缺乏BRE、MTE或DPE基序,然而,基于实施例3中所呈现的数据,果蝇MtnA核心启动子是迄今所测试的最强的野生型核心启动子。去除SCP1中的BRE序列并且用"中性"序列来替代之没有导致报道基因产物的表达水平发生变化,这表明BRE的存在是中性的,即它对于转录无明显的影响。在TATA盒的情况下,将SCP1TATA和INR之间的间隔减少3个核苷酸,以匹配果蝇MtnATATA盒与其相应的INR之间的间隔。所去除的那3个核苷酸(ACA)是紧接TATA盒的3,的那些。这个变化导致报道基因表达水平的略微降低,这表明SCP1中的间隔相对于MtnA中的间隔而言是优选的。将SCP1的INR(TCAGTC)变成GCATCA,6个核苷酸中的3个发生变化。这个变化使报道基因产物的表达增加大约50%。SCP1包含长度为190个核苷酸的5,UTR编码序列。SCP1的这个部分源自按蚊Mtn基因。这个序列对于转录/表达是有益还是有害是未知的。为了确定这个序列的贡献,产生了两种在这个序列内的缺失构建体。第一种去除了该序列的从3'末端开始的60个核苷酸。这个变化导致表达水平的略微增加。第二种去除了该序列的从3,末端开始的127个核苷酸。这个变化导致表达水平增加至大约2倍。这个截短形式的SCP1被称为SCPlAlll,并且用于进一步评估对于核心启动子的修饰。由Lim等人(Cs紐(2004)18:1606-1617)描述了TolloMTE对于转录水平的影响。因此,将在SCP1A111中使用的共有MTE变成在果蝇Tollo启动子中发现的那种。用TolloMTE序列替代共有MTE导致表达水平增加至大约2-3倍。将TolloMTE插入到SCP1核心中对于表达水平明显具有非常正面的影响。该插入有TolloMTE的核心启动子被称为"SCPl-TolloMTEAlll",并且包含这个核心启动子的启动子序列作为SEQ.ID.NO:2列出。测试了核心启动子的进一步优化。设计了一组3个新的核心启动子,其掺入有在前面的3个段落中描述的导致表达增加的正面方面。所述3种关键基序和所述5,UTR元件的特定组合是1)TATA基序,其包含TATAAA,和相对于INR的由原始SCP1所定义的间隔,2)INR序列基序GCATCA,3)源自果蝇Tollo的MTE序列基序,和4)截短的5,UTR(A111)元件。将这三种新的核心启动子命名为SCP5、SCP6和SCP7。所有这三种核心启动子都缺乏来自SCP1的BRE序列基序(当存在时,包含GGGCGCC)。这三种新的核心启动子在由DPE基序所占据的序列方面不同。SCP5包含来自果蝇Tollo基因的DPE(GGACGC),SCP6包含在SCP1中所使用的共有DPE(GGTTCG),和SCP7缺乏DPE基序而取而代之包含"中性填充物"序列以提供相对于SCP5和SPC6序列而言相同的间隔。当在等价的果蝇S2表达构建体(它们仅在其SCP序列方面不同)中比较SCP1、SCP5、SCP6和SCP7时,SCP7的设计导致最高水平的表达。SCP7序列作为SEQ.ID.NO:3列出。如先前所讨论的,信使MA(mRM)的5'非翻译区(5'UTR)的序列在来自真核mRNA的基因表达的转录后调节中起重要作用。5,UTR由从INR到起始曱硫氨酸密码子的区域来定义;因此,在对于启动子的DNA序列进行定义的情况下,它一般包括5,UTR序列。对于关于SCPl-TolloAlll和SCP7启动子所列出的序列,这是这种情况。起因于SCPl-TolloMTEAlll启动子的5,狙被称为Alll5,UTR,并且作为SEQ.ID.NO:4列出;起因于SCP7启动子的5,UTR被称为Alll-75,UTR,并且作为SEQ.ID.NO:5列出。实施例6就在果蝇S2细胞中表达异源蛋白质来对合成的MRE转录激活子进行优化在自然界中,在近侧启动子中发现了转录激活子的不同组合。在此基础上,制备了实施例3中所描述的GAGA和MRE元件的组合,以测定这种基序组合是否将会导致更高水平的转录和最终导致更高水平的表达。测试了两种GAGA-MRE近側启动子设计。它们如下GAGA-2XMRE和2XMRE-GAGA-2XMRE。利用在实施例3中所描述的载体pMT-X-KtAXho之中的/6al限制位点,将所述两种GAGA-MRE近侧启动子克隆到紧在实施例3中所描述的各种核心启动子之前的区域中。在用包含GAGA-DRE近侧启动子的质粒转化并选择了稳定的S2细胞系后,评估了H3HA-Ecto产物的表达。相比于不含GAGA元件的类似MRE构建体而言,向所利用的MREs添加GAGA元件并不增加或减少表达水平。在许多近侧启动子中,相同类型的多个转录因子结合位点常常在正向和反向这两个方向中被发现。这对于在果蝇的Mtn基因家族的近侧启动子中发现的内源MREs来说是正确的。因此,在为了确定MREs的方向是否能够改善近侧启动子的功能的努力中,使用正向和反向MRE序列的各种组合而制备了一系列合成的MRE近侧启动子。反向(R)MRE仅仅是实施例3中所描述的正向(F)MRE序列的反向互补物。反向MRE具有序列GCCGGCCTTO:患AGA(共有MRE序列为斜体并加有下划线)。这一系列的新的近侧启动子由以各种组合进行排列的正向和/或反向MREs的3X重复组成。所述组合如下3XFMRE、3XRMRE、3XFMRE-3XRMRE、3XRMRE-3XFMRE、3XFMRE-3XFMRE和3XRMRE-3XRMRE。3XMRE重复单元之间的间隔为11个核苷酸。间隔子的序列为ATCAAACTAGA。如在实施例3中一样,将包含MRE近侧启动子的正向和反向插入在表达载体pMT-X-KtAXho中的MtnA核心启动子的上游。还构建了包含SCP1核心的类似的表达质粒。为了评估使用这些合成的MRE启动子表达栽体的重组蛋白质的表达,将实施例1中所描述的H3HA-Ecto基因序列插入到所述载体中。将编码H3HA-Ecto亚单位蛋白质的具有MRE近侧启动子的表达质粒用于转化S2细胞。在用包含正向和反向MRE组合的质粒转化和选择出稳定的S2细胞系后,评估H3HA-Ecto产物的表达。因为这些构建体包含MREs,所以表达的评估要求,用Q.2mMCuS04来对培养物进行诱导,并且于26C培养7天。这些S2转化体的分析揭示,当使用不同的正向和反向组合时,它们导致各种水平的表达,所有这些表达水平均大于实施例3的6XMRE。即使3XFMRE-3XFMRE也导致比6XMRE略微更高的表达(为~2倍)。这可能是由于长度为11个核苷酸的间隔子所造成的结果,这是6XMRE和3XFMRE-3XFMRE近侧启动子序列之间的唯一差异。由3XFMRE-3XRMRE所指导的表达大约等于3XFMRE-3XFMRE的那种。由3XRMRE-3XFMRE所指导的表达为6XMRE的大约3倍,和由3XRMRE-3XRMRE所指导的表达为6XMRE的大约4-5倍。因此,选择3XRMRE-3XRMRE作为近侧启动子,以在进一步的构建体中使用,在所述构建体中将所选择的调控元件相组合从而形成仅由合成的或经优化的元件组成的完整的表达盒,如实施例9中所描述的。合成的近侧启动子3XRMRE-3XRMRE的序列在SEQ.ID.NO:6中列出。实施例7就在果蝇S2细胞中表达异源蛋白质对合成的分泌信号进行设计和优化分泌信号肽在被靼向从细胞中进行分泌的蛋白质的表达中起重要作用。因此,在表达载体中使用最佳序列对于此类表达载体的利用来说是重要的,所述表达载体指导重组蛋白质在产生过程中分泌到培养基中。由Zhang等人(/.Ce/2e(2005)7:354-365)所提出的分泌信号优化的例子清楚地证明了分泌信号优化的益处;然而,这个特定的例子应用于植物,并且并不清楚改变成所描述的分泌信号可以31应用于其他真核细胞类型。因此,设计了一系列的三种分泌信号,以确定对于该序列的何种类型的改变将会导致蛋白质产物进入到经稳定转化的S2细胞的培养基中的表达增加。合成的分泌信号的设计遵循矩P车表(matrixtable),其首先由vonHeijne(肠.Jc油Wes.(1986)14:4683-4690)描述,并且由Bendtsen等人(/.Wo/.(2004)340:783-795)进一步改进。所测试的第一组三种分泌信号在切割区域中都包含有相同的序列,在疏水性区域中包含有不相同的序列长度,和在碱性区域中包含有不相同数目的带电荷的残基。所测试的三种信号肽的氨基酸序列如下,其中名称在括号中MRTIIA"LLTVSGAQG("1R4L")MRTIIALLL"TVSGAQG("1R5L,,)MUTIIALLLLLTVSGAQG("2R5L,,)。1R5L序列比1R4L序列长1个氨基酸(以斜体字体显示的额外的"L"),因为增加了疏水性核的长度;而2R5L序列比1R5L序列长1个残基(以斜体字体显示的额外的"R,,),因为向碱性区域中添加了额外的带电荷的残基并同时保持了相同的疏水性核。1R4L、1R5L和2R5L序列的长度分别是17、18和19个氨基酸。这三种分泌信号在pMtaf表达载体中与H3HA-Ecto结构域基因有效连接。将利用这三种分泌信号来进行的H3HA-Ecto产物的表达和分泌与其中利用了tPA分泌信号的类似的H3HA-Ecto结构域构建体进行比较。在如实施例1中所描述的,转化S2细胞、选择稳定的细胞系以及就产物在培养基中的表达水平进行筛选后,确定了1R5L导致最高水平的表达,其为包含tPA的构建体的大约2倍,为包含2R5L的构建体的大约3倍,以及为包含1R札(等价于tPA)的构建体的大约2倍。此外,在1R5L序列中的偶然突变,Q至H(-2位置),导致表达的出乎意料的进一步增加,为原始1R5L序列的大约2倍。包含该H残基的1R5L序列被称为1R5L(H),并且用于在实施例9中所公开的最终表达载体之中。在这些分泌信号序列的设计中,将六核苷酸序列AACAAC置于紧在起始曱石克氨酸密码子之前。这代表了由Cavener(#zyc.」c/&Wes.(1987)15:1353-1361)所描述的关于果蝇的共有Kozak序列。分泌信号序列的设计还评估了紧随在切割位点处的G之后的T或S氨基酸残基的使用。当选择用于这些残基的合适密码子时,在G/T和G/S切割位点处的序列分别编码限制性内切核酸酶切割位点)T/wI和5緒HI。这两个切割位点序列良好地起作用。它们都提供了编码所需蛋白质的序列的方便插入,以在同一个读码框中与分泌信号相融合。1R5L(H)这一经优化的分泌信号的序列为MRTIIALLLLLTVSGAHG。优选的在切割位点后的氨基酸是S。编码该经优化的分泌信号的核苷酸序列以及相应的氨基酸序列分别作为SEQ.ID.NO:7和NO:8列出。实施例8就在果蝇S2细胞中表达异源蛋白质对备选的3,UTR元件进行评估基因和mRM的3,UTR分别在基因表达的转录和翻译水平上起重要作用(由Kloc等人,Ce//(2002)108:533-544进行了综述)。因此,在表达载体(其帮助改善多腺苷酸化,改善mRM从细胞核到细胞质的移位,改善mRNA稳定性,并且不干扰mRNA定位至粗面内质网)中使用最佳3,UTR序列对于指导产物释放到培养基中的表达载体的利用来说是重要的。这是由于已建议的这些原因,在表达质粒的设计中,将3,UTR考>{|、用于优4匕(vanderVelden等人,5iofecA/2/《wes(2001)31:572-582)。果蝇pMTtPA表达质粒利用了病毒SV40早期3'UTR序列以用于终止和多腺苷酸化。虽然它是具有功能的,但看起来在使用这种SV40序列之上存在有改善的空间。例如,由Van0ers等人(/.h'ro/.(1999)2253-2262)报道了就在昆虫系统中进行异源表达而对3,UTR进行的优化。他们用杆状病毒3,UTR替代了SV40早期3,UTR,并且表达水平增加。虽然他们未剖析该新的3,UTR以确定哪个部分促成了表达的增加,但这项工作证明3'UTR中的改变可以改善异源蛋白质的表达。不幸的是,每种表达系统是独特的,并且必需确定什么构成了用于在S2细胞中表达分泌型产物的最佳3,UTR。大多数真核3'UTR元件的主要特征是多腺苷酸化信号序列(polyA信号),其为AATAAA。polyA信号牵涉定义在细胞核中且在其上发生多腺苷酸化的新转录的mRNA的3,末端切割位点。在某些3,UTRs中,紧在切割位点下游观察到保守序列。这些序列被称为下游序列元件(DSE),并且被认为参与定义3,UTR切割位点。在pMTtPA载体和衍生物中存在的SV40早期3'UTR的长度为138个碱基,并且包含两个推定的polyA信号。用于添加polyA尾的切割位点出现在核苷酸96处。在核苷酸96和138之间的序列中,存在被认为代表了将会帮助切割的DSE基序的序列。在为了鉴定将会导致更高水平的表达的3'UTR序列的努力中,评估了在许多果蝇基因上的3,UTRs。主要标准是,3,UTR的长度为大约IOO个核苷酸,并且源自编码分泌型产物的基因。由Kirkpatrick等人("e/e(1995)143:147-154)所描述的果蝇壳多糖酶样蛋白(CLP)是来自S2细胞的最丰富的分泌型蛋白质之一,并且满足这些标准。该3,UTR不具有符合AATAAA序列的polyA信号。Kirkpatrick等人提出,polyA信号在AATATA或CATAAA处。在Kirkpatrick等人(1995)中,CLP3,UTR切割位点由将polyA序列添加至mRM所处的位置(核苷酸106)来定义。基于来自"rc^o/7力Z/aGeneCollection(BerkeleyDrosophilaGenomeProject,www.fruitfly.org/DGC/)的CLPcDM克隆LD21619,切割位点为进一步往下游7-11个核苷酸。Kirkpatrick等人的序列、LD21619的序列和来自果蝇基因组序列的相应序列之间的序列比对,鉴定出在Kirkpatrick等人的序列中在核苷酸43处的单个核苷酸错误,A变为G。这个变化导致获得AAGAAAA("变体polyA信号")而不是AAAAAAA的序列。在CLP3'UTR中还存在有另一个AAGAAA序列。基于这些AAGAAA序列的位置,本发明人假定这些序列之一可能能够充当polyA信号,其中第二个序列是最可能的。为了在表达载体中对CLP3'UTR进行最初测试,选择长度为117个核苷酸的片段。这个片段包含所述两个AAGAAA变体polyA信号。此外,基于不同来源的CLP序列的比对,这个117片段将会允许在所提出的切割位点中的任一个处进行切割,即接近所述两个变体polyA信号中的每一个。将该117核苷酸CLP3,UTR序列添加至表达载体pMTtPAAXho,从所述表达载体中去除了SV40早期3,UTR。该117核苷酸CLP3,UTR的插入导致报道分子H3HA-Ecto蛋白的表达增加至1.5倍。在为了确定AAGAAA序列是否充当polyA信号的努力中,将所述两个推定的信号中的G残基诱变成T残基,以匹配共有polyA序列。相比于具有SV40早期3,UTR的等价的表达载体而言,这个变化导致表达增加至3倍。在进一步的实验中,使CLP3'UTR中的所述两个推定的多腺苷酸化位点均进行突变,以使所述序列断裂(第一个AAGAAA变成ACGCAA,而第二个AAGAAA变成AATGAA)。这些变化导致表达水平的急剧减少。这进一步支持了,这些推定的多腺苷酸化信号中的至少一个充当polyA信号。为了确定另外的下游序列是否是对于作为DSE起作用来说所必需的,基于在相应位置处的基因組序列,使3'UTR再延长20个核苷酸。延长的3,UTR使表达水平降低至1/2至1/3,这是出人意料的。基于这些结果,选择具有两个G至T突变的117核苷酸CLP-3,UTR,以用于构建组合了多个调控元件的表达载体(如实施例9中所描述的)。这种经优化的3,UTR导致更高水平的表达,并且被称为Op-CLP-3,UTR。Op-CLP-3,UTR的序列作为SEQ.ID.NO:9列出。实施例9就在果蝇S2细胞中异源蛋白质的增强的表达来对包含调控元件的组合的表达载体进行评估为了形成用于在S2细胞中表达重组蛋白质产物的经优化的表达载体,需要下述5种调控元件中的每一种近侧启动子、核心启动子、5,UTR、分泌信号和3,UTR。理想地,对这5种元件中的每一种进行优化,并且所述元件的组合将会导致获得这样的表达盒,所述表达盒导致更高水平的产物表达。在先前实施例中,鉴定出了下述经优化的元件合成的近侧启动子3XRMRE-3XRMRE,合成的核心启动子SCPl-TolloMTEMll和SCP7,具有共有Kozak序列的截短的5,UTR,合成的分泌信号1R5L(H),和经优化的3,UTROp-CLP-3,UTR。作为用于评估这些经优化的调控元件的组合的第一个步骤,将1R5L分泌信号和Op-CLP-3,UTR分别用于替代在实施例3中所描述的pMT-X-KtAXho之中的tPA分泌信号和SV40早期3,UTR。包含这两种经优化的元件的表达载体被称为pHBI-5。将报道基因(例如,H3HA-Ecto)克隆到pHBI-5中,并且评估它们的表达。一般地,表达水平为对于克隆到pMT-X-KtAXho中的相同报道基因所看到的表达水平的1.5倍,这表明独个地通过1R5L分泌信号和0p-CLP-3,UTR所看到的改善不是加和性的;然而,该表达水平仍高于由pMT-X-KtAXho载体所驱动的表达水平。装配出包含所有5种元件的两个表达盒。所述两个盒在使用所述两个核心启动子中的哪一个核心启动子方面不同。第一个盒包含SCP1-TolloMTEAlll核心启动子,而第二个盒包含SCP7核心启动子。这些表达盒分别称为HBI-10和HBI-11。整个盒的序列在SEQ.ID.NO:10(HBI-10)和SEQ.ID.NO:11(HBI-11)中列出。图1和2分别图解说明了HBI-IO和HBI-11的近侧启动子和核心启动子区域的序列,并且进行了充分注释。HBI-10和HBI-11相对于pMTtPA的差异以表格形式概括在图3中。将HBI-10和HBI-11表达盒插入到pBR322克隆载体中,以形成S2细胞表达栽体pHBI-10和pHBI-ll。关于这两种S2细胞表达载体的质粒图i普分别显示在图4和5中。对于利用pHBI-10和pHBI-11表达载体来表达H3HA-Ecto产物所进行的评估揭示,pHBI-11导致相对于pMT-X-KtA载体而言增加至大约3倍的表达水平,而pHBI-10导致相对于由pMT-X-KtA载体所指导的相同-HA-Ecto产物的表达而言增加至大约2倍的表达水平。参考文献ApuyaN,KwokS,AlexandrovN,TatrinovaT,FangY,PennellR,LuYP,MedranoL,CookZ,FeldmannPromoter,PromoterControlElements,andCombinations,andusesThereof.U.S.PatentNo.:US2006/0090216Al.Pub.Date;Apr.27,1006.BendtsenJD,NielsenH,vonHeijneG,BrimalS.Improvedpredictionofsignalpeptides:SignalP3.0.JMolBiol2004;340:783-795.BernardAR,KostTA,OvertonL,CavegnC,YoungJ,BertrandM,Yahia-cherifZ,ChabertCandStillsA.RecombinantproteinexpressioninZ>oyo;/n7acellline:comparisonwiththebaculovirussystem.Cytotechnology.1994;15:139-144.BinL,TsingS,KosakaAH,NguyenB,OsenEG,BachC,ChanHandBamettJ.Expressionofhumandopaminefi-iiydroxylaseinZ)my叩M"Scloneider2cells.Biochem.丄1996;313:57-64.Butler,JEF,KadonagaJT.TheRNApolymeraseIIcorepromoter:akeycomponentintheregulationofgeneexpression.GenesDev.2002;16:2583-2592.CavenerDR,ComparisonoftheconsensussequenceflankingtranslationalstartsitesinDra^op/n'/"andvertebrates.NucleicAcidsResearch.1987;15(4》1353-1361.CulpJS,JohansenH,HellmigB.RegulatedexpressionallowshighlevelproductionandsecretionofHIVgpl加envelopeglycoproteininZ>as*op/n7"Schneidercells.Biotechnology.1991;9:173-177.DeoYfC,ParkEY.Multipleco陽transfectionandco-expressionofhumanP-1,3-N-acetylglucosaminyltransferasewithhumancalreticulinchaperonecDNAinasinglestepininsectcells.Biotechnol.Appl.Biochem.2006;43:129-135.EdelmanGM,MeechR,OwensGC,andJonesFS.Syntheticpromoterelementsobtainedbynucleotidesequencevariationandselectionforactivity.ProcNatlAcadSci.2000;97:3038-3043.FarrellPJ,LuM,PrevostJ,BrownC,BehieL,IatrouK.High-levelexpressionofsecretedglycoproteinsintransformedlepidopteraninsectcellsusinganovelexpressionvector.BiotechnologyandBioengineering.1998;60(6):656-663.FitzGeraldPC,SturgillD,ShyakhtenkoA,OliverB,VinsonC.ComparativegenomicsofDrarap/z//"andhumancorepromoters.GenomeBiology.2^)06;7:R53.GardsvollH,WernerF,SondergaardL,DanoK,PlougM.Characterizationoflow-glycosylatedformsofsolublehumanurokinasereceptorexpressininZVora////"Schneider5cellsafterdeletionofglycosylation-sites.声roteinExpressionandPurification.2004;34:284-295.GershenzonNI,TrifonovED,loshikhesIP.ThefeaturesofDrosophilacorepromotersrevealedbystatisticalanalysis.BMCGenomics.7:161,GranokH,LeibovitchBA,ShafferCD,ElginSCR.Ga匿gaoverGAGAfactor*CurrentBiol.1995;5:238-241.HiroseF,YamaguchiM,HandaH,InomataY,MatsukageA.Novel8-basepairsequence(DrosophilaDNAreplication-relatedelement)andspecificbindingfactorinvolvedintheexpressionofDrosophilagenesforDNApolymeraseaandproliferatingcellnuclearantigen.JBiolChem.1993;268:2092-2099.37HofmannKJ,SchultzLD.Mutationsoftheoc-galactosidasesignalpepetidewhichgreatlyenhancesecretionofheterologousproteinsbyyeast.Gene.1991;101:105-111.IkonomouL,SchneiderY陽J,AgathosSN.Insectcellcultureforindustrialproductionofrecombinantproteins.Appl.Microbiol.Biotechnol.2003;62:1-20.Incardona,J.P.andT.L.Rosenberry.ConstructionandcharacterizationofsecretedandchimerictransmembraneformsofDmyopMaacetylcholinesterase:alargetruncationoftheC-terminalsignalpeptidedoesnoteliminateglycoinositolphospholipidanchoring.Mol.Biol,oftheCell1996;7:595-611.Ivey-Hoyle,M.RecombinantgeneexpressioninculturedZ)ra^p/7,7"me/awogoy/ercells.Curr.Opin.Biotechnol.1991;2:704-707.JohansenHA,vanderStratenR,SweetR,OttoE,MaroniG,RosenbergM.Regulatedexpressionathighcopynumberallowsproductionofagrowth-inhibitoryoncogeneproductinDmsop/z/'/"Schneidercells,。enesandDevelopment.1989;3:882-889.Juven-GershonT,HsuJY,KadonagaJT.PerspectivesontheRNApolymeraseIIcorepromoter.BiochemSoc,Trans.2006;34:1047-1050.Juven-GershonT,ChengS,KadonagaJT.Rationaldesignofasupercorepromoterthatenhancesgeneexpression.NatureMethods.2006;3:917-922.KadonagaJTandTGershon.Optimizedcorepromotersandusestherfor.ApplicationPCT/US2006/020394.Apppublished30November2006.Prioritydate25May2005(USprovisional60/684,4825.LimCY,SantosoB,BoulayT,DongE,OhlerU,KadonagaJT.TheMTE,anewcorepromoterelementfortranscriptionbykNApolymeraseII,GenesandDevelopment.2004;18:1606-1617.KirkpatrickRB,MaticoRE,McNultyDE,StricklerJE,RosenbergM.AnabundantlysecretedglycoproteinfromDms*op///a廳/awogasterisrelatedtomammaliansecretoryproteinsproducedinrheumatoidtissuesandbyactivatedmacrophages.Gene.199^;153:147-154.KirkpatrickRBandShatzmatiA.Z>tw//n7"S2Systemforheterologousgeneexpression.7nGeneExpressionSystems:UsingNaturefortheArtofExpression.JosephMFernandezandJamesHoefflereditors.AcademicPress.199$;Pp.289-330.KlocM,ZearfossNR,EtkinLD,MechanismsofsubcellularmRNAlocalization.CelL2002;108:533-544.KozakM.Featuresinthe5'non-codingsequencesofrabbitaandP-globiiimRNAsthataffecttranslation^efficiency,J.Mol.Biol.1994;235:95-110.KozakM.RegulationoftranslationviamRNAstructureinprokaryotesandeukaryotes.Gene.2005;361:13-37.KutachAK,KadonagaJT.ThedownstreampromoterelementDPEappearstobeaswidelyusedastheTATAboxinDrosophilacorepromoters.MoLCell.Biol.2000;20:4754-4764.LeLoirY,AzevedoV,OliveiraSC,FreitasDA,MiyoshiA,Bermudez-HumamnLG,NouailleS,RibeiroLA,LeclercqS,GabrielJE,GuimaraesVD,OliveiraMN,CharlierC,GautierM,LangellaP.ProteinsecretioninLactococcuslactis:andefficientwaytoincreasetheoverallheterologousproteinproduction.Microb.CellFact,2005;4:2.LiX,EastmanEM,SchwartzRJ,Draghia-AkliR.Syntheticmusclepromoters:activitiesexceedingnaturallyoccurringregulatorysequences.NatureBiotechnology.1999;17:241-245.LimCY,SantosoB,BoulayT,DongE,OhlerU,KadonagaJT.TheMTE,anewcorepromoterelementfortranscriptionbyRNApolymeraseII.GenesandDev.2004;18:1606-1617.LuM,JohnsonRR,IatrouK.Trans-activationofacellhousekeepinggenepromoterbytheIE1geneproductofbaculovirus.Virology.1996;218:103-113.LuM,FarrellPJ,JohnsonR,mIatrouK.Abaculovirus(BmNPV)repeatelementfunctionsasapowerfulconstitutiveenhancerintransfectedinsectcells.J.Biol.Chem.1997;272:30724-30728,ModisY,OgataS,ClementsD,HarrisonSC.Aligand-bindingpocketinthedenguevirusenvelopeglycoprotein.Proc.Natl.Acad.Sci.USA.2003;100:6986-6991.ModisY,OgataS,ClementsD,HarrisonSC.Structureofthedenguevirusenvelopeproteinaftermembranefusion.Nature,2004;427(6972):313-319.OhlerU,LiaoG,NiemannH,RubinGM,ComputationalanalysisofcorepromotersintheD簡—,7"genome.GenomeBiol.2002;3(12):research0087.1-00087.12.OlsenMK,RockenbachSK,FischerHD,HoogerheideJG,TomichCSC,StableproductionofananalogofhumantissueplasminogenactivatorfromculturedDtotop/h7gcells.Cytotechnology.1992;10:157-167.RudI,JensenPR,Naterstad,AxelssonL.Asyntheticpromoterlibraryforconstituitivegeneexpressionin丄a加6鎖7/top/aw加腦.Microbiology.2006;152:1011-1019.SchmetzerO,MoldenhauerG,RiesenbergR,PiresJR,SchlagP,PezzuttoA.2005.Qualityofrecombinantproteindeterminestheamountofautoreactivityagainstthetumor-associatedepithelialcelladhesionmoleculeantigen:lowfrequencyofantibodiesagainstthenaturalprotein.TheJournalofImmunology.2005;174:SchmidtFR.Recombinantexpressionsystemsinthepharmaceuticalindustry.ApplMicrobiolBiotechnol,2004;65:363-372.SchneiderIJ.CelllinesderivedfromlateembryonicstagesofZ)ras^;/u7(7舰/"wogoy脱J.Embryol.Exp.Morph.1972;27:353-365.SmaleST,KadonagaJT.TheRNApolymeraseIIcorepromoter.Annu*Rev.Biochem.2003;72:449-479.SoellerWC,OhCE,KornbergTB.IsolationofcDNAsencodingtheZ)my叩/n7"GAGAtranscriptionfactor.MolandCellBiol.1993;13:7961-7970,TomoeJ,KuskP,JohansenTE,JensenPR.Generationofasyntheticmammalianpromoterlibrarybymodificationofsequencesspacingtranscriptionfactorbindingsites.Gene.2002;297:21-32.vanderStratenAH,JohansenH,RosenbergM,SweetRW.IntroductionandconstitutiveexpressionofgeneproductsinculturesofDra^/MacellsusinghygromycinBselection.MethodsinMolAndCellBiol.1989;1:1-8.vanderVeldenAW,VoormaHO,ThomasAAM.Vectordesignforoptimalproteinexpression.BioTechniques.2001;31:572-582.vonHeijneG.Anewmethodforpredictingsignalsequencecleavagesites,NucAcidsRes,1986;14:4683-4690.vanOersMM,VlakJM,VoormaHO,Thomas,AAM.Roleofthe3'untranslatedregionofbaculovirusp10mRNAinhigh-levelexpressionofforeigngenes.JGenVirol.1999;80:2253-2262.WilsonIA,SkehelJJ,WileyDC.Structureofthehaemagglutininmembraneglycoproteinofinfluenzavirusat3人resolution.Nature1981;289:366-673.XuT,LogsdonNJ,WaterMR.Structureofinsect-cell-derivedIL-22.ActaCrystaUogrDBiolCrystaUogr.2005;61(pt7):942-50.ZhangL,LengQ,MixsonAJ.AlterationintheIL2signalpeptideaffectssecretionofproteinsz>v/fraand>v/vo.J.GeneMed.2005;7:354-365.40权利要求1.用于在培养的昆虫细胞中表达和分泌异源蛋白质的表达载体,其包含表达盒,其中所述表达盒包含由近侧和核心启动子元件组成的合成启动子,所述近侧和核心启动子元件在所述表达盒内有效连接,从而使得异源基因序列的插入将导致从用所述表达载体稳定转化的细胞中的蛋白质表达。2.权利要求l的合成启动子,其进一步包含SEQ.ID.所示的近侧启动子3XRMRE-3XRMRE序列,和SEQ.ID.NO:的合成的核心启动子SCP1-TolloMTEAlll序列。3.权利要求l的合成启动子,其进一步包含SEQ.ID.所示的近侧启动子3XRMRE-3XRMRE序列,和SEQ.ID.NO:的合成的核心启动子SCP7序列。4.权利要求2或3的表达载体,其进一步包含与所述合成的近侧启动子和核心启动子有效连接的合成的5,UTR元件,从而使得该组合能够驱动异源蛋白质的表达。5.权利要求4的表达载体,其进一步包含与所述合成的近侧启动子、核心启动子和5,UTR元件有效连接的合成的分泌信号序列,从而使得该组合能够驱动异源蛋白质的表达和分泌。6.权利要求5的表达栽体,其进一步包含与所述合成的近侧启动子、核心启动子、5,UTR和合成的分泌信号序列元件有效连接的合成的3,UTR序列,从而使得该组合能够驱动异源蛋白质的表达和分泌。7.权利要求4的合成的5,UTR,其包含SEQ.ID.NO:4中所示的序列。8.权利要求4的合成的5,UTR,其包含SEQ.ID.NO:5中所示的序列。9.权利要求5的合成的分泌信号序列,其包含SEQ.ID.NO:7中所示的1R5L(H)编码序列。10.权利要求6的合成的3,UTR,其包含SEQ.ID.NO:9中所示NO:6中2中所示NO:6中3中所示的OpCLP3'UTR序列。11.用于在培养的昆虫细胞中表达和分泌异源蛋白质的表达载体,其包含SEQ.ID.NO:10中所示的表达盒。12.用于在培养的昆虫细胞中表达和分泌异源蛋白质的表达载体,其包含SEQ.ID.MO:ll中所示的表达盒。13.权利要求l、2、3、4、5、6、7、8、9、10、11和12的表达载体的用途,其中所述昆虫细胞为果蝇细胞。14.权利要求l、2、3、4、5、6、7、8、9、10、11和12的表达载体的用途,其中所述昆虫细胞为果蝇S2细胞。全文摘要本发明旨在用于在昆虫细胞中表达天然样异源蛋白质的经优化的表达载体。本发明的组成为代表了表达载体的元件的核苷酸序列,当所述元件相组合时,导致异源蛋白质的增强的表达和分泌。所述元件包括定义了在昆虫细胞中有功能的转录激活子、核心启动子、分泌信号和3’非翻译区的序列。在经优化的载体中所包含的元件都是合成得到的,或者为天然存在的昆虫序列的经修饰的变体。当编码蛋白质的核苷酸序列与所述载体有效连接时,所述表达载体可用于表达天然样蛋白质。这些载体可以用于转化昆虫细胞,所述昆虫细胞随后可以进行培养以产生所需蛋白质产物。表达出的天然样蛋白质可以用于需要大量高品质蛋白质的诊断、疫苗或其他应用中。文档编号C12Q1/68GK101688246SQ200880021845公开日2010年3月31日申请日期2008年4月28日优先权日2007年4月26日发明者C·威克斯-利维,D·E·克莱门茨,G·V·L·王申请人:夏威夷生物技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1