新的严格的可选择的标志物的制作方法

文档序号:392539阅读:292来源:国知局
专利名称:新的严格的可选择的标志物的制作方法
技术领域
本发明涉及分子生物学和生物技术领域。更具体地,本发明涉及用于提高具有高表达水平的宿主细胞的选择的方式和方法。
背景技术
在各种宿主细胞,涵盖细菌和酵母到哺乳动物细胞中,都生产生物活性蛋白。当蛋白需要特定的翻译后修饰,如糖基化,以发挥合适的功能时,优选以哺乳动物细胞作为宿主细胞。通常,在哺乳动物细胞中生产的蛋白是从编码目标蛋白的所谓的“转基因”表达而来的。为确保正确的生产蛋白的细胞得到选择,将编码目标基因的转基因与往往处于同一载体上的编码可选择的标志物的第二转基因连接。当向已经转染携带所述转基因的质粒的细胞培养物中加入选择剂时,只有那些也携带可选择的标志物的细胞将存活。一个普遍的问题是,选择的严格性通常较低。这意味着,细胞仅需要合成很小量的选择蛋白来在毒性选择剂下存活。具体地,当选择标志物是使得毒性选择剂失效的酶时出现这些问题。一分子的酶能够经过一定时间使多分子的毒性选择剂失效。这种组合例如为新霉素(Neomycin)和氨基糖苷磷酸转移酶(新霉素)选择标志物。选择标志物蛋白的有限需求也暗示所述转基因蛋白的表达水平。例如,仅通过极少拷贝的质粒的并入即可达到选择标志物的低表达水平。但是,这也意味着仅有极少基因拷贝可以用于转基因蛋白的表达,结果导致低的转基因蛋白表达水平。因此,目标蛋白的低表达水平通常与低选择严格性相伴。这明显是低选择严格性的非期望的副作用。当博来霉素(Zeocin)和kocin选择标志物得到使用时,可以看出选择严格性的改善。^ocin选择蛋白是一种不以酶的方式起作用的选择标志物蛋白。它在化学计量上与两个kocin选择分子结合且不对这些分子做进一步处理。因而,可用的kocin选择蛋白仅具有使一定数量的加入到细胞培养基的^ocin失效的有限能力。因此,相对于例如 Neomycin选择标志物mRNA,细胞必须产生更多的kocin选择标志物mRNA来产生足够的 Zeocin选择蛋白,以分别使kocin或Neomycin失效。当与目标基因连接时,这通常导致编码目标基因产物的更高的mRNA水平。这些更高的mRNA水平继而明显带来目标基因产物的更高的表达水平。稳定的转染克隆仅能为选择标志物的表达水平而不是为目标基因的表达水平而选择。因此,优选地,目标基因的表达与选择标志物的表达水平直接关联。已有多种方法来物理上连接目标基因和编码选择标志物基因的基因。可以在目标基因和编码选择标志物的基因之间设置IRES(内部核糖体进入位点)序列。这构建了双顺反子mRNA,目标基因产物和选择蛋白都从该双顺反子mRNA得到翻译(Rees et al.,1996,Biotechniques 20 102-110)。当细胞需要大量选择蛋白,如^ocin选择蛋白来存活时,就需要高水平的这种双顺反子mRNA。这继而意味着高水平的编码目标基因产物的mRNA可用于翻译,从而获得了目标基因产物的相对高的表达水平。相比没通过IRES序列连接的目标基因和编码选择标志物的基因,该原理提供了更高的选择严格性。这种选择表达相对高水平的目标基因产物的细胞克隆的过程是得到接受和经常使用的方法(参见,例如,WO 03/106684,WO 2006/005718 和 W02007/096399)。实现更高水平的选择严格性的其他方法是使用携带突变的可选择的标志物,所述突变减弱但不完全破坏该选择标志物的活性。为了使培养基中相似数量的毒性选择分子失效,相比野生型选择蛋白,需要产生更多突变的、更多受损的选择蛋白。当通过IRES序列与目标基因连接时,更高的受损选择标志物的mRNA水平保证了也有更多的目标基因的mRNA 能用于翻译(参见,例如,WO 01/3四01和WO 2006/048459)。在高选择严格性系统的已有的另一个示例中,选择标志物蛋白的翻译是严重受损的。在该示例中,修饰的选择标志物基因置于目标基因的上游,不被IRES序列隔开。本质上,该选择标志物的最优ATG翻译起始密码子被替换为优选程度低翻译起始密码子,例如 GTG或TTG。在这种情况下,翻译机制将不会在GTG处起始翻译,或者在TTG处较弱地起始翻译,但会进行mRNA的扫描。在选择基因中没有ATG(需要将它们删除)出现的条件下,所遇到的第一个ATG为目标基因的ATG。在这种配置中,需要产生高水平这种mRNA来获得足够的选择蛋白,该选择蛋白则是未来细胞存活所需要的。但是,这些高的mRNA水平也保证了同时高水平的连接的目标基因将得到翻译。通过该原理,建立了一种高选择严格性的系统, 它的结果是a)仅有少量的克隆能够在选择过程中存活,且b)这些克隆表现出了目标基因产物的相对高的表达水平。具体地,将TTG kocin选择标志物与目标基因连接的配置提供了非常高的选择压力。这些选择系统已被共同命名为STAR-klect (W0 2006/048459和WO 2007/096399)。本发明公开了进一步改进的用于哺乳动物细胞的高严格性选择的方式和方法,来得到目标基因产物的高表达水平。

发明内容
定义“核酸构建体”(nucleic acid construct)在此理解为通过重组DNA技术的使用得到的人造核酸分子。核酸构建体为核酸分子,要么是单链的,要么是双链的,该核酸分子被修饰为含有核酸片段,这些核酸片段以某种方式结合并且并置,该核酸分子不另外存在于自然界。核酸构建体通常为“载体(vector)”,即,用于将外源生成的DNA递送到宿主细胞中的核酸分子。常规类型的载体可以来源于自然出现的质粒、噬菌体和病毒。载体通常进一步包括遗传元件以便于它们在分子克隆中的用途,例如,可选择的标志物、多克隆位点和在一种或多种宿主细胞等中具有功能的复制起始子等。一种类型的核酸构建体为“表达盒”(expression cassette)或“表达载体”(expression vector) 0这些术语是指核酸序列,这些序列能够使得基因在与这些序列相容的宿主细胞或宿主生物中有效表达。表达盒或表达载体典型地至少包括合适的转录调节序列和可选择地,3’转录终止信号。另外的所需或有助于有效表达的因子也可以存在,例如表达增强元件。术语“单顺反子基因”(monocistronic gene)定义为能够提供编码一个基因产物的RNA分子的基因。“多顺反子转录单元” (multicistronic transcription unit),也称为多顺反子基因,定义为能够提供编码至少两个基因产物的RNA分子的基因。术语“双顺反
6子基因(bicistronic gene) ”,也称为双顺反子基因,定义为能够提供编码两个基因产物的 RNA分子的基因。因此,双顺反子基因包括在多顺反子基因的定义中。术语肽在此是指含有由肽键连接的氨基酸的链的任何分子。术语肽因而包括寡肽、多肽和蛋白,包括多聚体蛋白,不限于特定的作用方式、大小、三维结构或来源。在此使用的“多肽”通常包括由肽键连接的至少五个氨基酸。术语“蛋白”或“多肽”是可替换使用的。蛋白的“片段”或“部分”因而可以仍然指代为“蛋白”。“分离的蛋白”用作指代不再处于它的自然环境例如在体外或重组(真菌或植物)宿主细胞中的蛋白。术语肽也包括肽的表达后修饰,例如糖基化、乙酰化、磷酸化等。本发明中所用的“基因”或“转录单元”可以包括染色体DNA、cDNA、人工DNA、它们的组合等。包括若干个顺反子的转录单元作为一个单一的mRNA。如在此所用的,术语“可操作地连接”是指多核苷酸(或多肽)元件在功能关联中的连接。核酸在它置于与另一核酸序列的功能关联中时是“可操作地连接的”。例如,转录调节序列如果影响编码序列的转录,那它就是与编码序列可操作地连接的。可操作地连接意味着,被连接的DNA序列通常是连续的,并且,在需要加入两个蛋白编码区的情况下,是连续的且位于阅读框中。“表达控制序列”是指调节与其可操作地连接的核酸序列的表达的核酸序列。当表达控制序列控制和调节核酸序列的转录和/或翻译时,表达控制序列是与核酸序列可操作地连接的。因此,表达控制序列可以包括启动子、增强子、内部核糖体进入位点(IRES)、 转录终止子、位于蛋白编码基因的前部的起始密码子、内含子的剪接信号和终止密码子。术语“表达控制序列”旨在包括,设计用它的存在来影响表达的最小化的序列,并且也可以包括其他的有益组件。例如,前导序列(leader sequence)和融合配合序列(fusion partner sequence)为表达控制序列。该术语也可以包括从序列中删除不需要的,潜在的框内和框外的起始密码子的核酸序列的设计。该术语也可以包括删除不需要的,潜在的剪接位点的核酸序列的设计。它包括引导PolyA尾的加入的序列或多腺苷酰化序列(pA),polyA尾即 mRNA的3’端的一串腺嘌呤残基,序列称为polyA序列。它也可以设计用于增强mRNA的稳定性。在真核(宿主)细胞中,影响转录和翻译稳定性的表达控制序列,例如,启动子,以及影响翻译的序列,例如,Kozak序列,是公知的。如在此使用的,术语“启动子”或“转录调节序列”是指功能为控制一个或多个编码序列转录,且在转录方向上位于编码序列转录起始位点的上游,并且,通过DNA依赖的RNA 聚合酶结合位点、转录起始位点和任何其它的DNA序列的存在,结构得以确定的核酸片段, 所述任何其他的DNA序列包括但不限于,转录因子结合位点、抑制子和激活子蛋白结合位点以及本领域技术人员公知的直接地或间接地起到调节从启动子开始的转录的量任何其他的核酸序列。“可诱导的”启动子是生理上或发育上调节的启动子,例如,通过化学诱导剂的施用来调节。“组织特异的”启动子仅在特定类型的组织或细胞中有活性。如在此使用的,“内部核糖体进入位点,,或“ IRES”是指促进内部核糖体直接地进入顺反子(蛋白编码区)的翻译起始密码子(即起始密码子),从而引发基因的非帽依赖性翻译(cap-independent translation)的元件。参见,例如,Jackson R J, Howe IlM Τ, Kaminski A(1990)Trends Biochem Sci 15(12) :477-83)以及Jackson R J and Kaminski, A. (1995)RNA 1(10) :985-1000.本发明包括任意的非帽依赖性翻译起始序列的使用,特别是能够促进内部核糖体直接地进入顺反子的起始密码子的任意的IRES元件的使用。在此使用的“处于IRES的翻译控制之下”是指翻译与IRES相关并且以非帽依赖性的方式进行。 如在此使用的,术语“IRES”包括有功能的IRES序列的变异体,只要该变异体能够促进内部核糖体直接地进入顺反子的起始密码子。如在此使用的,“顺反子”是指含有产生单个多肽链的所有信息的多核苷酸序列 (DNA)的片段。“序列一致性”和“序列相似性”可以使用全局或局部比对算法(取决于两个序列的长度),通过两个肽或两个核酸的序列的比对来确定。相似长度的序列优选使用全局比对算法(例如,Needleman Wunsch)来比对,该全局比对算法最优地涵盖整个序列地比对序列;而基本上不同长度的序列优选使用局部比对算法(例如,Smith Waterman)来比对。当序列(在通过例如GAP或BESTFIT程序,使用默认参数进行最优地比对时)共享至少特定的最小百分数的序列一致性(如下文所定义的)时,序列会被认为是“基本一致的” 或“基本相似的”。GAP使用Needleman和mmsch全局比对算法,最大化匹配(match)的数量并最小化间隙(gap)的数量,来涵盖它们整个长度(全长)地比对两个序列。当两个序列具有相似长度时,全局算法适合用于确定序列一致性。一般地,使用的是GAP的默认参数,即间隙建立罚分(gap creation penalty) = 50 (核苷酸)/8 (蛋白),且间隙扩展罚分(gap extension penalty) = 3 (核苷酸)/2 (蛋白)。对于核苷酸,使用的默认打分矩阵为 nwsgapna ;而对于蛋白,默认打分矩阵为 Blosum62 (Henikoff&Henikoff,1992,PNAS 89,915-919)。用于序列一致性的百分数的序列比对和打分可以使用计算机程序确定,如 GCG Wisconsin Package, Version 10. 3,可购自 Accelrys Inc. , 9685 Scranton Road, San Diego, CA 92121-3752USA ;或使用开源软件,例如 EmbossWIN Version 2. 10. O 中的程序“针(needle),,(使用全局 Needleman Wunsch 算法)或“水(water),,(使用局部 Smith Waterman算法),使用与上面的GAP相同的参数,或使用默认设置(对于“针”和“水”,且对于蛋白和DNA比对,默认的间隙开放罚分为10. 0,默认的间隙扩展罚分为0. 5 ;默认的打分矩阵对应于蛋白为BloSSum62,对应于DNA为DNAFul 1)。当序列具有基本上不同的全长,优选局部比对,例如那些使用Smisth Waterman算法的比对。备选地,相似性或一致性的百分数可以通过使用例如FASTA、BLAST等的算法搜索公共数据库来确定。编码本发明的可选择的标志物的核苷酸序列也可以通过它们在温和的条件下,或优选在严格的杂交条件下的与SEQ ID NO :1-9的核苷酸序列杂交的能力来定义。严格的杂交条件在此定义为以下条件允许至少约25个,优选约50个核苷酸、75或100个和最优选约200个或更多的核苷酸的核酸序列,在约65°C的温度下,在含有约IM盐,优选6XSSC 的溶液或具有相当的离子强度的任意的其它溶液中杂交,以及在65°C下在含有约0. IM盐, 或更少,优选0.2XSSC的溶液或具有相当的离子强度的任意的其它溶液中洗涤。优选地, 杂交过夜进行,即至少10小时,并且优选地,洗涤进行至少一小时,并至少更换两次洗涤溶液。这些条件通常允许具有约90%或更高的序列一致性的序列的特异性杂交。温和的条件在此定义为以下条件允许至少50个核苷酸,优选约200个或更多的核苷酸的核酸序列,在约45 °C的温度下,在含有约IM盐,优选6 X SSC的溶液或具有相当的离子强度的任意的其它溶液中杂交,以及在室温下在含有约IM盐,优选6 X SSC的溶液或具有相当的离子强度的任意的其它溶液中洗涤。优选地,杂交过夜进行,即至少10小时,并且优选地,洗涤进行至少一小时,并至少更换两次洗涤溶液。这些条件通常允许具有至多50% 的序列一致性的序列的特异性杂交。本领域技术人员可以改变这些杂交条件以特别地鉴定一致性在50%和90%之间变化的序列。编码目标蛋白的核苷酸序列对宿主细胞的密码子使用的适应性可以表达为密码子适应指数(CAI)。所述密码子适应指数在此定义为在特定的宿主细胞或生物中,基因的密码子的使用相对于高表达基因的密码子的使用的相对适应性的测量。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸的丰度最高的密码子的使用的比值。该CAI 指数定义为这些相对适应性值的几何平均值。非同义密码子和终止密码子(依赖于遗传编码)是排除在外的。CAI值介于0到1之间,越高的值表明越高的丰度最高的密码子的比例 (参见 Sharp and Li,1987,Nucleic Acids Research 15 :1281-1295 ;还参见 Jansen et al.,2003,Nucleic Acids Res. 31 (8) :2242-51)。根据本发明的核酸构建体可以通过选择可选择的标志物的表达,用于选择具有高表达水平的目标基因产物的真核细胞,优选为哺乳动物细胞。随后或同时,一种或多种被选择的细胞可以得到鉴定,并进一步用于高水平的目标基因产物的表达。本发明基于可选择的标志物的表达的受损效率。可选择的标志物的表达可以用本领域技术人员所知的常规的方法来检测,例如通过测定正常选择期后的存活克隆的数量。 如本领域技术人员所熟知的,已有多种指示选择标志物多肽的表达的参数,例如,细胞能耐受的选择剂的最大浓度,在给定浓度下的存活克隆的数量,在选择剂存在下的细胞生长速度(增加一倍的时间),上述参数的结合等等。通过使用本发明,具有高水平表达的细胞,特别是具有可选择的标志物的高水平转录的细胞,可以得到鉴定。在第一方面,本发明涉及一种核酸构建体,该核酸构建体含有多顺反子转录单元, 所述多顺反子转录单元含有a)编码在真核宿主细胞中有功能的可选择的标志物的核苷酸序列;以及,b)有功能的开放阅读框。优选地,所述有功能的开放阅读框的终止密码子存在于编码所述可选择的标志物的核苷酸序列的单独的翻译起始密码子的上游的0至250个核苷酸之间。优选地,隔开有功能的开放阅读框的终止密码子和编码可选择的标志物的核苷酸序列的单独的翻译起始密码子的序列是无翻译起始密码子的。根据本发明的多顺反子转录单元具有在有功能的开放阅读框的下游、编码可选择的标志物的序列。根据本发明的多顺反子转录单元优选为在5’到3’方向上含有1)有功能的开放阅读框,和2)编码可选择的标志物的序列的双顺反子转录单元。因此,所述有功能的开放阅读框存在于所述编码可选择的标志物的序列的上游。有功能的开放阅读框在此理解为在5’到3’方向上含有1)翻译起始密码子,幻一个或多个编码氨基酸的密码子,以及3)翻译终止密码子的核苷酸序列,由此,应当理解的是1),幻和幻在框中是可操作地连接的。所述有功能的开放阅读框因此由多个3核苷酸(三联体)组成。对于本发明,能够精确地调节可选择的标志物多肽的低水平的翻译效率是有好处的,这样能获得精确的所需水平的选择严格性。在本发明中,这是通过改变多顺反子转录单元中的有功能的开放阅读框的长度来实现的。在本发明的构建体中,有功能的开放阅读框可以因此编码至少 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、 55、60、70、80 或 90 个氨基酸残基,且优选编码不多于 200、180、160、150、140、130、120、110、 100、99、98、97、96、95、94、93、92、91、或90个氨基酸残基,在5,端具有起始密码子和在3,端具有终止密码子。因此,相对于现有技术中公开的通过应用次优(suboptimal)的非AUG 起始密码子的翻译效率中有限的无关联步骤(参见,例如,WO 2007/096399),通过改变紧邻地先于转录本中的编码可选择的标志物的序列的有功能的开放阅读框的长度,提供了近似连续的可选择标志物的翻译效率的范围。所述有功能的开放阅读框可以紧邻地位于所述可选择的标志物的单独的起始密码子的上游,在这种情况下,所述有功能的开放阅读框的终止密码子紧邻地与编码可选择的标志物的序列的起始密码子相连接。备选地,上游的有功能的开放阅读框的终止密码子和编码可选择的标志物的序列的起始密码子可以通过1、2、3、4、5、6、7、8、9、10、12、14、16、 18、19、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、250、300、350 或更多个核苷酸隔开。隔开上游的有功能的开放阅读框的终止密码子和编码可选择的标志物的序列的起始密码子的间隔序列的长度的改变进一步增加了精确调节可选择的标志物的翻译效率的水平。隔开有功能的开放阅读框的终止密码子和编码可选择的标志物的核酸序列的单独的翻译起始密码子的间隔序列是无翻译起始密码子的。因此优选地,所述间隔序列没有ATG密码子。更优选地,所述间隔序列也没有次优的非ATG密码子,例如嵌入Kozak 序列(见下文)的616、176、0^417和406(见下文)。最优选地,所述间隔序列没有ATG、 GTG、TTG、CTG、ATT和ACG密码子中的任何一者。在进一步优选的实施方式中,隔开有功能的开放阅读框的终止密码子和编码可选择的标志物的核酸序列的单独的翻译起始密码子的间隔序列是无终止密码子的,即,没有TAA、TAG和TGA密码子。间隔序列的一个实例如 SEQ ID NO 28 所示。有功能的开放阅读框因此至少编码一个氨基酸,但通常编码长度可以如上所述地变化的(即,2-200个或更多氨基酸)小肽。有功能的开放阅读框可以编码任意的氨基酸或氨基酸序列。在有功能的开放阅读框中编码的氨基酸序列可以例如取自任意的已知的蛋白编码序列或其它天然存在的0RF,或者它可以部分或全部是人工的。但是,优选地,在有功能的开放阅读框中编码的氨基酸序列的表达不会有害于真核宿主细胞,即,所述氨基酸序列是无毒性的并优选为惰性肽。例如,在有功能的开放阅读框中编码的氨基酸序列可以任意地取自任何的蛋白编码基因,例如萤光素酶基因(SEQ ID N0:12)。在有功能的开放阅读框中编码的氨基酸序列因此可以为荧光素酶氨基酸序列的片段(SEQ ID N0:24),优选为 PPx氨基酸序列的片段(SEQ ID而2幻。备选地,它可以随机地合成,例如通过使用随机引物的PCR。为了进一步在有功能的开放阅读框的翻译中减缓核糖体,编码的氨基酸序列可以含有均聚物延伸(homopolymer stretches)或富含一种特定的氨基酸。本发明的核酸构建体可以以双链DNA的形式出现,具有对应于可选择的标志物和编码肽的有功能的开放阅读框的编码链和非编码链,所述编码链为具有与所翻译的RNA相同的序列的链,除了出现T以替换U。因此,AUG起始密码子由编码链中的ATG序列编码,含有与RNA中的AUG起始密码子对应的该ATG序列的链称作为DNA的编码链。本领域技术人员清楚的是,起始密码子或翻译起始序列事实上出现在RNA分子中,但是它们可以被认为是等同地出现在编码这样的RNA分子的DNA分子中;因此,除了特别说明的,本发明无论在哪指出起始密码子或翻译起始序列,都包括相应的具有与该RNA分子相同序列(但在所述 DNA分子的编码链中用T的出现替代U)的DNA分子,反之亦然。换句话说,在本发明中,起始密码子例如为RNA中的AUG序列,但DNA的编码链中的相应的ATG序列也被称作为起始密码子。同样的用于指代“框中”的编码序列,意思是翻译为氨基酸的RNA分子中的三联体 (3个碱基),也解释为DNA分子的编码链中的对应的三核苷酸序列。在一种优选的实施方式中,编码可选择的标志物和有功能的开放阅读框的核苷酸序列的翻译起始密码子中的至少一个为ATG密码子。更优选地,为了允许更严格的选择(见下文),至少编码有功能的开放阅读框的核苷酸序列的起始密码子为ATG密码子,在这种情况下,编码可选择的标志物的核苷酸序列的起始密码子可以为非ATG起始密码子(也称为次优或弱的翻译起始密码子),以允许更严格的选择(见下文)。最优选地,编码可选择的标志物和有功能的开放阅读框的核苷酸序列的翻译起始密码子都为ATG密码子。但是,本发明不排除编码有功能的开放阅读框的核苷酸序列的起始密码子为非ATG起始密码子。非ATG起始密码子在此理解为在起始密码子中含有降低真核宿主细胞中可选择的标志物多肽翻译起始效率的突变的起始密码子。本发明中可以用于可选择的标志物的编码序列的非ATG起始密码子的实例包括例如GTG、TTG、CTG、ATT和ACG。在一种优选的实施方式中,ATG起始密码子突变成GTG起始密码子。更优选地,ATG起始密码子突变为TTG起始密码子,它提供了比GTG起始密码子更低的可选择的标志物多肽的表达水平(也参见WO 2006/048459的实施例9_13,通过引用并入至此)。当使用非ATG起始密码子时,特别优选的是,所述非ATG起始密码子出现在翻译起始密码子的最佳位置,例如本文下面所定义的 Kozak序列(Kozak consensus sequence)。当为可选择的标志物使用非ATG起始密码子时, 可以将编码可选择的标志物的核苷酸序列突变为内部不含ATG密码子,特别是内部不含与非ATG起始密码子同框的ATG密码子。在构建体中优选的是,其中,可选择的标志物在编码目标基因产物的核苷酸序列的上游,而在编码目标基因和标志物以及基因产物的序列之间不使用IRES。WO 2006/048459公开了如何实现这些方案(例如,通过替换、插入或删除,优选通过替换),以及如何检测得到的可选择的标志物多肽的功能性。在本发明的核酸构建体中,进一步优选的是,避免将非ATG起始密码子用于有功能的开放阅读框,如果下游的可选择的标志物的起始密码子为ATG密码子时特别要如此,因为这可能不会引发可选择的标志物的翻译效率的明显下降。在一种实施方式中,编码可选择的标志物和有功能的开放阅读框的核苷酸序列的起始密码子中的至少一个是嵌入在Kozak序列中的。所述Kozak性序列(对于脊椎动物宿主细胞)在此定义为 ANN (AUG) N (SEQ ID NO :29)和 GNN (AUG)G (SEQ ID NO :30),其中,(AUG) 代表相关编码序列的起始密码子。优选地,在(AUG)前面的两个N都是C。一种更优选的 Kozak序列为GCCRCC (AUG) G (SEQ ID NO :31),其中R为嘌呤。在进一步优选的实施方式中, 所述Kozak序列之前可以有另外一个GCC三联体。术语“可选择的标志物”是本领域普通技术人员熟知的术语,在此用于描述任意的遗传实体,当表达该遗传实体时,可以用于选择含有可选择的标志物的一个或多个细胞。可选择的标志物可以是显性的或隐性的或双向的。可选择的标志物可以是编码产物的基因, 它使得细胞表达抗选择剂(比如,抗生素或除草剂)的基因。可选择的标志物可以例如编码选择蛋白质,该选择蛋白质能够消除或灭活有毒选择剂,并保护宿主细胞免受选择剂的致死或生长抑制效果的影响。其它可选择的标志物与在一定条件下细胞生长抑制的不足相互补。这种基因的实例包括赋予营养缺陷型菌株的原养型的基因。术语“报告(reporter)” 主要是用来指可见的标志物,如绿色荧光蛋白(GFP)、eGFP、荧光素酶、GUS等,以及nptll标志物等。这些报告可以通过积极地将表达标志物的细胞与不表达标志物的细胞分选出来, 用于选择表达可见标志物的细胞,例如,使用荧光激发细胞分选仪(FACQ来选择表达荧光标志物蛋白的细胞。优选地,根据本发明的可选择的标志物提供了对选择剂的致死和/或生长抑制效果的抗性。在本发明中使用的编码可选择的标志物的核苷酸序列编码可用于真核宿主细胞的选择的蛋白质,例如,与不表达可选择的标志物蛋白的宿主细胞相比,由于蛋白在宿主细胞中的表达,为表达可选择的标志物蛋白的宿主细胞提供了生长优势。优选的编码可选择的标志物的核苷酸序列,凭借所编码的可选择的标志物蛋白在宿主细胞中的表达,提供了对选择剂(如抗生素)的抗性,而这些选择剂引起了不表达该可选择的标志物蛋白的宿主细胞的死亡和/或生长抑制。因此,根据本发明的可选择的标志物在宿主细胞中必须是有功能的,并因此能够在真核宿主细胞中得到选择。满足这个标准的任意的可选择的标志物多肽原则上都可以用于本发明。当得到真核宿主细胞克隆后,这些可选择的标志物在本领域是公知而且是常规使用的,并且在此提供了若干实例。为了方便和得到技术人员的普遍接受,在许多出版物以及本文中,编码可选择的标志物的基因和引起对选择剂的抗性的可选择的标志物通常分别被称为“可选择剂(抗性)基因”或“选择剂(抗性)蛋白”,虽然正式的名称可能会有所不同,例如编码赋予抗新霉素(以及G418和卡那霉素)的抗性的蛋白的基因通常被称为新霉素(抗性)(或nec/) 基因,而正式名称是氨基糖苷3’ -磷酸转移酶基因。在发明的一种优选实施方式中,所述可选择的标志物提供了对选择剂的致死或生长抑制效果的抗性,所述选择剂选自由博莱霉素(bleomycin)抗生素家族、嘌呤霉素 (puromycin)、杀稻瘟菌素(blasticidin)、潮霉素、氨基糖苷类抗生素、甲氨蝶呤和蛋氨酸亚砜亚胺(methionine sulphoximine)组成的组。编码提供对博莱霉素抗生素家族的抗性的可选择的标志物的核苷酸序列例如为 编码野生型“ble”基因的核苷酸序列,包括但不限于Si ble、Tr^ble和Μ ble。它们的实例如SEQ ID NO :1所描述。一般情况下,由ble基因编码的基因产物赋予它们的宿主对博莱霉素家族的铜螯合糖肽抗生素的抗性,所述铜螯合糖肽是切割DNA的糖肽。根据本发明,用作选择剂的博莱霉素家族的抗生素的实例包括但不限于博莱霉素、腐草霉素(phleomycin)、 他利霄素(tallysomycin)、培洛霄素(ρ印leomycin)禾口 Zeocin 。编码提供对嘌呤霉素的抗性的可选择的标志物的核苷酸序列例如为如SEQ ID NO 2所描述的,编码野生型嘌呤霉素抗性蛋白的核苷酸序列。编码提供对杀稻瘟菌素的抗性的可选择的标志物的核苷酸序列例如为如SEQ ID NO 3所描述的,编码野生型杀稻瘟菌素抗性蛋白的核苷酸序列。编码提供对潮霉素的抗性的可选择的标志物的核苷酸序列例如为如SEQ ID NO 4所描述的,编码野生型潮霉素抗性蛋白的核苷酸序列。编码提供对氨基糖苷类抗生素的抗性的可选择的标志物的核苷酸序列例如为如SEQ ID N0:5所描述的,编码野生型氨基糖苷3’ -磷酸转移酶的核苷酸序列。根据本发明的氨基糖苷公知为氨基糖苷类抗生素(Mingeot-Leclercq,M. et al.,1999, Chemother. 43 :727-737),它含有至少一个通过糖苷键连接该分子的另一半的氨基吡喃糖或氨基呋喃糖部分。它们的抗生素效果是基于对蛋白质合成的抑制。根据本发明,用作选择剂的氨基糖苷类抗生素包括但不限于卡那霉素(Kanamycin)、链霉素(Str印tomycin)、 庆大霉素(Gentamicin)、托普霉素(Tobramycin)、G418 (遗传霉素,Geneticin)、新霉素 B (Neomycin B, Framycetin)、西苏霉素(Sisomicin)、丁胺卡那霉素(Amikacin)、异帕米星 (Isepamicin)等等。可用于本发明的其它的可选择的标志物的实例为可以用作营养缺陷型(代谢)选择标志物的可选择的标志物,包括例如胱硫醚Y-裂解酶基因、DHFR基因和谷氨酰胺合成酶(GQ基因。使用这些类型的代谢酶作为可选择的标志物多肽的潜在的好处是,它们可以被用来在连续选择下维持宿主细胞,这在特定情况下可能具有优势(另见下文)。编码提供对甲氨蝶呤的抗性的可选择的标志物的核苷酸序列例如为如SEQ ID NO :6所描述的,编码野生型二氢叶酸还原酶(DHFR)的核苷酸序列。所述DHFR基因,可以通过甲氨蝶呤得到选择,特别是通过甲氨蝶呤的浓度的增加,可以选择DHFR基因的拷贝数增加的细胞。DHFR基因也可用于DHFR缺陷的补充,例如在含有叶酸且不含甘氨酸、次黄嘌呤和胸腺嘧啶脱氧核苷(thymidine),或至少不含次黄嘌呤和胸腺嘧啶脱氧核苷的培养基中的具有DHFR_表型的CHO细胞中。如果可选择的标志物为DHFR,在有利的实施方式中的宿主细胞培养在含有叶酸的培养基中,并且所述培养基基本上不含次黄嘌呤和胸腺嘧啶脱氧核苷,并且优选也不含甘氨酸。一般地,“培养基基本上不含”在此是指该培养基具有不足以维持细胞在所述培养基中的生长的所指的组分,从而使得当所指的酶的遗传信息在细胞中得到表达,并且所指的前体组分出现在所述培养基中的时候,良好的选择是可能的。优选地,所述所指的组分不包含在所述培养基中。不含所述所指的组分的培养基可以由技术人员按标准方法制备,或者可以从商业培养基供应商处获得。编码提供对蛋氨酸亚砜亚胺的抗性的可选择的标志物的核苷酸序列例如为如 SEQ ID NO :7或8所描述的,编码野生型人或小鼠谷氨酰胺合成酶(GQ的核苷酸序列。在不含谷氨酰胺的培养基中培养的含有不足量的GS的细胞(如NS-O细胞)中,或者备选地, 在加入了 GS的抑制剂、蛋氨酸亚砜亚胺(MSX)的抑制剂的含有足够量的GS的细胞(如CHO 细胞)中,对于谷氨酰胺合成酶(GQ基因的选择是可能的。编码对氨基酸L-半胱氨酸的合成十分关键的可选择的标志物的核苷酸序列例如为如SEQ ID NO 9所描述的,编码野生型人或小鼠胱硫醚Y-裂解酶(EC 4. 4. 1. 1)的核苷酸序列。CHO细胞对胱硫醚到半胱氨酸的转换是天然营养缺陷的。因此,胱硫醚Y-裂解酶(cys-裂解酶)基因可通过与在不含L-半胱氨酸和和L-胱氨酸的培养基中培养细胞的互补,用于细胞的选择。在cys-裂解酶标志物的基础上的选择,可能需要在培养基中含有非毒性的前体L-胱硫醚(L-cystathionin)。在一些脊椎动物细胞系中,cys-裂解酶作为可选择的标志物的使用可能首先需要内源性胱硫醚Y-裂解酶基因的失活(敲除)。可以在本发明的范围内使用的其它的可选择的标志物和它们的选择剂示例性地在US 5561053的表1中有所描述,通过引用并入至此;这些可选择的标志物和它们的选择剂的综述还参见 Kaufman,Methods in Enzymology,185 :537-566 (1990)。术语“选择”典型地被定义为使用可选择的标志物和选择剂,来识别具有特定的遗传特性(如宿主细胞中含有整合到它的基因组中的基因)的宿主细胞的过程。本领域技术人员清楚的是,选择标志物的多种组合是可能的。因为博来霉素抗性蛋白(zeocin-R)通过结合药物并使它无害化来起作用,特别优异地作为选择剂的一种抗生素是博来霉素。因此很容易确定致死zeocin-R表达水平低的细胞,同时允许高表达的细胞存活的药物用量。普遍使用的其他抗生素抗性的可选择的标志物中,如果不全是那就大多数是酶,并且因此以催化方式(即,不以给定的比如与选择剂的化学计量为1 1的方式)起作用。因此,抗生素博来霉素是优选的可选择的标志物。在一种实施方式中,降低所述可选择的标志物多肽的翻译延伸效率,与降低翻译起始效率的择一或者结合,都可以是有益的。这可以通过,例如将编码可选择的标志物多肽的序列进行突变以减少考虑的所述宿主细胞的密码子使用的适应性来实现。这再次提供了对本发明的核酸构建体的选择的严格性的更高水平的控制。因此,编码可选择的标志物蛋白的核苷酸序列,优选适应于考虑的所述宿主细胞中次优的密码子使用。编码酶的核苷酸序列对宿主细胞的密码子使用的适应性可表示为密码子适应指数(CAI)。所述密码子适应指数在此定义为在特定的宿主细胞或生物中,基因的密码子的使用相对于高表达基因的密码子的使用的相对适应性的测量。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸的丰度最高的密码子的使用的比值。CAI指数定义为这些相对适应性值的几何平均值。非同义密码子和终止密码子(依赖于遗传编码)是排除在外的。CAI值介于0到1之间,越高的值表明越高的丰度最高的密码子的比例(参见Siarp and Li,1987, Nucleic Acids Research 15 :1281-1295 ;还参见Kim et al.,Gene. 1997,199 :293-301 ; zur Megede et al. ,Journal of Virology,2000,74 :洸沘_2635)。根据本发明的密码子适应的核苷酸序列优选具有不超过0. 7,0. 6,0. 5,0. 4,0. 3或0. 2的CAI。在一种实施方式中,本发明的上述实施方式的择一或者结合,只要所述可选择的标志物仍然是有功能的,可选择的标志物的突变体或衍生物,根据本发明都是适宜使用的, 并且因此包括在术语“可选择的标志物”的范围内。可选择的标志物的突变体或衍生物与它的野生型复本相比,优选具有降低的可选择的标志物的活性,这允许对精确调节本发明的核酸构建体的选择的严格性的更高水平的控制。在一种优选的实施方式中,一种或多种其他实施方式的择一或结合,编码可选择的标志物的核苷酸序列编码含有一个或多个突变的可选择的标志物多肽,所述突变(整体上)与它的野生型复本相比降低了所述可选择的标志物多肽的活性。突变的可选择的标志物多肽的活性可以等于或高于它的野生型复本的活性的 90%、80%、70%、60%、50%、40%、30%、20%、10%、5%或 IV0o作为非限制的实例,在博来霉素抗性多肽9位上的脯氨酸可以被突变,例如突变为Thr或Phe (例如参见,WO 2006/048459的实施例14,通过引用并入至此),而对于新霉素抗性多肽,182或沈1位的氨基酸残基或两者都可以进一步被突变(参见如WO 01/32901) 0在一种优选的实施方式中,具有降低活性的可选择的标志物多肽选自由以下多肽组成的组a)9位的脯氨酸改变成不同的氨基酸的博来霉素抗性多肽;b) 10位的缬氨酸改变成不同的氨基酸的博来霉素抗性多肽;c) 12位的苏氨酸改变成不同的氨基酸的博来霉素抗性多肽;d) 14位的精氨酸改变成不同的氨基酸的博来霉素抗性多肽;e)21位的谷氨酸改变成不同的氨基酸的博来霉素抗性多肽;f) 22位的苯丙氨酸改变成不同的氨基酸的博来霉素抗性多肽;g)25位的天门冬氨酸改变成不同的氨基酸的博来霉素抗性多肽;h)28 位的甘氨酸改变成不同的氨基酸的博来霉素抗性多肽;i)33位的苯丙氨酸改变成不同的氨基酸的博来霉素抗性多肽;j) 35位的甘氨酸改变成不同的氨基酸的博来霉素抗性多肽; k)73位的谷氨酸改变成不同的氨基酸的博来霉素抗性多肽;1)76位的丙氨酸改变成不同的氨基酸的博来霉素抗性多肽;m)82位的缬氨酸改变成不同的氨基酸的博来霉素抗性多肽;n)88位的天门冬氨酸改变成不同的氨基酸的博来霉素抗性多肽;0)94位的甲硫氨酸改变成不同的氨基酸的博来霉素抗性多肽;和P) 182和261位氨基酸残基中的至少一个改变成不同的氨基酸的新霉素抗性多肽。在一种更优选的实施方式中,具有降低活性的可选择的标志物多肽选自由以下多肽组成的组a)9位的脯氨酸改变成半胱氨酸、谷氨酰胺或苏氨酸的博来霉素抗性多肽; b) 10位的缬氨酸改变成丙氨酸的博来霉素抗性多肽;c) 12位的苏氨酸改变成丙氨酸的博来霉素抗性多肽;d) 14位的精氨酸改变成脯氨酸的博来霉素抗性多肽;e)21位的谷氨酸改变成甘氨酸的博来霉素抗性多肽;f) 22位的苯丙氨酸改变成酪氨酸的博来霉素抗性多肽; g)25位的天门冬氨酸改变成甘氨酸的博来霉素抗性多肽;位的甘氨酸改变成精氨酸的博来霉素抗性多肽;i)33位的苯丙氨酸改变成亮氨酸的博来霉素抗性多肽;j)35位的谷氨酸改变成甘氨酸的博来霉素抗性多肽;k)73位的谷氨酸改变成甘氨酸或赖氨酸的博来霉素抗性多肽;1)76位的丙氨酸改变成苏氨酸的博来霉素抗性多肽;m)82位的缬氨酸改变成谷氨酸的博来霉素抗性多肽;η)88位的天门冬氨酸改变成甘氨酸的博来霉素抗性多肽; ο) 94位的甲硫氨酸改变成缬氨酸的博来霉素抗性多肽。在更进一步优选的实施方式中,具有降低活性的可选择的标志物多肽选自由以下多肽组成的组a)具有以下至少一种改变的博来霉素抗性多肽10位的缬氨酸改变成丙氨酸、12位的苏氨酸改变成丙氨酸和35位的谷氨酸改变成甘氨酸;b)具有以下至少一种改变的博来霉素抗性多肽14位的精氨酸改变成脯氨酸、73位的谷氨酸改变成赖氨酸和88位的天门冬氨酸改变成甘氨酸;c)具有以下至少一种改变的博来霉素抗性多肽21位的谷氨酸改变成甘氨酸和76位的丙氨酸改变成苏氨酸;d)具有以下至少一种改变的博来霉素抗性多肽 位的甘氨酸改变成精氨酸和73位的谷氨酸改变成甘氨酸;和e)具有以下至少一种改变的博来霉素抗性多肽22位的苯丙氨酸改变成酪氨酸和25位的天门冬氨酸改变成甘氨酸中。关于在上述实施方式中活性降低的突变多肽的野生型博来霉素抗性多肽的实例可以定义为如SEQ ID N0:10所提供的。明确的是,只要各自编码的可选择的标志物蛋白仍然具有活性,即,提供所需水平的对选择剂的抗性,本发明还包括在编码所述可选择的标志物多肽的第一个ATG (起始密码子)的下游的序列中具有突变的如上所述的本发明的核酸构建体。例如,还包括任意的由于遗传编码的冗余而不改变编码蛋白的无义突变。只要编码的蛋白仍具有活性,本发明还可以包括导致保守氨基酸突变或其它突变的进一步突变,所述活性可能会或可能不会低于由指出的序列所编码的野生型蛋白的活性。具体地,优选的是,编码的蛋白的氨基酸序列与所指出的氨基酸序列(例如,SEQ ID NO :1-8中任意一个所提供的)分别具有至少70%, 优选至少80%,更优选至少90%,更进一步优选至少95%的一致性。所述可选择的标志物蛋白的活性可以通过常规方法测试得到(参见例如本文的实施例4和5)。与野生型胱硫醚γ -裂解酶(CLase)复本相比CLase活性降低的CLase氨基酸序列的突变的实例为,例如由Wang和Hegele所描述的(2002,Hum. Genet. 112 :404-408),并且包括突变T67I、Q240E和S403I中的一个或多个。本文明确包括其它生物体的CLase氨基酸序列的相应突变,例如突变T66I和Q239E。在第二个方面,本发明涉及一种表达盒,该表达盒含有根据本发明的核酸构建体,其中,所述表达盒含有与多顺反子转录单元可操作地连接的启动子和位于多顺反子转录单元下游的转录终止序列,并且,其中,所述启动子在真核宿主细胞中对起始所述多顺反子转录单元的转录是有功能的。在此使用的“表达盒”为至少包括与所需表达的序列功能性连接的启动子的核苷酸序列。优选地,表达盒还包括转录终止序列和多聚腺苷酸化序列。还可以包括其它的调控序列,如增强子。因此,本发明提供了一种表达盒,优选地,该表达盒在5’至3’的方向上包括5’_启动子-根据本发明的多顺反子转录单元,包括有功能的开放阅读框和它下游的编码可选择的标志物多肽的序列-转录终止序列_3,。启动子,以及其它调控序列,必须能够在考虑的所述真核宿主细胞中发挥功能,也就是说,它必须能够驱动多顺反子转录单元的转录。因此,启动子是与多顺反子转录单元可操作地连接的。所述表达盒可以选择性地进一步包括本领域已知的其它元件,例如,为了包括内含子的剪接位点,等等。在一些实施方式中,内含子存在于启动子之后且在编码有功能的开放阅读框的序列之前。在其它实施方式中,IRES可以存在于包括所述可选择的标志物多肽的编码序列的多顺反子转录单元中, 所述IRES可以与位于可选择的标志物编码序列的上游的有功能的开放阅读框可操作地连接,或者所述IRES可以与下一个顺反子可操作地连接。启动子可以为组成型的或调控的,并且可以取自多种来源,包括病毒、原核或真核来源,或人工设计。目标核酸的表达,可以来自天然启动子或它们的衍生物,或者来自完全异源的启动子(Kaufman, 2000, Mol. Biotechnol 16 :151-160) 根据本发明,在所选的真核细胞中提供高转录水平的强启动子是优选的。一些公知的和经常在真核细胞的表达中使用的强启动子,包括来自病毒(如腺病毒)的启动子,例如ElA启动子;来自巨细胞病毒 (CMV)的启动子,例如CMV立即早期(IE)启动子(在此称为CMV启动子)(例如可从pcDNA, Invitrogen 获得);来自猴病毒 40 (SV40)的启动子(Das et al, 1985,Prog Nucleic Acid Res Mol Biol.鉴217-36),等等。合适的强启动子也可以来自真核细胞,如金属硫蛋白 (methallothionein) (MT)启动子;延伸因子(EF-1 α )启动子;泛素C或UB6启动子(Gill et al.,2001,Gene Therapy8 1539-1546 ;Schorpp et al,1996, Nucleic Acids Res 24 1787-8);肌动蛋白启动子,例如β-肌动蛋白启动子,例如仓鼠或人β-肌动蛋白启动子 (SEQ IDNO 11);免疫球蛋白启动子;热休克启动子等等。启动子的功能和强度的检测对本领域技术人员而言是常规的,例如一般包括在启动子序列之后克隆如IacZ基因、荧光素酶、GFP等报告基因,并检测该报告基因的表达。当然,启动子可以通过它们的序列的删除、 增加、突变来改变,并且检测功能性,以寻找新的、减毒的、或改进的启动子序列。在第三个方面,本发明涉及一种表达载体,该表达载体含有根据本发明的表达盒, 优选进一步含有编码目标基因产物的核苷酸序列。表达载体(又称表达系统),例如质粒, 可以很容易地通过本领域技术人员公知的方法来操作,例如可以设计为能够在原核和/或真核细胞中复制。此外,许多载体可以直接或以从中分离的所需片段的形式用于真核细胞的转化,并且将会全部或部分整合到这些细胞的基因组中,得到基因组中含有所需核酸的稳定的宿主细胞。传统的表达系统为重组质粒或重组病毒基因组形式的DNA分子。通过本领域公知的方法,将质粒或病毒的基因组导入(真核宿主)细胞,并优选地整合到它们的基因组中, 这里的几个方面在WO 2006/048459(如第30-31页)中已有描述,通过引用并入至此。
得到广泛理解的是,染色质结构和其它表观遗传学控制机制可能会影响转基因在真核细胞中的表达(例如.Whitelaw et al, 2001,Methods Mol Biolj58 :351-68)。根据本发明的核酸构建体、表达盒和载体,按照相当严格的选择机制的形成部分选择系统。这通常需要在所选宿主细胞中的高转录水平。为了增加找到在严格的选择机制下存活的宿主细胞的克隆,并有可能增加获得的克隆中表达的稳定性的机会,一般优选增加转录的可预见性。 因此,在优选的实施方式中,根据本发明的表达盒进一步包括至少一个染色质控制元件。此处使用的“染色质控制元件”是在真核细胞中,可以在一定程度上影响染色质结构,并由此影响它们附近的转基因的表达水平和/或表达稳定性(它们的功能是“顺式”的,并因此优选位于距离转基因51Λ内的位置,更优选21Λ内的位置,更进一步优选11Λ内的位置)的DNA 序列的总称。这些元件有时被用来增加具有所需的转基因表达水平的克隆的数量。本发明可以使用的这种元件的多个类型已在WO 2006/048459(如32-34页)中有所描述,通过引用并入至此,为了本发明的目的,染色质控制元件选自由基质附着区或支架附着区(MARs/ SARs);绝缘子,如β-珠蛋白绝缘子元件(鸡β-珠蛋白座位的5’ HS4) ;scs ; scs’等等; 遍在染色质打开元件(ubiquitous chromatin opening element, UCOE);和抗抑制子序列 (也称为“STAR”序列)组成的组。优选地,所述染色控制元件为抗抑制子的序列,优选选自由W02007/096399中公开的SEQ ID NO 1到SEQ ID NO 66组成的组。更优选地,所述染色质控制元件选自由如 WO 2007/096399 中公开的 STAR67、STAR7、STAR9、STAR17、STAR27、STAR29、STAR43、STAR44、 STAR45、STAR47、STAR61或所述STAR序列的功能片段或衍生物所组成的组。在最优选的实施方式中,使用的是STAR7和STAR67的组合,或STAR7和STAR67的功能片段或衍生物。在特定的优选实施方式中,STAR7和STAR67中的至少一种或它们的功能片段或衍生物,定位于驱动多顺反子转录单元的表达的启动子的上游。在其它的优选实施方式中,根据本发明的表达盒的两侧均与至少一个如上所述的抗抑制子序列相连接。在特定的实施方式中,根据本发明提供的表达盒,在5’至3’顺序上包括抗抑制子序列A-抗抑制子序列B-[启动子-根据本发明的多顺反子转录单元(编码目标基因产物和它下游的有功能的可选择的标志物蛋白)_转录终止序列]_抗抑制子序列C,其中A、B和C可以相同或不同。在优选的实施方式中,A和C为STAR7,且B为STAR67。具有抗抑制子活性及其特征的序列(抗抑制子序列),以及它的功能片段或衍生物,以及它的结构和功能的定义,以及获取和使用它们的方法,都已在WO 2006/048459(如34-38页)中有所描述,通过引用并入至此,这些序列可用于本发明。另一个优选用于本发明的基因表达增强元件(可以用来代替上述染色质控制元件或抗抑制子序列)是作为基因间转录的源头起作用的核酸片段。优选地,作为基因间转录的源头起作用的核酸片段包括,位于脊椎动物Rbl或P15基因的翻译起始位点的上游,并且作为基因间转录的源头起作用的基因组区域中的至少1000、1500、2000、3500或7000个连续的核苷酸。优选地,所述核酸片段包括SEQ ID NO :35(人RblF和E)中的至少1000、 1500,2000,3500或7000个连续的核苷酸,由位于人Rbl基因的翻译起始位点上游约71Λ的核苷酸序列组成。更优选地,所述核酸片段包括SEQ ID NO :36(人RblE)中的至少1000、 1500、2000、2500、3000或3498个连续的核苷酸(也参见本文的实施例)。择一优选地,所述核酸片段包括 SEQ ID N0:37(AP15C)中的至少 1000、1500、2000、2500、3000 或 3352 个连续的核苷酸。在特定的实施方式中,提供根据本发明的表达盒,该表达盒在5’至3’顺序上包括作为基因间转录的源头起作用的核酸片段A-[启动子-根据本发明的多顺反子转录单元(编码目标基因产物和可选择的标志物CLase)-转录终止序列]-作为基因间转录的源头起功能的核酸片段B,其中,A和B可以相同或不同。在优选的实施方式中,A和B为 SEQ ID NO :36,或A和B为SEQ ID NO :37,或A禾口 B为如上所示的SEQ ID NO 36和37的子片段。根据本发明的目标基因产物,可以为任意的基因产物,例如蛋白。目标基因产物可以为单亚基蛋白或(部分)多亚基蛋白。多亚基蛋白包括至少两个多肽链。根据本发明的目标蛋白的非限制性的实例是酶、激素、免疫球蛋白或它们的链或片段;治疗蛋白,如抗癌蛋白;血凝蛋白,如因子VIII ;多功能蛋白质,如促红细胞生成素;治疗蛋白,诊断蛋白质; 或用于疫苗目的的蛋白或它们的片段,这些都已为本领域技术人员公知。目标基因产物可以来自任意的来源,在特定的实施方式中为哺乳动物蛋白、人工蛋白(如融合蛋白或突变蛋白),优选为人蛋白。在优选的实施方式中,编码目标基因产物的核苷酸序列为使用宿主细胞的密码子适应指数,对要表达目标肽的宿主细胞进行密码子优化的。在一种实施方式中,当最终目标是RNA分子而不是目标多肽的产生,使用本发明的表达盒,如用于从表达盒中产生增加数量的RNA,这可用于调节其它基因(如RNAi,反义 RNA)、基因治疗、体外蛋白生产等。对于多亚基蛋白的生产,可以使用两个或两个以上的表达盒。优选地,两个表达盒都为根据本发明的多顺反子表达盒,每一个编码不同的可选择的标志物蛋白,从而使得这两个表达盒的选择都是可能的。这种实施方式已被证明提供了良好的结果,如抗体的重链和轻链的表达。明确的是,在它们导入宿主细胞前,两个表达盒可以置于一个核酸分子中, 或者可以位于单独的核酸分子中。将它们放在一个核酸分子中的好处是,在导入宿主细胞时,这两个表达盒以预先确定的比例(如1 1)存在。另一方面,当位于两个不同的核酸分子中时,这使得当它们导入宿主细胞时,两个表达盒的摩尔比是能够改变的,如果优选的摩尔比不为1 1,或之前不知道优选的摩尔比为多少时,这可能为一个优势,从而使得技术人员可以容易地对它进行改变并经验性地找到优选值。根据本发明,优选地,至少一个表达盒,但更优选地,它们中的每一个包括染色质控制元件,更优选为抗抑制子序列。在另一种实施方式中,多亚基蛋白的不同亚基或部分存在于单一的表达盒中。抗抑制子与表达盒相结合的有益构型已在WO 2006/048459(如第40页)中有所描述,通过引用并入至此。在优选的实施方式中,编码目标基因产物的核苷酸序列包括在多顺反子转录单元中。在多顺反子转录单元中,编码目标基因产物的核苷酸序列可以位于有功能的开放阅读框和可选择的标志物的上游(即5’端)。优选地,编码目标基因产物的核苷酸序列位于可选择的标志物的下游(即3’端)。在这些情况中,多顺反子转录单元优选设置为使得上游开放阅读框以帽依赖性的方式被翻译,而下游的一个或多个开放阅读框处于IRES的翻译控制之下。例如,如果编码目标基因产物的核苷酸序列位于有功能的开放阅读框和可选择的标志物的上游,编码目标基因产物的序列是以帽依赖性的方式被翻译的,并且有功能的开放阅读框处于IRES的翻译控制之下。反之亦然,如果编码目标基因产物的核苷酸序列位于可选择的标志物的下游,有功能的开放阅读框是以帽依赖性的方式被翻译的,并且编码目标基因产物的序列处于IRES的翻译控制之下。在IRES上游的编码序列包括终止密码子,这样使得翻译在IRES的上游结束,该IRES与下游的密码子序列可操作地连接。 内部核糖体结合位点(IREQ元件是已知来自病毒和哺乳动物基因的(Martinez-Mlas, 1999,Curr Opin Biotechnol迎458-464),并且也已通过小合成寡核苷酸的筛选得到鉴定(Venkatesan&Dasgupta,2001Mol Cell Biol M :2拟6_2837)。来自脑心肌炎病毒的 IRES 已经得到了详细地分析(Mizuguchi et al. ,2000, Mol Ther 丄376-382)。IRES 是以 DNA 编码的元件,它在转录的RNA中产生真核生物核糖体可以结合并起始翻译的结构。IRES允许单一的RNA分子产生两个或两个以上的蛋白(第一个蛋白通过与RNA在它的5’端的帽子结构结合的核糖体翻译(Martinez-Mlas,1999,如前)。在一种实施方式中,根据本发明的表达载体包括额外的选择标志物,例如,如前所描述的dhfr代谢的选择标志物。这种核酸构建体的优点是,对高表达细胞的选择可以通过与IRES可操作地连接的选择标志物(例如博来霉素,新霉素等)的使用而建立,由此,在高表达的宿主细胞的选择之后,抗生素的选择不再继续,并且使用另外的选择标志物进行或连续或间歇的选择。在这方面的多顺反子转录单元至少是三顺反子的。为了不同目标基因产物的表达,也当这些形成多亚基蛋白的部分的时候,优选使用单独的转录单元(参见,例如WO 2006/048459的实施例13,通过引用并入至此抗体的重链和轻链中的每一个都是由单独的转录单元编码的,这些表达单元中的每一个都是双顺反子表达单元)。根据本发明,当两个多顺反子转录单元要在单一的宿主细胞中进行选择时,优选每一个包含编码不同的可选择的标志物的序列,以允许对两个多顺反子转录单元都进行选择。当然,两个多顺反子转录单元可以都存在于单一的核酸分子上,或者备选地, 每一个可以存在于单独的核酸分子上。在第四个方面,本发明涉及一种真核宿主细胞,该真核宿主细胞含有根据本发明的核酸构建体、根据本发明的表达盒或根据本发明的表达载体。术语“细胞”或“宿主细胞”以及“细胞系”或“宿主细胞系”,分别定义为可以通过本领域已知的方法在细胞培养基中维持,并具有表达异源或同源蛋白的能力的细胞及其同质化群落。所述宿主是真核宿主细胞,如真菌、昆虫或脊椎动物来源的细胞。更优选地,所述宿主细胞为哺乳动物细胞。可以使用的若干个示例性的宿主细胞在WO 2006/048459(如 41-42页)中有所描述,通过引用并入至此,这些细胞包括例如,哺乳动物细胞,包括但不限于 CHO 细胞,如 CHO-Kl、CHO-S, CH0-DG44、CH0-DG44-S、CH0-DUKXBI1 ;包括具有 dhfr-表型的CHO细胞;以及骨髓瘤细胞(例如,Sp2/0, NS0)、HEK 293细胞、HEK 294细胞和PER. C6细胞。这些真核宿主细胞可以表达所需的基因产物,也常常以该目的使用。它们可以通过将本发明的核酸构建体,优选以根据本发明的表达盒或表达载体的形式,导入细胞而获得。优选地,表达盒整合到宿主细胞的基因组中,在不同的宿主细胞中它可以处于不同的位置,而选择将提供转基因整合到合适的位置上的克隆,得到具有所需的表达水平、稳定性、 生长特性等的宿主细胞克隆。备选地,多顺反子转录单元可以靶向地或随机选取地整合到转录活跃的染色体区域,例如在基因组中存在的启动子之后。含有本发明的DNA的细胞选择可以利用本领域技术人员公知的常规技术通过选择可选择的标志物多肽来进行。当这样的多顺反子转录单元整合到基因组中的启动子之后时,根据本发明表达盒可在原位,即宿主细胞基因组内生成。优选地,宿主细胞来自可以根据本领域技术人员公知的标准程序而选择和增殖的稳定克隆。如果所述细胞含有本发明的多顺反子转录单元,这样的克隆的培养物能够产生目标基因产物。要在细胞中表达的核酸的导入,可以通过几种方法中的一种来进行,这些方法是本领域技术人员所公知的,也取决于要引入的核酸的形式。所述方法包括但不限于转染、感染、注射、转化等等。通过选择可得到表达目标基因产物的合适的宿主细胞。在优选的实施方式中,根据本发明的核酸构建体,优选以表达盒的形式,整合到根据本发明的真核宿主细胞的基因组中。这将为多顺反子转录单元提供稳定的可继承性。在第五个方面,本发明涉及一种产生用于表达目标基因产物的真核宿主细胞的方法,其中,该方法包括如下步骤a)将根据本发明的表达载体导入到多个宿主细胞中;b)在选择可选择的标志物多肽的表达的条件下,培养a)中得到的多个宿主细胞;和c)选择至少一个表达用于目标基因产物的表达的可选择的标志物多肽的宿主细胞。这种方法的优点与WO 2006/048459 (如46_47页)中公开的方法中所描述的那些优点类似,通过引用并入至此。尽管可以获得具有相对低拷贝数量的多顺反子转录单元和高表达水平的克隆,但是本发明的选择系统可以与扩增方法结合,以进一步提高表达水平。 例如,这可以通过用甲氨蝶呤的共整合DHFR基因的扩大来完成,例如,将DHFR放置在与本发明的多顺反子转录单元的相同的核酸分子上,或当dhfr在单独的DNA分子上时通过共转染来完成。所述DHFR基因也可以作为本发明的多顺反子表达单元的部分。对可选择的标志物多肽的存在以及由此的表达的选择,可在宿主细胞的初始获得期间进行。在某些实施方式中,选择剂至少在培养中的部分时间内,要么以选择表达可选择的标志物多肽的细胞来说足够的浓度,要么以较低的浓度,存在于培养基中。在第六个方面,本发明涉及一种表达目标基因产物的方法,该方法包括培养含有根据本发明的表达载体的宿主细胞,并从所述表达载体中表达所述目标基因产物。在优选的实施方式中,在最后的目标基因产物的生产阶段,选择剂不再存在于培养基中,以避免痕量的可能有毒的选择剂对基因产物的污染的任何风险。在进一步的优选实施方式中,所述表达载体包括一个营养缺陷型(或代谢)的选择标志物,并且所述宿主细胞在对营养缺陷型选择标志物的表达具有选择性的条件下培养。优选地,所述表达载体中的营养缺陷型选择标志物是如本文上面所定义的严格的营养缺陷型选择标志物。因此,编码营养缺陷型标志物的核苷酸可以包括在含有多顺反子转录单元的核酸构建体中,该单元包括a)编码营养缺陷型选择标志物的核苷酸序列;和b)有功能的开放阅读框,其中,含有多顺反子转录单元的核酸构建体如本文上面所进一步定义的(即,PPx构建体)。择一地,或与之结合地,编码营养缺陷型标志物的核苷酸可以包括如本文上面所定义的非ATG翻译起始密码子,和/或编码营养缺陷型标志物的核苷酸,该标志物可能编码具有与相应的野生型酶相比降低的酶活性的营养缺陷型标志物的变异体,如本文上面所定义的CLase标志物。营养缺陷型选择标志物在此定义为编码酶的核苷酸序列,该酶在营养缺陷型细胞生长所需的化合物,通常是有机化合物(如代谢物)的(生物)合成中,代谢一个或多个必
20要的步骤。通过营养缺陷型选择标志物的表达,营养缺陷型宿主细胞转化为能够在选择性的条件下生长的原养型(prototroph),在所述选择性的条件中,营养缺陷型细胞生长所需的化合物是不存在的,或者以将营养缺陷型细胞的生长速度降低到一定范围的浓度存在, 这允许包括了含有营养缺陷型标志物的表达载体的宿主细胞的选择。营养缺陷型生长所需的化合物通常为必需氨基酸或核苷,如不能由营养缺陷型宿主细胞(比如哺乳动物细胞) 合成的。优选地,生长所需的化合物为氨基酸、核苷、维生素或氨基酸、核苷、维生素的前体。优选地,在本发明中使用的编码营养缺陷型(或代谢)选择标志物的核苷酸序列包括,例如,如本文上面所定义的,编码L-胱硫醚Y-裂解酶(CLase)、二氢叶酸还原酶 (DHFR)和谷氨酰胺合成酶(GS)的核苷酸序列。使用营养缺陷型/代谢酶作为可选择的标志物多肽的好处是,它们可以被用来在连续选择条件下维持宿主细胞,而避免使用有毒的和/或价格昂贵的选择剂,比如剂抗生素。在该方法的实施方式中,所述可选择的标志物用作维持标志物。对营养缺陷型选择标志物的表达具有选择性的条件通常为培养基中不含有营养缺陷型宿主细胞生长所需的化合物的条件,其中,优选地,在培养基中存在通过营养缺陷型选择标志物酶来生物合成所述化合物的一种或多种前体。DHFR标志物的选择性的条件包括在培养基中含有叶酸且不含甘氨酸、次黄嘌呤和胸腺嘧啶脱氧核苷,或至少不含次黄嘌呤和胸腺嘧啶脱氧核苷。DHFR的标志物的选择性的条件包括在培养基中不含有谷氨酰胺。CLase标志物的选择性的条件包括不存在L-半胱氨酸和L-胱氨酸,优选存在L-胱硫醚。用于选择性的条件下生产基因产物的方法中的营养缺陷型宿主细胞可以为天然的营养缺陷型的宿主细胞。备选地,可以通过编码营养缺陷型标志物酶的内源性基因的灭活(敲除),来将宿主细胞制成营养缺陷型宿主细胞。备选地,在所述方法中,宿主细胞是在选择如本文上面定义的营养缺陷型标志物的表达的条件下培养的,这可以进一步包括营养缺陷型标志物活性的抑制剂的存在。因此,在优选的方法中,宿主细胞是在营养缺陷型标志物活性的抑制剂的存在下培养的。GS活性的抑制剂例如为蛋氨酸亚砜亚胺(MSX),而CLase 活性的抑制剂包括例如氨基乙氧基乙烯基甘氨酸(aminoethoxyvinylglycine)、炔丙基甘 M酸(propargylglycine) >HMMMSt (trifluoroalanine) 和L-β-草酰-氨基-L-丙氨酸(L-ii-oxalyl-amino-L-alanine),其中炔丙基甘氨酸是最优选的。在特定的实施方式中,本发明的表达载体编码免疫球蛋白的重链或轻链或抗原结合部分、它们的衍生物和/ 或类似物。在优选的实施方式中,提供了一种根据本发明的蛋白表达单元,其中,所述目标蛋白为免疫球蛋白重链。在另一种优选实施方式中,提供了一种根据本发明的蛋白表达单元,其中,所述目标基因产物为免疫球蛋白轻链。当这两个蛋白表达单元出现在相同的(宿主)细胞中时,多亚基蛋白,更具体为免疫球蛋白,得到组装。因此,在特定的实施方式中, 所述目标蛋白为免疫球蛋白,如抗体,其是多亚基蛋白。优选地,这些抗体是人的或人源化的抗体。在特定的实施方式中,是IgG、IgA或IgM抗体。免疫球蛋白可以通过在不同的表达载体上或在单一的表达载体上的重链和轻链来编码。因此,每个所述重链和轻链都可以存在于单独的表达载体上,每一个具有它自己的启动子(对于两个表达载体,它们可以是相同或不同的),每一个含有根据本发明的多顺反子转录单元,所述重链和轻链为目标基因产物,并且优选每一个编码不同的可选择的选择标志物蛋白,从而使得当表达载体导入和/ 或存在于真核宿主细胞中时,重链表达载体和轻链表达载体的选择都能进行。备选地,重链编码序列和轻链编码序列可以存在于单一的包括根据本发明的多顺反子转录单元的表达载体中,由单一的启动子驱动,并且其中,所述轻链和重链为目标基因产物,在它们各自的编码序列之间具有IRES序列。培养细胞是为了使其代谢、和/或生长和/或分裂和/或产生目标基因产物而进行的。这可以通过本领域技术人员公知的方法进行,包括但不限于为细胞提供养分。这些方法包括贴壁生长、悬浮生长、或它们的组合。培养例如可以在盘、旋转瓶、或生物反应器中,使用单批(batch)、分批进料(fed-batch)、连续系统,如灌注系统等来进行。为了通过细胞培养实现重组基因产物的大规模地(连续)生产,在本领域优选的是使细胞能够悬浮生长,并且优选的是使细胞能够在不存在动物源或人源的血清或者动物源或人源的血清组分的条件下被培养。细胞生长或繁殖的条件(参见,例如,Tissue Culture, Academic Press, Kruse and Paterson, editors (1973))和重组产品的表达条件是本领域技术人员公知的。一般地,最大化哺乳动物细胞培养物的生产能力的原则、方案和实用技术,可以在哺乳动物细胞生物技术(Mammalian Cell Biotechnology :a Practical Approach(M. Butler, ed. , IRL Press, 1991))中找到。在一种优选的实施方式中,根据本发明的表达目标基因产物的方法还包括收获目标基因产物。可以从细胞或培养基或细胞和培养基中收获、收集或分离所表达的基因产物, 例如蛋白。然后可以用已知的方法进一步纯化,例如过滤,柱层析等本领域技术人员一般知晓的方法。除非另有说明,本发明的实施将使用免疫学、分子生物学、微生物学,细胞生物学和重组DNA的常规技术,这在本领域的技术之内。参见,例如Sambrook,Fritsch and Maniatis, Molecular Cloning :A Laboratory Manual,2ndedition, 1989 ;Current Protocols in Molecular Biology, Ausubel FM, et al, eds,1987 ;the series Methods in Enzymology(Academic Press, Inc.) ;PCR2 :APractical Approach, MacPherson MJ, Hams BD,Taylor GR,eds, 1995 ;Antibodies :A Laboratory Manual,Harlow and Lane,eds, 1988。W088]在下面的实施例中进一步解释本发明。这些实施例不以任何方式限制本发明。它们仅用于说明本发明。在本文和它的权利要求中,动词“包括”和它的词形变换是以它非限制性含义使用的,是指该词后的项目是包含的,但不排除没有具体提到的项目。此外,参考不定冠词“一个”的要素不排除多于一个的要素存在的可能性,除非上下文显然需要有一个和唯一的要素。因此,不定冠词“一个”通常意味着“至少一个”。本说明书中引用的所有专利和文献均以它们的整体通过引用并入至此。仅以说明目的提供下面的实施例,并不是要以任何方式限制本发明的范围。


图1 上游小肽的长度对瞬时表达的影响。将4个不同长度的来自荧光素酶的DNA 的片段(stretch)克隆到直接连接在d2EGFP报告基因的ATG的上游。每个荧光素酶的片段含有5’ATG并且终止于TAA终止密码子。CMV启动子驱动表达。从而构建了 6个不同的构建体,不含肽或含有小肽(PP代表“小肽(petit ρ印tide)”)。这些构建体为对照构建体,包括不含肽(ρρ°)、ρρ9、ρρ23、ρρ54、ρρ71Πρρ9°。将这些构建体转染到CHO-Kl中。转染M小时后,通过流式细胞仪分析细胞的d2EGFP蛋白的表达。得到的由d2EGFP蛋白产生的荧光信号与细胞中适用的d2EGFP蛋白的数量呈线性关系,从而成为细胞中d2EGFP表达水平的可靠指标。图2 不存在或存在STAR元件下,上游肽的长度对集落形成的影响。将与图1/实施例2中使用的相同的编码荧光素酶的片段的pp (pp9,PP23, PP54, PP75和pp9°)直接置于编码博来霉素选择标志物的基因的上游。新的PP-zeocin选择的严格性与在翻译起始密码子 (例如,GTG及TTG翻译密码子)处修饰的已知的博来霉素选择标志物进行了比较。在存在以及不存在侧翼的表达盒上游的STAR7和67以及表达盒下游的STAR7的条件下,检测了所有的构建体。示意性地描述了各种构建体,并且图条(bars)指示了所指的各种构建体获得的稳定转染博来霉素抗性集落的数量。图3 小肽的使用构建了可用于达到高蛋白表达水平的高严格性的选择系统。具有与图1/实施例2中使用的相同的编码荧光素酶的片段的pp(pp9,pp23, pp54, pp75和pp9°) 的新的博来霉素选择标志物置于内部核糖体进入位点(IREQ之后。kocin基因和IRES置于d2EGFP报告基因的下游,以确定选择了稳定转染克隆后的表达水平。作为对照,使用了 IRES序列后的ATGZeo基因(或PP°),为比较,包括了具有TTG Zeo_d2EGFP STARIelect构型的构建体。示意性地描述了各种构建体,并且指示了博来霉素抗性集落中d2GFP的平均表达水平(图条)。图4 易错PCR的策略,以构建高严格性的博来霉素突变体。图条指示了稳定的博来霉素与氨苄青霉素抗性集落的比例,用于增加在博来霉素标志物上进行的PCR的循环数。图5 在范围从0到100微克博来霉素/毫升的不同博来霉素浓度上铺板所指的博来霉素标志物的突变体(也见实施例4和图6)。图6 具有降低活性的不同博来霉素突变蛋白的氨基酸替换。图7 通过博来霉素突变的集落形成。将所指的kocin突变体克隆到表达盒中, 所述表达盒包括驱动d2EGFP基因的人β -肌动蛋白启动子,然后是IRES序列和博来霉素 EPP突变。STAR7和67元件处于表达盒的两侧。在相同的实验中,作为比较,包括了已知的 kocin选择标志物(见图2)。示意性地描述了各种构建体,并且,图条指示了由所指的各种构建体获得的稳定转染博来霉素抗性集落的数量。图8:通过博来霉素EPP(易错PCR)突变体的集落形成。在如图7所述的相同的实验中,检测了博来霉素EPP14、EPP7、EPP15、EPP28、EPP16、EPP5和EPP66突变体,分别能够诱导37、34、66、73、97、215和435个稳定转染CH0-DG44的集落。示意性地描述了所述构建体,并且,图条指示了由所指的构建体获得的稳定转染博来霉素抗性集落的数量。图9 博来霉素突变对报告蛋白的表达水平的影响。所指的kocin突变体置于内部核糖体进入位点(IRES)之后。博来霉素基因和IRES置于d2EGFP报告基因的下游,以确定选择稳定转染克隆后的表达水平。作为对照,使用了在IRES序列之后的野生型博来霉素基因(Zeo WT),为比较,包括了具有ATG/GTG/TTG Zeo_d2EGFP STARIelect构型的构建体。 示意性地描述了各种构建体,并且,指示了博来霉素抗性集落中d2GFP的平均表达水平(图条)。
图10 =EPP博来霉素突变对报告蛋白表达水平的影响。所指的EPP博来霉素突变置于内部核糖体进入位点(IRES)之后。EPP博来霉素基因和IRES置于d2EGFP报告基因的下游,以确定选择稳定转染克隆后的表达水平。作为对照,使用了在IRES序列之后的野生型博来霉素基因(Zeo WT)。示意性地描述了所述构建体,并且,指示了博来霉素抗性集落中 d2GFP的平均表达水平(图条)。图11 小肽的使用和博来霉素突变的结合对集落形成的影响。具有或不具有小肽 PP9的博来霉素突变体EPP5和15置于内部核糖体进入位点(IREQ之后。博来霉素基因和 IRES置于d2EGFP报告基因的下游。示意性地描述了所述构建体,并且,图条指示了所指的构建体获得的稳定转染博来霉素抗性集落的数量。图12 小肽的使用和博来霉素突变的结合对蛋白表达水平的影响。具有或不具有小肽PP9的博来霉素突变体EPP5和15置于内部核糖体进入位点(IREQ之后。博来霉素基因和IRES置于d2EGFP报告基因的下游。示意性地描述了所述构建体,并且指示了所述博来霉素抗性集落中d2GFP的平均表达水平(图条)。图13 小肽的使用和博来霉素突变的结合对选择的严格性和细胞生长的影响。在具有或不具有小肽PP9小肽的博来霉素突变体EPP 7和EPP 5建立的克隆,与TTG Zeo突变体建立的克隆之间,进行了选择的严格性和集落的生长速率的比较。示意性地描述了所述构建体。左手栏图条指示了稳定的博来霉素抗性集落的数量,右手栏图条指示了由各种构建体获得的稳定的博来霉素抗性集落的倍增时间。图14 小肽的终止密码子和可选择的标志物的起始密码子之间的“间隔”序列对稳定集落的数量的影响。在所描述的DNA构建体中,在PP8开放阅读框和kocin编码序列的起始密码子之间,插入所指的长度逐渐增长的间隔序列。对于不同间隔长度的构建体,测定了稳定的^ocin抗性集落的数量。图15 小肽的终止密码子和目标基因的起始密码子之间的“间隔”序列对表达水平的影响。在所描述的DNA构建体中,在PP8开放阅读框和kocin编码序列的起始密码子之间,插入所指的长度逐渐增长的间隔序列。测定在由不同间隔长度的构建体获得的^ocin 抗性集落中的d2EGFP的平均荧光值。图16 使用小肽构建以dhfr为标志物的“维持”系统。制作了所描述的构建体,其中,使用TTG Zeo标志物作为起始选择。在d2EGFP报告基因的下游,放置了 IRES序列和特定的dhfr基因,dhfr基因要么为ATG(或PP°) dhfr,要么为pp9°、pp105或pp13°小肽片段的 ATG dhfr基因。在对照构建体中,GTG dhfr基因置于IRES序列的下游。在所有情况下,使用STAR 7和67作为构建体的侧翼。所述构建体转染到CH0-DG44细胞中,在存在kocin 和HT添加物(=Zeocin选择)下,以及不存在kocin和HT添加物(=DHFR选择)下, 培养60天后,测定d2EGFP的平均荧光(图16A)和平均每日倍增次数(图16B)。图17 使用小肽构建以dhfr为直接选择的标志物的选择系统。从如图16所示的构建体中去除了 TTG Zeo标志物,以测试作为直接选择标志物的小肽修饰的dhfr蛋白。在对照构建体中,GTG dhfr基因置于IRES序列的下游。所描述的构建体转染到CH0-DG44细胞中,并且在不存在HT添加物的条件下生长。测定各种构建体的稳定的dhfr依赖的集落的数量。图18 使用小肽构建以dhfr为直接选择的标志物的选择系统。测定由图17的构建体获得的dhfr依赖的集落的d2EGFP的平均荧光值。图19 使用CLase标志物对EPO高表达集落的诱导。所描述的构建体构建为包括与8个氨基酸长的小肽偶联的突变体^ocin蛋白质。这种特定的^ocin突变体被称为 EPP5。这种突变体选择标志物置于EPO报告基因的下游,和pp23CLaSe标志物的上游。RblE 元件作为整个构建体的侧翼。所述构建体转染到CH0-DG44细胞中,并按照实施例9中所详细描述和指示进行选择和维持。在1天(选择)或45天(维持)后,测定EPO的表达水平。图20 =CLase抑制剂的鉴定。所描述的pp23 CLase构建体转染到CH0-DG44细胞中,并选择稳定的转化体。然后,按照所指示的浓度添加CLase抑制剂氨基乙氧基乙烯基甘氨酸(AVG)和D-炔丙基甘氨酸(DP),对于所指的抑制剂的浓度,测定了以小时计的细胞分裂时间。图21 氨基乙氧基乙烯基甘氨酸作为人U2 OS细胞系中的CLase抑制剂的使用。A.野生型人U2 OS细胞和转染了所描述的构建体的人U2 OS细胞,在不存在或存在10_%的氨基乙氧基乙烯基甘氨酸,以及不存在或存在在的L-半胱氨酸的条件下生长,如所描述的测定了各种条件下的平均细胞分裂时间。B.由所描述的构建体转染的、生长在如实施例10中详细描述和指示的条件下的人U2 OS细胞获得的d2EGFP的平均表达水平。
具体实施例方式实施例1、实施例1 将逐渐增长的肽置于报告基因的上游导致了蛋白表达水平的下降野生型kocin选择标志物是从ATG开始翻译的。在本实施例中,这种构型得以保存,但我们将编码DNA的小片段放在了该ATG的上游。这个DNA片断任意地取自荧光素酶基因。采取了不同的长度,分别编码为9、23、54、75和90个氨基酸的肽。每个DNA片段以最优的ATG开始,以提供翻译起始密码子,和TAA终止密码子,置于kocin筛选标志物的ATG 的上游,具有在荧光素酶的DNA片段的终止密码子和kocin基因的ATG之间的19个核苷酸(SEQ ID N0:28)。这些kocin基因构型的根本思想是翻译将从荧光素酶的DNA片段的ATG (或者更准确地说,在对应的RNA的AUG)处起始,并再次停止在RNA片段的终止密码子处,这构建了小的无功能(non-functional)的荧光素酶肽。然而,由于肽相对较小,在此构型中在kocin编码区域的开始处,翻译机器很可能在遇到相同的信使RNA上出现的第二个 AUG 时重新起始翻译。(Marilyn Kozak Nucleic Acids Research, 2001, vol. 29, No. 24, 52^-523 。然而,当荧光素酶的片段变长时,翻译机器的这种能力变得越来越难。因此, 与编码9个氨基酸的mRNA片段偶联的kocin选择标志物mRNA,比不存在额外的mRNA片段(野生型)时翻译得更低效,但仍比与编码90个氨基酸的mRNA片段的偶联的kocin选择标志物mRNA翻译得更高效。因此,上述最后提到Wkocin标志物(具有90个氨基酸的肽)在功能上成为比具有9个氨基酸长度的小肽的^ocin选择标志物更严格的选择标志物,进而会比野生型^ocin标志物更严格。在此构型中的选择标志物的翻译效率,以及选择严格性取决于放置在kocin选择标志物前面的DNA片段的长度。在实施例1中,我们检测了在报告基因的上游放置小肽是否构建了报告蛋白的表达水平可以被影响的系统。
1.1 结果我们通过PCR从荧光素酶(编号pGL3 Basic E175LPromega ;SEQ IDNO :12)基因中分离了 DNA片段,并将4个不同的长度克隆到紧挨着d2EGFP报告基因的ATG的上游(图 1)。每个使用的引物含有5’ ATG,并且每个DNA片段由TAA终止密码子终止(见表1)。正向引物具有NheI位点(帽子,Caps)和ATG起始密码子。反向引物具有SpeI位点(Caps) 和TAA终止密码子。所述起始密码子以粗体显示。MJ^从荧光素酶基因中扩增PPx的PCR引物序列
Il 物I 序列I SEQ ID NO
pp9-正向aggcGCTAGCatgtgagaggtcctatgattatgtc22
pp23-正向__aggcGCTAGCatggggaaaacgctgggcgttaatc__21_
pp54-正向aggcGCTAGCatggctattctgattacacccgag20
pp75-正向aggcGCTAGCatggccaagaggttccatctg19
pp90-正向__aggcGCTAGCatggaaattgcttctggtggcgctc__18_
Iuc 终止-反向 aggcACTAGTttaaccggacataatcataggac23CMV启动子驱动表达。因此,构建了 6个不同的不含肽或含有小肽(pp代表“小肽”) 的构建体。所述构建体为对照构建体,不含肽(PPO)、含有pp9 (SEQ ID NO :17)、pp23 (SEQ ID NO :16)、pp54(SEQ ID NO : 15)、pp75 (SEQ ID NO :14)和 pp90 (SEQ ID NO :13)。使用脂质体2000 (Invitrogen)等,将这些构建体转染到CH0-K1 (ATCC Cat. No. CCI-61)细胞中。将 4微克DNA与6 μ L脂质体混合,并添加到600000细胞中。转染M小时后,用流式细胞仪 (EPIXS-XL,Beckman-Coulter)分析细胞的d2EGFP蛋白表达。得到的来自d2EGFP(没有固定的)蛋白的产生的荧光信号与细胞中已有的d2EGFP蛋白的数量成线性关系,因此成为细胞中d2EGFP的表达水平的可靠指标。如图1所示,在d2EGFP报告基因的上游放置编码小肽的DNA片段对d2EGFP的表达水平具有深刻而渐进的效果。相对对照构建体的d2EGFP表达水平(设为100% ),含有 9和23个氨基酸长度的肽导致d2EGFP的表达分别下降为80%和30%。当包含更长的肽时,d2EGFP的表达水平进一步下降,当将90个氨基酸的肽置于d2EGFP基因的上游时,低至对照d2EGFP表达水平的10%。我们的结论是,在报告基因的上游放置由5’ATG和3’ TAA终止密码子定义的小肽导致了报告蛋白表达水平的下降。2、实施例2 在Zeocin选择标志物的上游放置逐渐增长的肽导致稳定的转染集落数目的减少。接下来,我们将逐渐增长的荧光素酶的DNA片段放置在紧挨着编码选择标志物的基因的上游。我们这样做是为了检查因为这样的选择标志物的日益减少的蛋白表达水平, 这是否能构建更严格的选择标志物。在本实施例中,我们选择了 ^ocin选择标志物蛋白。 我们把所描述的(见实施例1)ρρ9,pp23,pp54,pp75和pp90的荧光素酶基因的DNA片段放置在紧挨着kocin基因的上游。为了与已知的系统比较新的kocin选择的严格性,我们比较了带有在翻译起始密码子(如GTG及TTG翻译密码子)处有修饰的kocin选择标志物的构建体。这些构型被称为STARIelect构型。已经具体发现的是,TTG kocin构型的选择严格性是如此之高,以至于只有极少数的稳定转染的集落可以形成。要建立更加稳定转染的集落,需要将STAR元件引入到构建体中表达盒的侧翼。STAR元件提升了驱动表达盒的启动子的活性,从而增加了 kocin mRNA的表达水平,这继而使细胞更容易存活。因此,我们检测了具有和不具有侧翼STAR元件的所有构建体。为便于比较,我们把STAR7和 67置于表达盒的上游,并把STAR7置于表达盒的下游。据报道,此构型在多个细胞系中,以及用不同的启动子提供了有利的环境,用于极大提高蛋白的表达水平。2.1 结果我们将五个不同的荧光素酶小肽的编码DNA片段放置在紧挨着kocin选择标志物基因的ATG的上游(图2)。作为对照构建体,我们采用了 ATGko (其实是ppOZeo)、 GTG Zeo和TTG Zeo选择标志物。在这些全部由人β -肌动蛋白启动子驱动的构建体中, 不包括报告基因(图幻。将同样量的所有构建体的DNA用脂质体2000(InvitrOgen)转染到CH0-DG44细胞中,并在培养基中用400微克/毫升的kocin进行选择。培养基由 HAMF12 DMEM=I 1+10%胎牛血清组成。大约两个星期后,对稳定建立的集落的数量进行计数。如图2所示,转染含有ATG Zeo的选择标志物的构建体,在没有STAR元件的情况下构建了(约1750个)最稳定的集落,在有STAR元件的情况下则> 2500个。正如所料,含有GTG Zeo和TTG Zeo的选择标志物,导致了明显更少的稳定的CHO DG44集落。GTG Zeo在没有STAR元件的情况下诱导了约150个集落,在有STAR元件的情况下诱导了约750 个集落(图幻。TTG Zeo在没有STAR元件的情况下诱导了约10个集落,在有STAR元件的情况下诱导了约40个集落(图2)。相比较而言,在构建体中含有pp9 Zeo在没有STAR元件的情况下诱导了约1000 个集落,在有STAR元件的情况下诱导了 > 2000个集落(图幻。当构建体中没有STAR元件时,含有更长的肽导致了仅有一些稳定的克隆形成。然而,当将STAR元件添加到表达盒的侧翼时,PP23、pp54, pp75和pp90仍然分别产生了约2000个、约1400个、约450个和约 100个稳定的集落。因此,含有逐渐增长的肽导致了更少数量的稳定转染的集落的建立。这表明,随着肽的逐渐增长,产生的kocin选择标志物系统变得更加严格,可能是由于逐渐下降的 Zeocin蛋白表达水平。这与瞬时转染中d2EGFP蛋白表达水平随肽的长度增加而降低相符 (见实施例1)。这也表明,蛋白表达系统中含有独立翻译的小肽,可用于建立哺乳动物细胞的严格的选择系统。最后,我们注意到,具有PP90的稳定转染的集落的数量,与TTG Zeo的选择标志物的顺序相同。在这两种情况下,在不存在STAR元件时,几乎没有任何稳定的集落形成,在存在STAR元件时,形成的集落的数量有所增加,但仍然有限。这表明,含有pp90 肽构建了具有与TTG Zeo STARIelect系统的选择严格性大致相同Wkocin选择系统。3、实施例3 :在&0(^11选择标志物的上游设置逐渐增长的肽导致报告蛋白表达水平的增加。接下来,我们在内部核糖体进入位点(IREQ之后放置了 kocin选择标志物。在 IRES和kocin编码区之间我们放置了逐渐增长的荧光素酶的DNA片段。kocin基因被放在d2EGFP报告基因的下游,以确定选择稳定的转染克隆后的表达水平(图3)。作为对照构建体,我们在IRES序列之后放置了 ATG Zeo的基因(或ppO)。我们还将所述构建体与TTG Ze0-d2EGFPSTAR-kleCt构型进行了比较。由于不含有STAR元件时只有少量的集落得以建立,我们选择只检测也含有STAR元件7和67的构建体。人β -肌动蛋白启动子驱动所有的表达盒。3.1 结果相同数量的所有构建体的DNA用脂质体2000 (Invitrogen)转染到CH0-DG44 细胞中,在培养基中用400微克/毫升的kocin (Invitrogen)进行选择。培养基由 HAMF12 DMEM=I 1+10%胎牛血清组成。多达M个独立的集落得到了分离。在用流式细胞分析仪(EPIXS-XL,Beckman-Coulter)进行分析之前,转染3到4周后,将集落进行增殖。来自d2EGFP (没有固定的)的荧光信号与细胞中已有的d2EGFP蛋白的数量成线性关系,因此成为细胞中d2EGFP的表达水平的可靠指标。在单次流式细胞仪分析中,分析了包括多达4000个细胞的样品的荧光信号。这样的一个细胞样品是从独立的、稳定转染的细胞集落中取得的。由于信号在集落的单个细胞之间会有所不同,样品中约4000个细胞的平均荧光水平作为在稳定转染的细胞集落中d2EGFP表达水平的测量值。如图3所示,与具有ATG Zeo (ppO)标志物的对照构建体相比,在kocin选择标志物的上游引入逐渐增长的肽给出了明显更高的d2EGFP表达水平。在12个独立的具有 ATG(ppO)Zeo和pp90 Zeo标志物的集落中的d2EGFP的平均表达水平,分别从100上升到 700。重要需要注意的是,在相同的实验中,引入TTG Zeo选择标志物得到了 750的d2EGFP 的平均表达水平。这与PP90 Zeo选择标志物获得的d2EGFP的平均表达水平是非常相似的, 表明这些^ocin标志物构型具有类似的选择严格性。我们的结论是,在选择标志物上游含有翻译为小肽的小DNA片段,构建了哺乳动物细胞的有效的选择系统。4、实施例4 具有使kocin失效的减毒能力的kocin突变体蛋白的构建。另一种获取更高的选择严格性的手段,可以通过功能上损害选择标志物蛋白来实现。这意味着必须制造更多的选择标志物蛋白,以使培养基中类似数量的选择剂失效。选择标志物蛋白的更高水平,需要选择标志物的更高mRNA水平,从而会导致在转染细胞中表达的蛋白的更高的表达水平。在蛋白质编码区引入突变可以构建功能上受损的选择标志物蛋白。在本实施例中,我们在&0(^11抗性标志物的编码区系统地引入了突变,并测试了这是否构建了具有不同的选择严格性Wkocin标志物蛋白。4. 1 结果我们经PCR扩增在kocin抗性标志物基因中构建了突变,在这样的方式的基因中,随机突变得到引入。在反应混合物中,更多的锰离子和镁离子,以及调节核苷酸的混合物,诱导了 PCR 产物中的随机突变(Bloom JD, Silberg JJ, Wilke CO, Drummond DA, Adami C, Arnold FH. Thermodynamic prediction of protein neutrality.Proc Natl Acad Sci U S A. 2005 Jan 18 ; 102 (3) :606_11)。50ng 的携带 kocin 基因的 pCMV/ZEO 质粒 (Invitrogen, V50120)用以下引物进行了扩增,每种0. 75 μ M α 97 (ATTAGGATCCACCATGGCCAAGTTGACCAGTGCCG)禾口α 100 (ACCGGAATTCTCAGTCCTGCTCCTCGGCCACG),分别为 SEQID NO 24 和 25。反应在 7mM MgCl2、75yM MnCl2、0. 2mM dATP、0. 2mMdGTP、0. 5mM dTTP、0. 5mM dCTP、含有 5u GOTag 聚合酶(ftOmega)的IXGOTag缓冲液(!Iomega)中进行。扩增进行10至40个循环,每个循环为95°C下1分钟,50°C下1分钟,以及72°C下1分钟。PCR反应所得的kocin片段用 BamHl和EcoRI切割,并克隆到pBS EM7 W4950质粒中的EM7启动子之后。这种质粒还带有氨苄青霉素抗性基因。在100 μ g/mL氨苄青霉素下选择E. coli (XLlO)集落。氨苄青霉素抗性基因是由它的天然的,内酰胺酶启动子驱动的。然后将随机选取的氨苄青霉素抗性重组体铺在含有100微克/mL氨苄青霉素和50微克/毫升kocin的琼脂板上。所述重组体的生长与转化野生型kocin基因的E. coli XLlO进行比较。由于氨苄青霉素抗性基因不受kocin抗性基因的PCR过程的影响,即使kocin抗性基因在功能上完全被突变破坏,也可以预料氨苄青霉素抗性集落的数目是相等的。这样导致了较低的ko/Amp抗性集落比例。然后,通过将它们铺板在各种kocin浓度下来进一步表征在kocin上显示受损生长的集落。图4显示,增加的PCR循环数导致了 kocin抗性转化体数量的减少。这被氨苄青霉素抗性转化体,也是kocin抗性的下降比例所标志。经历了 40个PCR循环的kocin片段的克隆和后续转化,难以递送氨苄青霉素和kocin抗性的集落。因此,我们选择关注从 10、12和15个PCR循环中得到的in突变筛选。将一些kocin标志物突变体铺板在不同的kocin浓度下,范围从0到100微克 /毫升kocin,如图5所示。需要注意的是,含有突变的^ocin标志物的所有构建体仍然单独的氨苄青霉素下有效增长(顶图)。在这个比较中,包括了几个对照kocin标志物基因。这些包括野生型kocin蛋白,以及所述的在9位氨基酸上的突变,在该位置上脯氨酸变为谷氨酸、半胱氨酸和苏氨酸(图幻。还对94位的蛋氨酸变为缬氨酸的^ocin突变进行了检测(图幻。选择这gkocin突变,以允许在引入这些突变导致的选择严格性之间进行比较。结果表明,因为转化的细菌仍然在100微克/毫升kocin下表现出显著的生长, 因此^50M9突变是相对温和的。另一方面,谷氨酰胺9的突变是非常严重的,导致了细菌在最低的,5 μ g/ml Wkocin浓度下不生长。其他突变处于这两个极端之间。在图5的右栏, 显示了如&0(^11 EPP (代表易错PCR)所述的新的kocin突变体。这些突变体受到增加的 kocin浓度的影响,对His9和Val94突变的范围内的影响尤其严重。在图6中,显示了几个EPP kocin突变的氨基酸位置。例如,EPP 66、7和14的突变体,在不同的氨基酸位置, 分别携带了一个、两个和三个突变。5、实施例5 易错PCR构建的kocin突变体具有不同的选择严格性。在实施例4中,我们在kocin编码区引入了突变,导致了 kocin标志物蛋白的构建,在大肠杆菌中进行检测时,它们在一系列^ocin浓度范围下,具有不同的生长能力。接下来,我们检测了这些kocin突变体是否可以在哺乳动物CH0-DG44细胞中用作高严格性的hoc in选择标志物。5.1 结果将&0(^11 EPP突变体克隆到表达盒中,它包括驱动d2EGFP基因的人β -肌动蛋白启动子,随后是IRES序列和kocin EPP突变体。STAR 7和67元件位于表达盒的侧翼,如图 7所示。在相同的实验中,为了提供比较,包括了 STARIelect构建体。例如,ATG/GTG/TTG Zeo构型分别诱导了 > 2000、> 500和38个集落。在培养基中用400微克/毫升的kocin 进行选择。形成集落的数量的减少,意味着由ATG,GTG及TTG翻译起始密码子赋予的选择严格性的增加。相比之下,放置在IRES序列下游的野生型kocin基因,也导致> 2000个集落的诱导。相比之下,Zeoan9突变体允许无集落形成,表明这种突变构建了功能受损以致再不能作为选择标志物的^ocin标志物蛋白。这紧密反映在E. coli的突变结果中,如实施例4中所述。引入Cys9、Thr9和Val94的突变得到了分别诱导150,24和35个稳定转染 CH0-DG44集落的kocin标志物蛋白。显然,在d2EGFP-IRES_Zeo构型中的Hir9和Val94 突变达到了与STARIelect系统中的TTG Zeo-d2EGFP构型相同的选择严格性。我们构建的一些在E. coli中显示出功能活性受损的EPP Zeocin突变体(图5), 被克隆到IRES序列的下游。在相同的实验中,如在图7中所示,Zeocin EPP 14,EPP 7,EPP 15,EPP 28,EPP 16,EPP 5 和 EPP 66 突变体,能够分别诱导 37、34、66、73、97、215 和 435 个稳定转染的CH0-DG44集落(图8)。这些数字表明,这些突变构建了具有与Cys9和Val94 突变相类似的选择严格性的^ocin突变体(与图7比较)。在相同的实验中,我们还测量了表达盒中的d2EGFP蛋白的表达水平,如在稳定转染CH0-DG44集落中的平均荧光所示。如图9所示,不同的^ocin突变体得到了具有不同的平均d2EGFP荧光值的集落。正如所料,TTG ZeoSTAR-Select构型得到了高的d2EGFP值 (平均 1402)。ATG 260(对照)丄丫89、11^9和¥&194突变分别得到了 57、570、3385 和 2280 的平均d2EGFP值。这些结果表明,Cys9诱导了比STARIelect构型中的TTG Zeo更低严格性的突变,而 ιγ9和Val94诱导了比STARIelect构型中的TTG Zeo更高kocin选择严格性的突变。相比之下,ZeocinEPP 14、EPP7、EPP15、EPP28、EPP16、EPP5 和 EPP66 突变体在 CH0-DG44 集落中分别诱导了 1219、850、525、503、631、498 和 187 的平均 d2EGFP 值(图 10)。 由EPP 14、7和15诱导的平均值高于在Cys9突变中观察到的(570),但明显低于Hir9和 Val94突变(图9)。相反,它们在TTG Zeo STARIelect构型的范围内更多。这表明,EPP14、 7和15突变在kocin选择标志物蛋白中诱导了介于由Cys9(570)和突变诱导的选择严格性之间的选择严格性。这些结果表明,易错PCR技术可用于构建在哺乳动物细胞中具有高选择严格性的 kocin标志物蛋白。EPP kocin突变具有与先前所描述的TTGZeo STARIelect构型相类似的选择严格性。6、实施例6 小肽与易错PCR相结合构建了具有更高的选择严格性的kocin突变体。接下来,我们检测了将小肽放置在kocin EPP突变体的ATG上游是否对这些突变体的选择严格性具有影响。这为所述系统提供了更大的灵活性。例如,它可以有助于降低细胞中必需要制造的kocin突变蛋白的数量。当在kocin编码区引入相对严重的EPP突变时,细胞可能必需制造数量非常高的突变&0(^11蛋白。毕竟,Zeocin EPP突变蛋白的受束缚的活性源于^ocin蛋白质本身的功能。生产如此高数量的选择标志物可能不是太有禾IJ,这是由于会给细胞带来代谢负担。另外,大数量的突变的选择(如Zeocin)蛋白,可能本身具有毒性,也可能不利于细胞。无论哪种方式,这可能导致例如减少细胞的生长。使用相对温和的EPP诱导的选择蛋白的突变蛋白(如kocin),可以规避这些缺点。这确保了需要制造较少的选择蛋白突变体(如kocin),但它也将降低选择严格性。小肽和选择蛋白的温和突变体(如kocin)的结合可以规避这些缺点。这种叠加需要更高水平的编码选择蛋白的mRNA,以为选择提供足够的有功能的蛋白,并且因此可以提供更有利的条件。6.1 结果9个氨基酸长的小肽置于koEPP15和koEPP5突变体的上游。这些新的kocin构型
30置于IRES序列和d2EGFP基因的下游(图11)。将小肽引入ZeocinEPP15和EPP5蛋白的 ATG的上游导致稳定转染CH0-DG44集落的数量逐步减少(图11)。在这两种情况下,当pp9 添加到Zeo突变体中时,稳定转染克隆的数量下降了 50%以上(图11)。我们还测量了 d2EGFP蛋白的表达水平,如在稳定转染CH0-DG44集落中的平均荧光值所示。如图12所示,ZeoEPP15突变体中额外的pp9诱导了 1109的平均d2EGFP荧光值, 与此相比,ZeoEPP15单独突变的平均值为648(图12)。相似地,ZeoEPP5突变体中额外的pp9 诱导了 863的平均d2EGFP荧光值,与此相比,ZeoEPP5单独突变的平均值为481。我们还比较了用不同的选择标志物构型建立的集落的生长速率(图13)。TTG Zeo 突变体的选择严格性与ZeoEPP7突变体的选择严格性相似,如稳定集落的数量(分别为34与 36)所示。然而,ZeoEPP7突变体建立的集落的生长比TTG Zeo诱导的集落(分别为平均30 小时和20小时)明显更慢(图13)。相比较而言,ZeoEPP5突变体的选择严格性较低(200 个集落),但通过PP9小肽的添加,选择严格性得到增加(65个集落,也见图11)。用ZeoEPP5 突变体建立的集落的平均生长速率为20小时,与TTG Zeo的生长速率相当。重要的是,在 ZeoEPP5突变体中添加pp9小肽,确实增加了选择严格性,但平均增长速率仍然为20小时。这些结果表明,将小肽方法与易错PCR结合导致了选择严格性逐步提高的kocin标志物蛋白的构建。重要的是,小肽和相对温和的EPP构建的kocin突变体的结合导致了选择严格性的增加,而不影响细胞的生长速率。这样的构型显然优于不与小肽结合的非常严格的EPP 构建的kocin突变体。7、实施例7 放置在小肽和目标基因的ATG之间的间隔的影响。在前面的实施例中,我们将小肽置于紧挨着&0(^11抗性基因的上游。也就是说, 在小肽的终止密码子和kocin基因的ATG之间,只有提供便捷的限制性位点的9bp。然而, 可能的是,小肽和kocin基因之间的“间隔”序列的放置会影响系统的选择严格性。通过在小肽的终止密码子和kocin抗性基因的ATG之间放置随后较长的DNA片段,我们直接对此进行了检测。这种合成的间隔序列选择为不含有ATG的序列,由此以避免在该位点上的不必要的,不成熟的翻译起始。7.1 结果间隔DNA片段以允许这些序列的部分容易克隆的方式进行合成。制作了构建体, 在该构建体重,小肽被以下出现的50、100、150、200、250、300禾卩35(^ 的间隔序列隔开(SEQ ID N0:32,图14)。使用了荧光素酶蛋白的8个氨基酸(pp8)作为小肽,并且,使用EEP5 ^ocin突变体作为^ocin标志物(图14)。作为对比,使用了没有间隔序列出现的构建体 (间隔0,图14),其实是在前面的实施例中使用的构型。在所有情况下,STAR7和67都用做构建体的侧翼。将质粒转染到CH0-DG44细胞中,并且对诱导的稳定集落进行计数。如图14 所示,最高数量的集落在没有间隔序列的情况下形成。即使在小肽和kocin基因的ATG之间含有50个bp,也导致了集落数量的下降。当在这些集落中分析d2EGFP的表达水平时,不同的构建体之间没有发现大的差异(图15)。这一结果表明,在小肽和抗性基因之间含有间隔序列,在诱导的集落数量方面和在蛋白表达水平上,都不会导致选择系统的优势。间隔序歹Ij(SEQ ID NO 32)τ A A g g a t c c ctcatcatcaactcctctcg
atctactcgtctccctcaaggtatcgctct CCCtCaaagaaC tCCCtCCg tcagatcctcgcatcccagagatcctatctagatcctatatcatccaaaaaatcatcatcatcgatcctcaaatcgatcacca ggg atctcagtcgatctacatcttc gtcacatctcatctacctcccggtttt catcaatatcatcttc taccag agtccttcgaaagggacaagacaatccca ctcatcatcaactcctctcg atctactcgtctccctcaaggtatcgctct ccctcaaagaactccctccg tcagatcctcgcatcccagagatcct atctagatccaccATG8、实施例8 小肽在创建使用dhfr蛋白作为选择标志物的选择系统中的用途。在前面所有的实施例中,kocin抗性基因都用作选择标志物。在本实施例中,我们检测了另一个选择标志物是否也可以用来作为“维持”和/或选择标志物。我们选取了 dhfr蛋白作为选择标志物。dhfr蛋白是细胞生存所必需的,这是因为它是在代谢通路中代谢一个或多个必需步骤的酶。由于必需的意思是细胞不能自行合成特定的代谢构成单元(metabolic building blocks),这意味着这些构成单元必须存在于培养基中,以使细胞存活。dhfr蛋白是叶酸通路中的一种酶,它将叶酸转换成5,6,7,8四氢叶酸(5,6,7,8 tetrahydrofolate) (合成嘌呤(次黄嘌呤)、胸腺嘧啶脱氧核苷酸(胸腺嘧啶脱氧核苷),和特定氨基酸(甘氨酸)所需的甲基穿梭体(shuttle))。CH0-DG44细胞缺乏dhfr基因,因此,CH0-DG44细胞需要培养基中的甘氨酸、次黄嘌呤和胸腺嘧啶脱氧核苷来生存。但是,如果dhfr基因出现在表达盒上,在培养基中不存在终产物甘氨酸、次黄嘌呤和胸腺嘧啶脱氧核苷(GHT)(往往只去除次黄嘌呤和胸腺嘧啶脱氧核苷(HT))的条件下,细胞可以将叶酸转换成5,6,7,8四氢叶酸。此外,需要无毒前体叶酸的出现,以使细胞能够合成5,6,7,8四氢叶酸⑴rlaub et al, 1980, Proc Natl Acad Sci U S A, 77 =4216-4220) 这一原理,作为创建稳定转染的哺乳动物细胞系的选择方法,已使用多年。8.1 结果我们制作了将TTG Zeo用作起始选择的构建体(图16)。在d2EGFP报告基因的下游,我们放置了 IRES序列和特定的dhfr基因。此dhfr基因要么是ATG (或ppO)dhfr,要么是跟在pp90、ppl05或ppl30小肽之后的ATG dhfr基因(图16)。在对照构建体中,我们将 GTG dhfr基因放置在IRES序列的下游。在所有情况下,STAR7和67都用作构建体的侧翼。 将所述构建体转染到CH0-DG44细胞中。正如预期的那样,出现了相似数量的集落,这是因为选择通过TTG Zeo蛋白发生。在测量起始的d2EGFP表达后,将克隆分开并在kocin和 HT添加物存在下培养。如图16A所示,d2EGFP表达值在超过60天的时期内仍然保持相当相似。然而,当从培养基中去除kocin和HT添加物,出现了不同的局面。在IRES序列下游有ppO dhfr的情况下,d2EGFP的表达水平严重下降。此外,对于携带pp90 dhfr基因的构建体,d2EGFP表达值有所下降。只有当包含ppl05或ppl30时,d2EGFP表达水平才保持不变(图16A)。存在GTG dhfr基因的情况下,d2EGFP表达水平略有增加。我们将这些结果可以解释为,在ppO和pp90 dhfr的情况下,制造了太多的有功能的dhfr蛋白,而不能建立严格的选择系统。因此,d2EGFP表达水平有所下降。只有当使用更严格的小肽,ppl05和 PP130,或GTG dhfr变异体时,所述选择系统才变得足够严格,以允许在延长的时期内的恒定的d2EGFP表达水平。由于ppl05和ppl30小肽是相当长的,它们可能更有效地修饰dfhr 蛋白质本身,以创建更严格的dhfr蛋白。将突变dhfr蛋白与较短的小肽结合,可能创建更严格的选择系统。这将可以在如前面的实施例中所述的易错PCR(EPP)kocin突变的方法之后。我们还比较了所分析的集落的生长速率。如图16B所示,在pp90、105和130中, 没有观察到对生长速率的主要影响。相反,当使用GTG dhfr蛋白时,细胞的生长速率急剧下降(图16B)。因此,虽然GTG dhfr克隆中d2EGFP的表达水平增加了,但细胞生长速率却下降了,这使得GTG dhfr在这种情况下变得相当无用。接下来,我们检测了使用小肽直接修饰的dhfr蛋白作为选择标志物的可能性。我们从构建体中删除了 kocin抗性基因,得到了 d2EGFP报告基因,随后是IRES序列和修饰的dhfr基因。将这些构建体分别转染到CH0-DG44细胞,并在不含HT添加物的条件下成长。 如图17所示,含有? 0、14、23、4254和63在010-0644中诱导了> 600个稳定的集落。相比之下,在相同的条件下,使用置于IRES序列下游的GTG dhfr基因没有集落形成(图17)。 只在pp75、90、105和130的情况下,观察到了诱导集落的数量的下降(图17)。仅在ppO、 14、90、105和130诱导的集落中测量了 d2EGFP的表达水平(图18)。在ppO和ppl4中, d2EGFP的表达值非常低。尽管用pp90提高了 d2EGFP的表达水平,但合理的表达水平是在 PP105和ppl30的情况下取得的。这与用这些修饰诱导的集落的高数量相一致,如图17所示。这支持了使用修饰的dhfr蛋白与更短的小肽相结合的理念,正如我们以EPP修饰的 Zeo的突变体所使用的。综上所述,本实施例表明,使用小肽方法与不同的选择标志物而不是ko,作为选择标志物(在这种情况下为dhfr),是可能的。然而,在选择严格性上的差异是显而易见的, 相比Zeo蛋白,dhfr蛋白需要更长的小分子肽,以建立严格的选择系统。9、实施例9 使用EPO作为报告蛋白,CLase作为维持和选择标志物。我们在此通过使用EPO作为分泌的报告基因,检测了 CLase作为维持/选择标志物的潜力。9.1 结果在这些实验中,我们使用了与8个氨基酸长的小肽偶联的突变体kocin蛋白。这种特定的kocin突变体通过易错PCR(EPP)创建,并且被称为EPP5。这种突变体选择标志物,被称为pp8ZeoEPP5 (SEQ ID NO :33),置于EPO的报告基因的下游和pp23CLase标志物 (SEQ ID NO 34)的上游(图19)。RblE元件(SEQ ID NO 36)作为整个构建体的侧翼。当使用在培养基中的400微克/毫升^ocin进行起始选择时,在12个传代集落中,诱导了 7. 6皮克/细胞/天的特定EPO的平均产量(图19A)。在起始的第1天的测量后,将细胞分开,并且在没有kocin选择压力下保持45天,但在培养基中含有L-胱氨酸/L-半胱氨酸,或在培养基中不含有^ocin并且不含有L-半胱氨酸/L-胱氨酸。如图19A所示,当不存在kocin时,EPO表达水平下降到低于1皮克/细胞/天。然而,如果培养基中不含有 L-半胱氨酸/L-胱氨酸,EPO的特定表达水平保持不变(7. 6皮克/细胞/天)(图19A)。 这表明了 pp23CLaSe在CH0-DG44细胞中作为“维持”标志物的能力。我们也尝试了用去除了 L-半胱氨酸/L-胱氨酸的培养基的直接选择。在这个实验中,我们使用相同的构建体。如图19B所示,在第1天或第45天都得到了与pp8Ze0EPP5 相似的EPO水平。检测这些细胞的生长时,我们发现,在第1天和第45天,平均倍增时间分别为20和23小时。这接近于野生型CH0-DG44的生长速率。我们的结论是,结合EPO作为报告蛋白,Pp23CLaSe为高蛋白表达水平提供了足够的选择严格性,同时保留了细胞生长的能力。10、实施例10 氨基乙氧基乙烯基甘氨酸(AVG)和D-炔丙基甘氨酸(DP)是CLase 酶的抑制剂。在上面描述的实验中,我们使用了 CH0-DG44作为细胞系。这种细胞系公知为对 CLase酶是营养缺陷的。但人源或小鼠源的细胞系,对CLase酶不是营养缺陷的。然而, dhfr和谷胱甘肽合成酶(GQ选择标志物,也经常在含有功能相应的酶的细胞中使用。这就要求必须抑制内源性酶的活性,在dhfr和GS的情况下,分别由甲氨蝶呤和蛋氨酸亚砜亚胺 (MSX)来抑制。我们检测了两种已被发现在体外抑制CLase的化学制品。纯化的CLase酶已被用于酶动力学,并且发现氨基乙氧基乙烯基甘氨酸(AVG)是可逆的CLase抑制剂,d-炔丙基甘氨酸(d-P)是不可逆的 CLase 抑制剂(Meegborn et al. , 1999,1. Biol. Chem. 274 1沈75-1沈84)。AVG是广泛用于食品工业中作为乙烯抑制剂,负责催熟过程的物质。这种无毒的特性使得AVG成为用作CLase抑制剂的合适物质。我们检测了 AVG和d_P在细胞株中作为CLase抑制剂使用的潜力。10. 1 结果首先,我们检测了 AVG和d-P在CH0-DG44细胞中的使用。我们向野生型CH0-DG44 细胞中添加了 10-1°到IO-4M的AVG和10_8至IO-4M的d_P,并且测定了细胞分裂的时间。我们注意到,即使在IO-4M的AVG(图20A)或1(Γ4Μ的d_P(图20B)的最高浓度下,对细胞生长或其他没有影响。由于CH0-DG44不具备有功能的CLase基因,因此这并不奇怪。但是, 由于这也证明了该物质的无毒性,这个结果是重要的。接下来,我们在细胞中,检测了 AVG 和d-P,该细胞稳定转染有pp23CLaSe构建体,并且在不含L-半胱氨酸/L-胱氨酸且含有 L-谷胱甘肽前体(L-glutathionine)的培养基中生长。因此,这些细胞的存活依赖于转染的CLase蛋白的活性。当在这些细胞中添加IO"7至1(Γ5Μ的AVG(图20A)或10_7至1(Γ5Μ的 d-P(图20B)时,我们观察到了对细胞生长的快速影响。在低浓度(10_7M)时,在AVG的情况下细胞仍然具有平均23小时的分裂时间(图20A),在d-P的情况下为25小时(图20B)。 当使用更高浓度的AVG或d-P时,如50 (AVG)和60 (d_P)小时的细胞分裂(图20) 所示,细胞有严重的生长问题。这一结果表明,这两种物质是非常有效的CLase抑制剂。接下来,我们检测了 AVG抑制剂在人细胞系U2 OS中的可用性。当我们向野生型U2 OS细胞的培养基中添加了 10- 的AVG时,如图21A所示,由于它们表现出> 60小时的倍增时间,我们观察到了细胞停止生长。由于人的U2 OS细胞含有有功能的CLase基因,且不依赖于培养基中L-半胱氨酸/L-胱氨酸的存在,因此这并不奇怪。因为向培养基中同时添加 IO-4M的L-半胱氨酸挽救了以正常速度持续生长的细胞,(图21A,第三列),所以这种效果对CLase通路是特异的。当我们分析用作为选择标志物的pp23CLaSe基因转染的U2 OS细胞的集落时,我们没有观察到细胞的平均生长速率的差异(图21A)。101的AVG的添加,导致这些细胞的生长速率略有延迟(图21A,最右列)。当我们分析各个克隆的d2EGFP值时, 我们发现,当从培养基中除去kocin时,d2EGFP的表达水平下降到较低的值(图21B)。在培养基中含有L-半胱氨酸/L-胱氨酸的情况下,进行了这种测量。与此相反,在没有L-半胱氨酸/L-胱氨酸和具有L-胱硫醚的情况下,结合IO-5M的AVG,我们观察到,平均d2EGFP 值仍然保持与kocin留在培养基中时一样高。这一结果表明,内源性和转染的CLase酶的抑制导致了细胞需要使用转染的质粒来增加CLase的转录并因此增加有功能的酶量的情况。转录的增加导致d2EGFP表达水平在培养基中没有kocin的情况下仍然保持较高。由于有足够的CLase酶的水平,这也保证了细胞的存活。综上所述,结果表明了 CLase作为选择标志物的可用性,即使在不是CLase酶的营养缺陷型的细胞,如人体细胞中。
权利要求
1.一种核酸构建体,其特征在于,该核酸构建体含有多顺反子转录单元,该多顺反子转录单元含有a)编码在真核宿主细胞中有功能的可选择的标志物的核苷酸序列;以及,b) 有功能的开放阅读框,该有功能的开放阅读框在5’到3’方向上含有翻译起始密码子、至少一个氨基酸密码子和翻译终止密码子;其中,有功能的开放阅读框的终止密码子位于编码所述可选择的标志物的核苷酸序列的单独的翻译起始密码子的上游的0至300个核苷酸之间,并且,其中,将有功能的开放阅读框的终止密码子和编码可选择的标志物的核苷酸序列的单独的翻译起始密码子隔开的序列不具有翻译起始密码子。
2.根据权利要求1所述的核酸构建体,其中,编码所述可选择的标志物和有功能的开放阅读框的核苷酸序列的起始密码子中的至少一个为ATG密码子。
3.根据权利要求1或2所述的核酸构建体,其中,编码所述可选择的标志物和有功能的开放阅读框编码的核苷酸序列的起始密码子中的至少一个嵌入在Kozak序列中。
4.根据权利要求1-3中任意一项所述的核酸构建体,其中,所述可选择的标志物提供了对选择剂的致死或生长抑制效果的抗性,所述选择剂选自由博来霉素、嘌呤霉素、杀稻瘟菌素、潮霉素、新霉素、甲氨蝶呤、蛋氨酸亚砜亚胺和卡那霉素组成的组。
5.根据权利要求1-4中任意一项所述的核酸构建体,其中,编码所述可选择的标志物的核苷酸序列编码含有突变的可选择的标志物多肽,与它的野生型复本相比,所述突变降低了所述可选择的标志物多肽的活性。
6.根据权利要求5所述的核酸构建体,其中,具有降低活性的可选择的标志物多肽选自由以下多肽组成的组a)9位的脯氨酸改变成不同的氨基酸的博来霉素抗性多肽;b)10位的缬氨酸改变成不同的氨基酸的博来霉素抗性多肽;c)12位的苏氨酸改变成不同的氨基酸的博来霉素抗性多肽;d)14位的精氨酸改变成不同的氨基酸的博来霉素抗性多肽;e)21位的谷氨酸改变成不同的氨基酸的博来霉素抗性多肽;f)22位的苯丙氨酸改变成不同的氨基酸的博来霉素抗性多肽;g)25位的天门冬氨酸改变成不同的氨基酸的博来霉素抗性多肽;h)28位的甘氨酸改变成不同的氨基酸的博来霉素抗性多肽;i)33位的苯丙氨酸改变成不同的氨基酸的博来霉素抗性多肽; j)35位的甘氨酸改变成不同的氨基酸的博来霉素抗性多肽; k)73位的谷氨酸改变成不同的氨基酸的博来霉素抗性多肽; 1)76位的丙氨酸改变成不同的氨基酸的博来霉素抗性多肽; m)82位的缬氨酸改变成不同的氨基酸的博来霉素抗性多肽;η)88位的天门冬氨酸改变成不同的氨基酸的博来霉素抗性多肽;ο)94位的甲硫氨酸改变成不同的氨基酸的博来霉素抗性多肽;和,P) 182位和261位氨基酸残基中的至少一个改变成不同的氨基酸的新霉素抗性多肽。
7.根据权利要求6所述的核酸构建体,其中,具有降低活性的可选择的标志物多肽选自由以下多肽组成的组a)9位的脯氨酸改变成半胱氨酸、谷氨酰胺或苏氨酸的博来霉素抗性多肽;b)10位的缬氨酸改变成丙氨酸的博来霉素抗性多肽;c)12位的苏氨酸改变成丙氨酸的博来霉素抗性多肽;d)14位的精氨酸改变成脯氨酸的博来霉素抗性多肽;e)21位的谷氨酸改变成甘氨酸的博来霉素抗性多肽;f)22位的苯丙氨酸改变成酪氨酸的博来霉素抗性多肽;g)25位的天门冬氨酸改变成甘氨酸的博来霉素抗性多肽;h)28位的甘氨酸改变成精氨酸的博来霉素抗性多肽;i)33位的苯丙氨酸改变成亮氨酸的博来霉素抗性多肽; j)35位的谷氨酸改变成甘氨酸的博来霉素抗性多肽;k)73位的谷氨酸改变成甘氨酸或赖氨酸的博来霉素抗性多肽; 1)76位的丙氨酸改变成苏氨酸的博来霉素抗性多肽; m)82位的缬氨酸改变成谷氨酸的博来霉素抗性多肽; η)88位的天门冬氨酸改变成甘氨酸的博来霉素抗性多肽; ο) 94位的甲硫氨酸改变成缬氨酸的博来霉素抗性多肽。
8.根据权利要求7所述的核酸构建体,其中,具有降低活性的可选择的标志物多肽选自由以下多肽组成的组a)具有以下至少一种改变的博来霉素抗性多肽10位的缬氨酸改变成丙氨酸、12位的苏氨酸改变成丙氨酸和35位的谷氨酸改变成甘氨酸;b)具有以下至少一种改变的博来霉素抗性多肽14位的精氨酸改变成脯氨酸、73的谷氨酸改变成赖氨酸和88位的天门冬氨酸改变成甘氨酸;c)具有以下至少一种改变的博来霉素抗性多肽21位的谷氨酸改变成甘氨酸和76位的丙氨酸改变成苏氨酸;d)具有以下至少一种改变的博来霉素抗性多肽 位的甘氨酸改变成精氨酸和73位的谷氨酸改变成甘氨酸;和e)具有以下至少一种改变的博来霉素抗性多肽22位的苯丙氨酸改变成酪氨酸和25 位的天门冬氨酸改变成甘氨酸。
9.一种表达盒,其特征在于,该表达盒含有前述权利要求中的任何一项所述的核酸构建体,其中,所述表达盒含有可操作地连接至多顺反子转录单元的启动子和在多顺反子转录单元的下游的转录终止序列,并且,其中,所述启动子在真核宿主细胞中对起始多顺反子转录单元的转录是有功能的。
10.一种表达载体,其特征在于,该表达载体含有根据权利要求9所述的表达盒,并且进一步含有编码目标基因产物的核苷酸序列。
11.根据权利要求10所述的表达载体,其中,所述编码目标基因产物的核苷酸序列包括在多顺反子转录单元中。
12.—种真核宿主细胞,其特征在于,该真核宿主细胞含有根据权利要求1-8中任意一项所述的核酸构建体、根据权利要求9所述的表达盒或根据权利要求10或11所述的表达载体。
13.—种产生用于表达目标基因产物的真核宿主细胞的方法,其中,该方法包括如下步骤a)将根据权利要求10或11所述的表达载体引入到多个宿主细胞中;b)在选择可选择的标志物多肽的表达的条件下,培养a)中得到的多个宿主细胞;和,c)选择至少一个表达用于目标基因产物的表达的可选择的标志物多肽的宿主细胞。
14.一种表达目标基因产物的方法,该方法包括,培养含有根据权利要求10或11所述的表达载体的宿主细胞或根据权利要求13所述的方法获得的宿主细胞,并从所述表达载体中表达所述目标基因产物,并可选择地进一步包括恢复或收获目标基因产物。
15.根据权利要求14所述的方法,其中,所述表达载体含有如权利要求1-3中任意一项所定义的核酸构建体,其中,编码可选择的标志物的核苷酸序列编码营养缺陷型标志物,并且,其中,所述宿主细胞在对营养缺陷型标志物的表达具有选择性的条件下培养。
全文摘要
本发明涉及核酸构建体,该核酸构建体含有在多顺反子转录单元中的可选择的标志物基因,用于产生和选择用于目标基因产物的表达的真核宿主细胞。为了增加选择的严格性,可选择的标志物的编码序列可以直接前置于相对短的有功能的开放阅读框,以减少可选择的标志物,和/或可含有一个或多个突变的可选择的标志物的氨基酸序列的翻译效率,所述突变较它的野生型复本减少了由突变的标志物提供的抗性水平。本发明还涉及产生用于表达目标基因产物的真核宿主细胞的方法,其中,使用了这些核酸构建体,以及涉及产生目标基因产物的方法,其中,应用了由此产生的宿主细胞。
文档编号C12N15/79GK102459607SQ201080036232
公开日2012年5月16日 申请日期2010年6月15日 优先权日2009年6月15日
发明者A·P·奥特, H·J·M·范布洛克兰德, J·A·沃赫斯 申请人:萨拉基尼克有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1