基于铁蛋白重链基因座的高表达基因座载体的制作方法

文档序号:455526阅读:331来源:国知局
专利名称:基于铁蛋白重链基因座的高表达基因座载体的制作方法
技术领域
本发明涉及分子生物学领域,具体涉及用于在经转化的细胞中表达异源基因序列的载体的开发及应用。
相关技术常见的表达载体含有启动子来驱动所需基因以及聚腺苷酸化信号来产生成熟的转录物。启动子序列的长度倾向于仅有几百个碱基对,并且含有大部分(如果不是全部的)调节区用于由瞬时转染确定的最适表达。然而,尽管含有这些序列的表达构建体在瞬时转染中为高度功能性的,但是当作为稳定的转染子被整合到染色体时,它们并不总是能够产生相似的表达水平。这是由于位置依赖性表达,一种整合位点对表达水平具有显性且通常是阴性的效应的现象(Wilson(1990),Ann.Rev.Cell Biol.6679-714)。位置依赖性表达的结果在转染筛选的结果中是显而易见的,这些细胞系中的大多数不产生或几乎不产生产物。因此,为鉴定单个的高表达克隆,通常有必要筛选大量的转染子。即使在广泛的筛选后,用标准的表达载体获得的转染子一般具有的表达水平也不足以达到商品化滴度目标。
常用费时费力的DHFR扩增方法来提高稳定转染子的表达水平。例如,标准表达构建体的完整拷贝一般需要扩增到100个拷贝以上才能接近具有类似强度的启动子(仅来自两个等位基因)的内源基因表达水平。标准表达载体与内源基因的不同最有可能是因为在内源基因启动子的5’和/或聚腺苷酸化信号的3’存在序列,这些序列能产生更有利于表达的染色质构型。含有能产生有利的非位置依赖性(position-independent)染色质构型的序列的表达构建体(不管整合位点如何),有利于产生高表达异源基因的细胞系。
发明概述本发明部分依赖于来自铁蛋白重链基因(ferritin heavy chaingene)的高表达“基因座载体”的开发。“基因座载体”的概念基于以下观察在高表达基因的天然染色质范围(context)中发现的位于高表达基因的5’和3’的区域能使得异源基因具有高表达水平。所以,本发明提供了铁蛋白重链基因座载体,其包含能使异源基因在稳定转染子中高表达的5’和3’序列。因此本发明提供了稳定转染并在真核细胞中高水平表达所需蛋白的基因载体。
在一个方面中,本发明提供了稳定转染以及在真核细胞中表达所需蛋白的基因载体,该基因载体包括(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)至少一个异源序列的第一插入位点;以及(d)近端3’调节序列,其对真核基因座的转录终止有效;其中这些序列以5’到3’方向按(a)-(d)的顺序可操作地连接,相邻序列间有可选的接头序列;以及其中(1)该远端5’侧翼序列包含至少100个碱基的序列,后者具有与在自铁蛋白重链基因座转录起始位点5’起的20bp与100,000bp之间发现的核苷酸序列至少70%的同一性;和/或(2)该近端5’调节序列包含至少20个碱基的序列,后者具有与在自铁蛋白重链基因座翻译起始密码子5’起的1bp与10,000bp之间发现的核苷酸序列至少70%的同一性。
另一个方面,该载体包括至少一种编码所需蛋白的第一异源编码序列。因此,本发明提供了稳定转染以及在真核细胞中表达所需蛋白的基因载体,其包括(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)至少一种编码该所需蛋白的第一异源编码序列;以及(d)近端3’调节序列,其对真核基因座的转录终止有效;其中这些序列以5’到3’方向按(a)-(d)的顺序可操作地连接,相邻序列间有任选的接头序列;以及其中(1)该远端5’侧翼序列包含至少100个碱基的序列,后者具有与在自铁蛋白重链基因座转录起始位点5’起的20bp与100,000bp之间发现的核苷酸序列至少70%的同一性;和/或(2)该近端5’调节序列包含至少20个碱基的序列,后者具有与在自铁蛋白重链基因座翻译起始密码子5’起的1bp与10,000bp之间发现的核苷酸序列至少70%的同一性。
在一些实施方案中,该远端5’侧翼序列来自铁蛋白重链基因座。在其它的实施方案中,该近端5’调节序列来自铁蛋白重链基因座。在另外一些实施方案中,该近端5’调节序列及远端5’侧翼序列均来自铁蛋白重链基因座。
在一些实施方案中,该近端3’调节序列来自铁蛋白重链基因座。在一些实施方案中,该载体进一步包含铁蛋白重链基因座的远端3’侧翼序列。
在本发明的一些实施方案中,异源序列的插入位点包含至少一个限制性内切核酸酶位点,在其它的一些实施方案中,异源序列的插入位点是包含至少两个限制性内切核酸酶位点的多接头位点。
在本发明的一些实施方案中,该近端5’调节序列包括真核内含子序列。在一些上述实施方案中,该真核内含子序列来自铁蛋白重链基因的内含子1。在一些实施方案中,近端5’调节序列包含未翻译的外显子序列。
在一些实施方案中,远端5’侧翼序列和近端5’调节序列总长在1,000到10,000个碱基之间。类似地,在一些实施方案中,近端3’调节序列及任意远端3’侧翼序列总长在1,000到10,000个碱基之间。
另一方面,本发明提供了用本发明任意载体转染的真核细胞。在一些实施方案中,载体已经稳定整合到该细胞的染色体中,在一些实施方案中,第一异源编码序列在该细胞中表达。
在一些实施方案中,本发明提供了真核细胞,其包括(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)至少一种第一编码序列;以及(d)近端3’调节序列,其对真核基因座的转录终止有效;其中这些序列以5’到3’方向按(a)-(d)的顺序可操作地连接,相邻序列间有任选的接头序列;以及其中(1)该远端5’侧翼序列包含一种至少100个碱基的外源序列,后者具有与在自铁蛋白重链基因座转录起始位点5’起的20bp与100,000bp之间发现的核苷酸序列至少70%的同一性;和/或(2)该近端5’调节序列包含一种至少20个碱基的外源序列,后者具有与在自铁蛋白重链基因座翻译起始密码子5’起的1bp与10,000bp之间发现的核苷酸序列至少70%的同一性。
另一个方面,本发明提供了一种真核细胞,其包括一种来自铁蛋白重链基因座可操作地连接到编码序列的外源5’远端侧翼序列。
另一个方面,本发明提供了一种在真核细胞中产生所需蛋白的方法,其包括以下步骤(a)提供至少一种本发明的细胞或其后代;(b)在允许高表达所需蛋白的条件下将该细胞维持在培养基中;以及(c)从所述培养基分离所需蛋白。
本领域的技术人员将从以下的详细说明和实施例中清楚地了解到本发明的这些和其它方面以及本发明的优点。
附图简述以下附图是对本发明实施方案的例示,并非意味着限制如权利要求中所涵盖的本发明的范围。


图1显示了大鼠铁蛋白重链外显子序列。
图2说明了将含有铁蛋白重链外显子的区域亚克隆到Litmus 38质粒中的一个实施例。
图3说明了从pFerX1缺失外显子2,3和4,以及插入多接头以产生质粒pFerX2。
图4说明了从pFerX2缺失外显子1编码区来产生质粒pFerX3,以及缺失IRE来产生质粒pFerX4。
图5A-B说明了从粘粒15A中去除铁蛋白重链基因外显子2到4的PCR融合物。
图6说明了将图5的PCR融合产物插入pFerX4的HpaI及AatII位点,产生质粒pFerX5。
图7说明了从pFerX5去除SwaI位点,产生质粒pFerX5.1。
图8说明了将远端3’侧翼序列加入pFerX6,产生质粒pFerX7。
图9说明了将铁蛋白重链基因的远端5’侧翼序列加入pFerX7,产生质粒pFerX8。
图10说明了质粒pFerX8的基因图谱,其包括序列的来源。
图11说明了质粒pFerX9的基因图谱,其包括序列的来源。
图12说明了质粒pFerX8和质粒pFerX9的经转录的区的序列。
图13说明了DHFR表达质粒pSIDHFR.2的基因图谱。
图14显示了测定转染子集合体(pool)中的报告基因表达的试验的结果。以及图15显示了在经转染的分离体(isolate)中测定报告基因表达的试验的结果。
发明详述在此所指的专利,科学,医学出版物确立了完成本发明时可为本领域技术人员所利用的知识。已授权美国专利,已公布的及待审的专利申请以及其它引用的参考文献的全部公开内容兹在此引入作为参考。
定义在此所用的所有技术术语和科学术语,除非在下面另行定义,均旨在与本领域技术人员通常所理解的含义相同;在此所应用的技术的引用旨在指本领域通常所理解的技术,包括那些为本领域技术人员所显而易见的技术上的改变或等同技术的替代。为了更加清晰仔细地描述本发明主题,提供了以下的定义来解释用在说明书和所附权利要求中的一些术语。
真核基因座(Eukaryotic locus)。在此用到的术语“真核基因座”是指真核细胞的任一染色体基因座,其编码能在合适的条件下在细胞中表达的多肽或RNA产物。线粒体基因座明显地被排除在此用到的术语“真核基因座”的范围之外。
远端(distal)5’侧翼序列。在此用到的术语“远端5’侧翼序列”是指侧翼区核苷酸序列,其位于基因的近端5’调节序列的5’。因此,尽管这些序列因作用于染色质构型而影响转录速度,但是这些序列通常位于基本(basic)调节序列(如,操纵基因,启动子,核糖体结合位点)的5’而且进一步从转录起始位点被去除,而不是近端5’调节序列。远端5’侧翼序列的大小范围在100到100,000个碱基之间。在一些实施方案中,远端5’侧翼序列将包含500-50,000个碱基、750-25,000个碱基或1,000-10,000个碱基。远端5’侧翼序列能在近端5’调节序列5’侧的任一位置开始,一般在转录起始位点5’的20个碱基、50个碱基、75个碱基、100个碱基、500个碱基、1,000个碱基、5,000个碱基或10,000个碱基处开始。远端5’侧翼序列可为从基因的启动子和转录起始序列的5’延伸相当长的(substantial)距离,一般在转录起始位点5’的100,000个碱基、50,000个碱基、25,000个碱基或10,000个碱基处结束。
近端(proximal)5’调节序列。在此用到的术语“近端5’调节序列”是指位于基因5’末端附近的核苷酸序列,其包括转录和翻译必需的基本调节元件(即,启动子以及如果存在的话,还包括操纵基因和核糖体结合序列)。近端5’调节序列的大小范围在20到10,000碱基之间。在一些实施方案中,近端5’调节序列将包含50-5,000个碱基,75-1,000个碱基或100-500个碱基。在一些实施方案中,近端5’调节序列的3’末端可被定义为紧邻编码(immediate)区的翻译起始点或起始密码子的5’。或者,在一些实施方案中,近端5’调节序列可包括包含内含子的基因的内部序列,因此,近端5’调节序列的3’末端可延伸到内含子序列。此外,在一些实施方案中,近端5’调节序列可包括一些5’编码序列(如,起始密码子和/或短的N末端序列)。近端5’调节序列延伸到转录起始位点的5’而且可在转录起始位点5’的10,000个碱基、5,000个碱基、1,000个碱基、500个碱基、100个碱基、75个碱基、50个碱基或20个碱基处结束。
近端3’调节序列。在此用到的术语“近端3’调节序列”是指位于基因3’末端附近的核苷酸序列,其包括适当的mRNA加工和翻译终止所必需的基本调节元件(即,翻译终止密码子,聚腺苷酸化信号以及转录终止子)。近端3’调节序列的大小范围在10-2,000个碱基之间。在一些实施方案中,近端3’调节序列将包含25-1,000个碱基,50-750个碱基或75-500个碱基。近端3’调节序列的5’末端可用翻译终止或“停止”密码子(即TAG,TTA或TGA)限定。近端3’调节序列延伸到翻译终止密码子的3’,而且可在翻译终止密码子的3’端的2,000个碱基、1,000个碱基、750个碱基或500个碱基处结束。
远端3’侧翼序列。在此用到的术语“远端3’侧翼序列”是指基因近端3’调节序列的3’的侧翼区核苷酸序列。因此,这些序列是适当的mRNA加工和翻译终止所必需的基本调节序列(即终止密码子及聚腺苷酸化信号)的3’,并进一步从转录终止位点去除近端3’调节序列。而不是远端3’侧翼序列的大小范围在100到100,000个碱基之间。在一些实施方案中,远端3’侧翼序列将包含500-50,000个碱基、750-25,000个碱基或1,000-10,000个碱基。远端3’侧翼序列能在近端3’调节序列的3’的任一位置开始,一般在翻译终止密码子3’的500个碱基、750碱基、1,000个碱基或2,000个碱基处开始。远端3’侧翼序列可在一个基因的转录终止密码子及聚腺苷酸化序列的3’延伸相当长的距离,而且一般在转录终止密码子的3’的100,000个碱基、50,000个碱基、25,000个碱基或10,000个碱基处结束。
载体。在此用到的术语“载体”意味着任一能在细胞间转移核酸的基因结构,如质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒体等。载体可以具有复制、表达、重组、插入或整合中的一种或多种的能力,但没有必要具备每一种能力。因此,这个术语包括克隆型(cloning)及表达载体。
转染。在此用到的术语“转染”意味着在细胞或生物体中引入一种载体,其可在该细胞或生物体中复制或在该细胞或生物体中表达一种多肽序列且其可以整合到或不整合到该细胞或生物体的基因组中。术语“转染”通常囊括所有引入这种载体的各种方法,包括但不限于本领域涉及的方法如转染、转化、转导或基因转移,以及包括诸如显微注射、DEAE-葡聚糖介导的胞吞、磷酸钙共沉淀、电穿孔、脂质体介导的转染、弹道注射、病毒介导的转染以及相似的技术。经过转染的细胞或生物体在此被称为“转染子”。
稳定转染。在此用到的术语“稳定转染”意味着上面定义的转染,其可导致载体的全部或部分整合到被转染的细胞或生物体的基因组中。经过稳定转染的细胞或生物体在此被称为“稳定转染子”。
可操作地连接(operaby joined)。在此用到的术语“可操作地连接”是指基因调节元件和基因编码区的一种功能性的共价键,此键可通过RNA聚合酶使编码区转录成mRNA,该RNA聚合酶能结合一种或多种调节元件。因此,当RNA聚合酶在容许性条件下有能力与调节区内的启动子结合并使编码区转录成mRNA时,调节区包括调节元件,与编码区可操作连接。就此而论,许可条件可包括组成型启动子的标准的细胞内条件,标准条件及缺无阻遏物或存在可抑制性启动子/可诱导性启动子的诱导物的条件,以及本领域所知的用于体外转录系统的合适的体外条件。
异源的。在此用到的术语“异源的”意味着对于两个或多个基因序列,这些序列不是天然可操作地连接起来也不是天然在同一个基因组中天然出现。例如,如果一种载体包括一种被可操作连接到一个或多个调节元件的编码区,而这些序列不是天然可操作地连接起来也不是天然在同一个基因组中发现的,那么这些序列被认为彼此是异源的。
核苷酸位置。在此用到的所有的核苷酸位置相对于DNA链命名,该DNA链包括“有义”取向的铁蛋白重链基因区元件。从上下文中即可显见,用数字表示的核苷酸位置命名或者相对于铁蛋白重链基因起始密码子的位置,或者相对于序列列表中包括的一种序列内的位置。在前一种情况,起始密码子(ATG)的腺苷或“A”命名为位置1,在这之前的位置编号为负。在后一种情况,相应的SEQ ID NO总是被具体说明。相对的核苷酸位置可参照有义链传统的5’和3’方向描述。
核苷酸序列同一性百分比。在此用到的两个核苷酸序列间序列同一性百分比是基于两个被比对的序列间相同的残基数目除以存在于其中较短的那个序列的核苷酸数目来计算的。在计算同一性百分比之前,这些序列用具有缺省值的ClustalW程序运算算法(或一种等价算法)来比对,ClustalW程序可通过欧洲分子生物学实验室(European Molecular Biology Laboratory)(EMBL)(http//www.ebi.ac.uk/clustalw)的欧洲生物信息学院(EuropeanBioinformatics Institute)查到,而且在Higgins等(1994)中描述“CLUSTAL WImproving the sensitivity of progressive multiple sequence alignment throughsequence weighting,position-specific gap penalties and weight matrix choice,”Nucleic Acids Res.224673-4680。
来自(derived from)。在此用到的术语“来自”的使用与核苷酸序列起源有关时,意味着该序列可通过在参照序列中进行限定数目的插入,缺失或替代作用而已经或能够直接或间接获得或产生。因此,例如,是参照序列子集的序列可来自缺失侧翼序列的参照序列。同样,序列可通过参照序列中插入,缺失和/或替代一个或多个核苷酸的组合而来源于该参照序列。插入,缺失和替代序列的数目可由参照序列和衍生序列间所需的百分比同一性所限定。
数值范围。在此用到的变量数值范围的讲述旨在表明本发明可由等于那个范围内的任何值的变量来实施。因此,对一个固有离散变量来说,该变量等于数值范围的每个整数值,包括该范围的端点值。同样,对一个固有连续变量来说,该变量等于数值范围的每个实数值,包括该范围的端点值。例如,一个描述为值在0到2之间的变量,若其为固有离散变量则为0、1、2,若其为固有连续变量则为0.0、0.1、0.001或其它任何≤2的实数值。
或。除非另外特别指出,在此用到的连接词“或”用于“和/或”的“包含的”意义而不是“不是/就是”的“仅有的”意义。

发明内容
本发明部分依赖于来自铁蛋白重链基因的高表达“基因座载体”的开发。在高表达基因的天然染色质邻近序列中发现的在高表达基因5’和3’的区域能赋予异源基因高表达水平,“基因座载体”的概念是以这种观察为基础的。所以,本发明提供了铁蛋白重链基因座载体,其包含能使异源基因在稳定转染子高表达的5’和3’序列。因此本发明提供了稳定转染并在真核细胞中高水平表达所需蛋白的基因载体。
铁蛋白重链基因。
大鼠和人的基因组含有多重加工(multiple processed)的铁蛋白重链假基因(Hentze等(1986),Proc.Natl.Acad.Sci.USA 837226-72307)。大鼠的铁蛋白基因由被3个内含子(即,内含子1到3)分开的4个外显子(即,外显子1到4)组成。GenBank登录号(Accession No)M18051,M18052和M18053公开了3个基因片段如图1A,B,C部分所示。这三个节段合起来覆盖了大鼠铁蛋白重链基因组序列的4个外显子。图1(A)显示了5’未翻译序列的168bp,包括-168位置的转录起始位点,随后为外显子1及内含子1的5’末端的前104bp。外显子1包含起始密码子并编码38个氨基酸。图1(B)显示了内含子1的3’末端最后的50bp,随后为外显子2及内含子2的5’末端的前35bp。图1(C)显示了内含子2的3’末端的最后33bp,随后为外显子3,内含子3,外显子4以及3’未翻译序列,包括终止密码子及终止密码子后聚腺苷酸信号132bp。
由于粘粒文库的插入片段的大小范围相当大,可从它们中挑选获得足够多的5’和3’侧翼序列。更具体的说,选择大鼠粘粒文库目录#RL1032m(BD Biosciences/Clontech,Palo Alto,CA)。但是,也可以用其它基因文库,或者可合成制备序列。
在筛选粘粒文库时为了避免对加工过的假基因的克隆,内含子序列被选作探针模板。由大鼠基因组DNA(Catalog#6750-1,Clontech,Palo Alto,CA)作为模板以GenBank中的相关cDNA及基因组序列为引物通过PCR克隆得到这些内含子。生物素化的探针可用内含子作为模板而制备,并且粘粒文库用所述探针来筛选。一种铁蛋白重链基因粘粒(15A)可用限制性内切核酸酶分离和绘制出来。GenBank中大鼠基因组序列的三个片段指导定位编码区并计划产生高表达基因座载体。
铁蛋白重链基因高表达基因座载体的产生。
本发明的高表达基因座载体可通过许多方式产生。例如,形成载体的序列可从单克隆或多克隆得到。该序列可完全基于大鼠铁蛋白重链基因,完全基于另一种哺乳动物的铁蛋白重链,或基于多重的哺乳动物铁蛋白重链基因。该序列可基于所有天然衍生的序列或天然衍生序列与合成序列的混合物。此外,基因座载体的产生方法,包括先获得包含全部或部分的铁蛋白重链基因区的一个或多个大基因组片段,然后缺失非目的序列或使非目的序列失活同时插入目的序列,或者仅仅克隆或亚克隆铁蛋白重链基因区的目的片段,然后将这些片段与其它目的序列结合。同样,这些方法的混合,应用克隆、亚克隆、缺失、失活及插入的方法可用于获得所需构建体。方法的采取以及各步骤的顺序与本发明无关,可由本领域技术人员自行决定。
本发明的高表达基因座载体以5’到3’的顺序依次包括(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)异源序列的至少一个第一插入位点;以及(d)近端3’调节序列,其对真核基因座的转录终止有效。连接序列可在片段(a)-(d)两两之间任选地存在。此外,远端5’侧翼序列和近端5’调节序列中至少一种与铁蛋白重链基因的相应序列具有基本的同一性。在一些实施方案中,远端3’侧翼序列也包括在该载体中。
本发明高表达基因座载体的一个实施方案,以下描述的pFerX8载体,已在GenBank登录号AY147930中公开。
A.远端5’侧翼序列及近端5’调节序列。
在一些实施方案中,基因座载体的远端5’侧翼序列将包括一种100-100,000个核苷酸的序列,后与铁蛋白重链基因座远端5’侧翼序列内发现的核苷酸序列至少具有70%-100%的同一性。因此,在一些实施方案中,远端5’侧翼序列可包括至少100、500、750、1,000、10,000、25,000、50,000或100,000个核苷酸,其与铁蛋白重链基因座远端5’侧翼序列内发现的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。如下面的实施例所示,远端5’序列可包含1,000-10,000bp、2,000-9,000bp、3,000-8,000bp或4,000-7,000bp的侧翼序列。
在其它的实施方案中,基因座载体的远端5’侧翼序列将与相应的铁蛋白重链基因序列具有更低百分比的同一性,而且,在一些实施方案中,远端5’侧翼序列将与任何相应的铁蛋白重链基因序列无关。
本发明的高表达基因座载体包含在远端5’侧翼序列下游的近端5’调节序列。在一些实施方案中,基因座载体的近端5’调节序列将包括一种至少20-10,000个核苷酸的序列,后者与铁蛋白重链基因座近端5’调节序列内发现的核苷酸序列具有至少70%-100%的同一性。因此,在一些实施方案中,近端5’调节序列可包含至少20、50、75、100、500、1,000、5,000或10,000个核苷酸,其与铁蛋白重链基因座近端5’调节序列内发现的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。
在其它实施方案中,基因座载体的近端5’调节序列将与相应的铁蛋白重链基因序列具有更低百分比的同一性,而且,在一些实施方案中,近端5’调节序列将与任何相应的铁蛋白重链基因序列无关。
在所有的实施方案中,近端5’调节序列必须对插入载体的异源编码区的起始转录有效。因此,在那些近端5’调节序列基于相应的铁蛋白重链基因序列的实施方案中,它们不应发生很大程度的变化以至于该序列对起始或启动转录无效。因此,诸如“TATA框”或核糖体结合位点的特征的保守性,或这些特征用相当的序列替代,对保持表达载体的功能性是必需的。另一方面,用其它基因的功能等效物(包括任何许多已知的其它基因来源的近端5’调节区)来完全替代这些序列也是可以容许的。同样,用基于两个或更多个基因的近端5’调节序列的嵌合序列来替代这些序列是可以容许的。
在一些实施方案中,远端5’侧翼序列及近端5’调节序列包括一种至少100-1000个核苷酸的序列,后者分别与铁蛋白重链基因座远端5’侧翼序列及近端5’调节序列内发现的核苷酸序列具有至少70%-100%的同一性。在一些实施方案中,远端5’侧翼序列及近端5’调节序列与铁蛋白重链基因座内邻接序列具有70%-100%的同一性。
由于铁蛋白重链基因的内含子1能包含正性(positive)调节元件,而且能协助RNA加工及转运,其能有利于创建一种基因座载体,该载体包括保留全部或部分的内含子1作为近端5’调节序列的一部分。这个过程可通过在内含子1序列的起始位置的5’保留ATG密码子以及任选地保留附加密码子来实现。如果保留的是除ATG外其它的密码子,它们可来自铁蛋白重链基因外显子1编码序列或任何其它的编码序列(包括合成的和人造的序列),而且它们将编码异源编码序列融合蛋白的N末端。这种N末端的作用如同一个前导区或信号序列协助异源序列的表达。或者,在其它实施方案中,附加的异源序列的插入位点(如,单一限制位点或多接头)可被插入到内含子1的起始位置的5’,使得编码各种N末端序列(如,前导序列或信号序列)的序列可任意插入。ATG密码子可作为载体的一部分,或作为所插入异源序列的一部分。
然而,并没有必要在内含子1之前保留ATG密码子或其它密码子。然而,在一些实施方案中,ATG密码子可在外显子2中存在或可由异源编码序列提供。在这样的实施方案中,异源序列插入位点可在外显子2中存在或位于内含子1/外显子2连接处,而且提供的ATG密码子或者作为载体的一部分,或是插入的异源序列的一部分。但是,在所有载体中包含内含子1的实例中,必须保留内含子1的剪接供体和剪接受体的序列,或等同的剪接供体和剪接受体序列,所以内含子序列是转录后被去除的。如同在此描述的,内含子内的其它序列可被缺失或改变,或者可插入额外序列。在保留内含子的结构中,不管在内含子1的5’还是3’,异源编码区的插入都不能破坏剪接供体和受体位点,必须重建剪接供体和受体位点或必须提供相当的剪接供体和受体位点。
最后,由于铁蛋白重链基因外显子1在ATG的3’(大约在位置-138到-111)也包含一种铁调节元件(IRE),该元件依赖铁的水平负性调控(control)翻译(Klausner等(1993),Cell 7219-26综述),所以基因座载体的创建可任选地包括从近端5’调节序列缺失IRE。
B.铁蛋白重链编码区一般,基因座载体将不包括铁蛋白重链基因的任何编码区。但是,依赖创建本载体的方法,可有意或作为副产物来包括铁蛋白重链基因编码区。例如,如果旨在仅用远端5’侧翼序列和/或近端5’调节序列将完整的铁蛋白重链基因区(一起为“5’铁蛋白序列”)克隆到一个载体中,编码区可有意地被全部缺失。或者,异源序列的插入位点(如,单一限制位点或多接头)以及近端3’调节序列(及任选地远端3’侧翼序列)可插入紧邻5’铁蛋白序的3’处而不缺失编码区。由于干预性插入,编码区失活。同样,所有的编码区除了起始密码子外都将被缺失或,或者,异源序列插入位点以及近端3’调节序列(及任选地远端3’侧翼序列)可插入紧接起始密码子3’处。此外,在异源序列插入位点以及近端3’调节序列(及任选地远端3’侧翼序列)插入之前,能保留编码区的更大一部分所以能产生融合蛋白。最后,这样应用前述方法的组合以致铁蛋白重链基因编码区通过插入干预序列可部分被缺失及部分失活。但是,在一些实施方案中,为了减小载体的大小,可缺失失活的及未翻译的序列。
C.异源序列插入位点。
本发明的高表达基因座载体在近端5’调节序列的下游包括异源序列的插入位点诸如多接头位点。异源序列的插入位点可以是这样的序列,其能使以一种异源序列充分受控的和可预测的方式插入,从而以合理的成功的期望值产生功能性的高表达基因座载体。异源序列的插入位点可包括同源重组、定点整合(site-directed integration)(如,通过转座子或病毒构建体)或核酸内切酶介导的限制性。插入位点的长度可从4bp(在使用四切(four cutter)的限制性内切核酸酶时)变化到1,000bp或5,000bp(用于同源重组方法)。然而,在一些情况下,近端5’调节序列的3’末端和近端3’调节序列的5’末端可以形成一个插入位点而无需在它们之间包含额外的核苷酸。因此,例如,近端5’调节序列的最后两个核苷酸和近端3’调节序列的最初两个核苷酸能形成一个4bp的限制性位点,其可作为异源序列的一个插入位点。或者,在这些序列之间仅需要有一个或几个核苷酸就可形成一个插入位点。因此,插入位点的长度除了上述可为4bp到5,000bp,也可以为0、1、2或3bp。
在一些实施方案中,异源序列插入位点可包括在有义链或反义链上的一个或多个核苷酸序列,作为天然或人工内切酶的限制性位点。这些限制性位点在载体中可以是唯一的,而且插入位点可以是包括多种这样的限制性位点的多接头,该接头可更灵活的应用不同的限制性内切核酸酶。实施例1和图3提供了一个这样的多接头的实施例。
D.近端3’调节序列。
本发明的高表达基因座载体在包括异源序列的插入位点的下游近端3’调节序列。这些序列最小包括一种聚腺苷酸化信号。在一些实施方案中,近端3’调节序列也包括转录终止信号。在一些实施方案中,这些序列可包括翻译终止密码子,然而在其它实施方案中,终止密码子可被包含在异源序列插入序列中。
近端3’调节序列可来自铁蛋白重链基因但不是必需的。例如,在一些实施方案中,基因座载体的近端3’调节序列可包括至少10-2,000个碱基的核苷酸的序列,后者与铁蛋白重链基因座近端3’侧翼序列内发现的核苷酸序列具有至少70%-100%的同一性。因此,在一些实施方案中,近端3’调节序列可包含至少10、25、50、100、500、750、1,000或2,000个核苷酸,其与铁蛋白重链基因座近端3’调节序列内发现的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。在其它实施方案中,近端3’调节序列基本上由一种聚腺苷酸化信号组成,该聚腺苷酸化信号可以来自铁蛋白重链基因,异源序列或是合成的或者人工的序列。
在其它的实施方案中,基因座载体的近端3’调节序列将与相应的铁蛋白重链基因序列具有更低百分比的同一性,而且,在一些实施方案中,近端3’调节序列将与任何相应的铁蛋白重链基因序列无关。
E.远端3’侧翼序列。
本发明的高表达基因座载体任选地包括近端3’调节序列下游的远端3’侧翼序列。远端3’侧翼序列可来自铁蛋白重链基因但不是必需的。例如,在一些实施方案中,基因座载体的远端3’侧翼序列可包括至少100-100,000个核苷酸的序列,后者与铁蛋白重链基因座远端3’侧翼序列内发现的核苷酸序列具有至少70%-100%的同一性。因此,在一些实施方案中,远端3’侧翼序列可包含至少100、500、750、1,000、10,000、25,000、50,000或100,000个核苷酸,其与铁蛋白重链基因座远端3’侧翼序列内发现的核苷酸序列具有至少70%、75%、80%、85%、90%、95%或100%的同一性。如在以下实施例显示,远端3’侧翼序列可包括1,000-10,000bp、2,000-9,000bp、3,000-8,000bp或4,000-7,000bp的侧翼序列。
在其它的实施方案中,基因座载体的远端3’侧翼序列可与相应的铁蛋白重链基因序列具有更低百分比的同一性,而且,在一些实施方案中,远端3’侧翼序列可与任何相应的铁蛋白重链基因序列无关。
下面的实施方案示出了实施本发明的一些详尽的方式,但不旨在限制本发明的权利要求范围。可利用另外的材料和方法获得相似的结果。
实施例1铁蛋白重链基因座载体的创建。
为产生基于铁蛋白重链基因的高表达基因座载体,采用了三个研发阶段(1)克隆具有基本的(substantial)5’和3’区铁蛋白重链基因;(2)产生基于这些基因区的至少一种的表达载体,以及(3)载体的最优化。如上提及的,许多其它的方法可以用来产生相同或等同的基因座载体。
首先,将粘粒15A的含有铁蛋白重链外显子的区域亚克隆入载体Litmus 38(New England Biolabs)产生质粒pFerX1(图2)。从粘粒15A中分离出BamHI-XhoI片段,并与用BamHI和SalI消化的Litmus 38连接从而产生质粒pFerX1。注意粘粒15A仅部分测序而且一些限制性位点的位置是基于限制酶切作图的。因此一些限制性位点的位置可能并不精确。
图3示出了从pFerX1缺失含有外显子2,3,4的片段并插入含有AatII及SalI限制性位点的多接头从而产生质粒pFerX2。缺失的HpaI片段从插入序列的HpaI位点延伸到pFerX1的载体的HpaI位点。多接头的5’末端再生HpaI位点,但3’末端没有再生该位点。用PCR筛选接头的取向。
从pFerX2中缺失外显子1编码区,保持ATG起始密码子及以下剪接受体完整从而产生质粒pFerX3。图4示出了外显子1编码区的缺失是通过从pFerX2中分离BamHI-BspHI(2515-2719)及NcoI-BamHI(2830-2515)片段实现的。BspHI及NcoI产生匹配的突出端,其允许合成片段连接在一起产生pFerX3。这种操作的结果是载体的外显子1从BspHICCAGCCGCCATC ATG ACC ACC GCG TCT CCC TCG CAA GTG CGC CAG AAC TAC CAC CAG GAC TCG GAG GCTGGTCGGCGGTAG TAC TGG TGG CGC AGA GGG AGC GTT CAC GCG GTC TTG ATG GTG GTC CTG AGC CTC CGAMet Thr Thr Ala Ser Pro Ser Gln Val Arg Gln Asn Tyr His Gln Asp Ser Glu AlaNcoI剪接供体GCC ATC AAC CGC CAG ATC AAC CTG GAG TTG TAT GCC TCC TAC GTC TAT CTG TCC ATG GTGAGTGCGGCCTCGG TAG TTG GCG GTC TAG TTG GAC CTC AAC ATA CGG AGG ATG CAG ATA GAC AGG TAC CACTCACGCCGGAAla Ile Asn Arg Gln Ile Asn Leu Glu Leu Tyr Ala Ser Tyr Val Tyr Leu Ser Met变化为剪接供体CCAGCCGCCATC ATG GTGAGTGCGGCCTGGTCGGCGGTAG TAC CACTCACGCCGGAMet外显子1IRE的缺失通过在pFerX3中用不含IRE的接头(但创建了一个5′KpnI位点用于筛选)替代SacII-EagI(2575-2639)片段从而产生质粒pFerX4而实现的。这种操作的结果是载体的外显子1(IRE用下划线显示)从SacII(2575) EagI(2639)CAGAGTCGCCGCGGTTTCCTGCTTCAACAGTGCTTGAACGGAACCCGGTGCTCGACCCCTCCGACCCCCGTCCGGCCGCTTTGAGCCGTCTCAGCGGCGCCAAAGGACGAAGTTGTCACGAACTTGCCTTGGGCCACGAGCTGGGGAGGCTGGGGGCAGGCCGGCGAAACTCGG变化为(接头用粗体显示)KpnI(2579)SacII(2575) EagI(2611)CAGAGTCGCCGCGGTACCGGTGCTCGACCCCTCCGACCCCCGTCCGGCCGCTTTGAGCCGTCTCAGCGGCGCCATGGCCACGAGCTGGGGAGGCTGGGGGCAGGCCGGCGAAACTCGG以三步法产生PCR融合产物,用含有SwaIand NotI的多接头替代外显子2到4,同时保留铁蛋白重链基因的近端5’调节序列以及近端3’调节序列。如图5(A)显示,第一次PCR用粘粒15A(图2)作为模板。引物Fer1和Fer4的引物定位如箭头所示。引物FN1及FN2的“引发(priming)”区也用条形表示。第二步,如图5(B)显示,产生了Fer1-FN2的PCR产物。示出了引物Swa-2“引发”区的定位。第三步,如图5(C)显示,产生了一种FN1-Fer4的PCR产物。示出了引物Swa-1“引发”区的定位。第四步以及最后一步,如图5(D)显示,用Fer1-Swa-2及Swa-1-Fer4产物作为模板以及用引物Fer1及Fer4产生最终的PCR融合产物。使该产物中分离出的HpaI-AatII片段插入pFerX4的HpaI及AatII位点产生质粒pFerX5(见图6)。前三步用到的产生SwaI-NotI多接头的PCR融合反应如表1所示。
表1

PCR引物如下所示,多接头序列用粗体显示,FN1及FN2之间或Swa-1及Swa-2之间的互补序列用下划线显示。
NheI NotI AatIIFN1ACTTTCAGCTGCTAGCGGCCGCGCTGACGTCCCCAAGGCCATNotI NheIFN2ACGTCAGCGCGGCCGCTAGCAGCTGAAAGTGGAAAGGGTATSwaI NotI AatIISwa-1CTTTCCATTTAAATCTGCTAGCGGCCGCTGACGTCSwaISwa-2TAGCAGATTTAAATGGAAAGGGTATTTGTTATTGATC用SwaI平端切割质粒并插入含有AscI位点的双链寡核苷酸(oligo)GGCGCGCCCCGCGCGG来去除pFerX4的载体骨架的SwaI位点从而产生质粒pFerX4.1。从载体骨架去除SwaI位点目的是使SwaI位点在上述多接头中唯一。
pFerX4.1的载体骨架(其中图15的AscI oligo的插入破坏了载体骨架的SwaI位点)以及pFerX5的载体骨架(在骨架区和多接头位点包含SwaI位点)用SacII-AatII片段交换来产生质粒pFerX5.1(图7)。pFerX5.1含有多接头但在骨架区缺少SwaI位点,使多接头的SwaI位点唯一。
多接头BglII BstBICTGTGAGATCTGTTCGAATGGTGCAGACACTCTAGACAAGCTTACCAGCTAatIISalI匹配的 匹配的被插入到pFerX5.1的SalI-AatII位点产生质粒pFerX6。多接头包括BglII和BstBI位点,它被设计成接受(receive)铁蛋白重链基因的远端3’侧翼序列。
铁蛋白重链基因的远端3’侧翼序列(粘粒15A的AatII-BamHI片段)被插入到pFerX6的AatII-BglII位点产生质粒pFerX7(图8)。
铁蛋白重链基因的远端5’侧翼序列(pFerH1的BamHI片段,粘粒15A的亚克隆,图2BamHI 10269-15176)被插入到pFerX7的BamHI位点产生质粒pFerX8(图9)。
各种形成pFerX8的序列的起源如图10所示。Litmus 38骨架用实心框表示。该质粒含有在起始ATG密码子之前的>6kb的远端5’侧翼序列以及在终止密码子之后的~7kb的远端3’侧翼序列。SwaI及NotI克隆位点分别位于位置10240及10254。插入SwaI及NotI位点的编码区在5’端应该是平端的(SwaI端),并应以碱基CAG起始再产生剪接受体然后是第二个氨基酸。NotI位点应位于终止密码子之后的3’末端。
远端5’侧翼序列的附加片段(粘粒15A的BspEI片段)被插入到pFerX8的BspEI位点(6037)产生质粒pFerX9(图11,BspEI片段6034-14211)。这种插入除了重复了在pFerX8中已存在的远端5’侧翼序列的片段(10697-13990与2520-5813相同)还添加了远端5’侧翼序列的独特(unique)片段。这种质粒并非完全测序,一些限制性位点的位置是基于限制性片段大小估计的。
质粒pFerX8及pFerX9的转录区的序列如图12所示。示出了推定的转录起始位点。内含子以小写字体显示。推定的TATA及聚腺苷酸化信号用下划线表示。起始密码子在第一个外显子中而且插入的基因从第二个氨基酸开始插入到SwaI及NotI位点。
实施例2异源序列的表达A.报告基因报告基因被插入到质粒pFerX8及pFerX9的多接头中的SwaI-NotI位点。分泌型碱性磷酸酶被选作一种报告基因,因为产物的可购得的测定法简便而且快速。表达载体命名为pFerX8SEAP及pFerX9SEAP。
载体多接头的序列以及需要被重建从而再生出剪接供体的外显子2的5’末端的原始序列如图5所示。因此,5’引物应包括5’末端的CAG用于重建天然的剪接供体,其后是起始于第二个氨基酸的编码区(ATG已包括在外显子1内)。PCR产物的5’末端应保持平端以使与SwaI位点连接。例如一般5’引物CAGNNN NNN NNN NNN NNN NNN NNNAA2 AA3 AA4 AA5 AA6 AA7 AA8SEAP例子的引物CAGCTG CTG CTG CTG CTG CTG CTG GGC3’引物应包括NotI位点,随后是包括终止密码子(相反链)的基因的3’末端。PCR产物应该用NotI消化产生与多接头的NotI位点匹配的末端。例如一般5’引物NNNN GCGGCCGC NNNNNN NNN NNN NNN NNN NNNNotI 基因3’末端位点SEAP例子的引物(终止密码子为粗体)TTTT GCGGCCGC AGCTCA TGT CTG CTC GAA GCG GCCPCR产物与载体(用SwaI及NotI消化)的连接并不在插入序列5’末端重新产生(recreate)SwaI位点。而连接产物在“SwaI末端”含有一个合适的剪接受体。插入区也包含从第二个氨基酸到终止密码子的编码区,其后为3’末端的NotI位点。例如,一般在连接后CCATTT CAGNNN NNN NNN //NNN NNN NNNGCGGCCGC TGACGT对SEAP的例子CCATTT CAGCTG CTG CTG //CAG ACA TGAGCGGCCGC TGACGTB.转染用于转染的宿主是CHO DG44(E)细胞系(Urlaub等(1986),Somatic CellMol.Gen.12555-566),其已被选作在无血清培养基中生长并存活。这种细胞系在转瓶(spinner flask)中用加入核苷的无血清培养基维持。用于转染的细胞以指数生长。每次转染用2×106或5×106个细胞。
报告质粒与编码二氢叶酸还原酶(DHFR)命名为pSI-DHFR.2的质粒共转染以至于能在DHFR-宿主中选出稳定转染子。pSI-DHFR.2质粒包括一个筛选标志由SV40启动子驱动(SV40增强子缺失)的dhfr基因(图13)。
所有的DNA由Megaprep试剂盒(Qiagen,Valencia CA)制备。在转染DNA之前,用EtOH沉淀,用70%EtOH洗涤,干燥,重悬于HEBS(20mMHepes pH7.05,137mM NaCl,5mM KCl,0.7mM Na2HPO4,6mM右旋糖),并在转染DNA之前定量。用带有SV40早期启动子/增强子表达SEAP的质粒(pSEAP2,Clontech,Palo Alto,CA)作为阳性对照组。阴性对照组包括空pUC18载体(ATCC#37253,美国典型培养物保藏中心(American TypeCulture Collection),Manasssas,VA)作为报告物(reporter)对照并以无DNA转染作为转染对照。
每次转染都包含50μg的报告质粒及5μg的pSI-DHFR。选择相等的质粒重量而非相等的摩尔量。从体积摩尔浓度(molarity)角度,对照报告组与测试报告组有3-5倍级数的不同(表3)。在每种情况下,测试报告组均比对照报告组低。
表3

细胞及DNA用0.4cm的比色杯(cuvette)(BioRad,Hercules,CA)在0.8ml的HEBS中以0.28kV及950μF通过电穿孔进行转染。在电穿孔脉冲后,细胞可以在比色杯室温温育5-10分钟。然后将它们转移到离心管中,该管包含10%dFBS(HyClone,Logan,UT)的10ml加上核苷的Alpha-MEM(GIBCO,Gaithersburg,MD)以1K rpm沉淀5分钟。重悬的沉淀接种于T形瓶(包含10%dFBS的无核苷的Alpha-MEM)在36℃ 5%CO2湿化孵箱中温育直至菌落形成。
表4总结了所进行的七个试验。转染1-3每个以一式三份进行,转染4-7每个进行一次。
表4

C.转染效率转染大约两周后,菌落形成。稳定转染子可作为集合体或者分离体来分析。尽管所有的含有pSI-DHFR.2的转染产生菌落,含铁蛋白重链基因座载体的转染产生的菌落比对照要少。不论基因座载体是否表达产物,这是真实的。由于每次转染包括等量的DNA,所以这些结果是令人吃惊的。由于转染效率不同,推荐进行多重转染来解决转染子数目减少的问题。
D.SEAP测定含有SEAP基因的报告构建体用Great EscAPeTMSEAP ReporterSystem3(Clontech,Palo Alto,CA)分析。这种测定方法是用一种荧光底物检测在条件培养基中SEAP的活性。根据生产厂商的用法说明以96孔格式使用这个试剂盒,而且具有以下不同。所有的标准品和样品在新鲜的培养基中稀释而不是用所提供的稀释缓冲液稀释。并非60分钟后读一次数,而是每隔10-20分钟多次读数,以每分钟的相对荧光单位(RFU/min)表示SEAP的活性。用于Cytofluor II平板读出器的发射滤波是460nm而不是推荐的449nm。
下面的集合体及分离体产生的所有数据是基于表达SEAP的报告构建体。报告的滴度是基于试剂盒的阳性对照。尽管绝对值不是推理得出的,相对滴定度值是有用的。
在测定中估计比产率(specific productivity),其中将培养基更换为新鲜培养基,在24小时后取样培养基,并计数细胞。产物滴度标准化为24小时测定末的细胞数目。因为滴度是相对的,比生产率表示为相对值。
E.转染子的集合体在菌落出现后,收集并汇总每种转染的细胞。接种该集合体到6孔板或T形瓶并在24小时测定中保持分会合。集合体测定结果如图14所示。每种构建体分析了五个集合体,两个来自试验1(1A和1B),三个来自试验2(2A,2B以及2C)。所有的测定在转染后三到四个星期后进行。注意用pFerX8SEAP的试验2C相对于其它转染具有很低的转染效率。
利用对照组(pSEAP2)的比生产率相当一致,但是利用pFerX8SEAP及pFerX9SEAP载体的比生产率高度可变。特别是,铁蛋白载体能产生具有比对照组的比生产率更高的集合体。
F.转染子的分离体分离体是从转染试验#2“挑取(picking)”菌落获得的。“挑取”是通过用P200Pipetman在50μl档在直接吸出菌落而获得的。吸出的菌落先转移到一个48孔板当有足够数目的细胞时转移到6孔板上。在6孔板中在接近会合到会合的细胞密度用上述的24小时测定法测定比生产率。每个构建体分析40-50个分离体。结果如图15所示,其中分离体按它们对于每种SEAP表达构建体的比产率的顺序示出。用于比较的组(panel)的比产率等级是一致的。
pSEAP2转染的分离体大部分(63%)不表达超出检测界限的产物。在这个试验中pSEAP2的最高生产率是每天每个细胞46个单位(用于比较的相对值)。相反,pFerX8SEAP转染的分离体仅有28%表达低于检测界限的产物,而其中44%的生产率超过最高的pSEAP2转染子。本试验中pFerX8SEAP的最高生产率是每天每个细胞259单位,是pSEAP2的最高生产率的五倍。尽管pFerX9SEAP构建体比pSEAP2表现好,但它不如pFerX8SEAP。
实施例3载体大小的缩小为了缩小载体的大小便于使用,缺失载体的5’和/或3’区(表5)。可如前用SEAP作为报告基因一样来检测这些缺失。对表5所示的每一种质粒,以及对照pSEAP2及pUC18(10个分离体),检测大约30个分离体。
表5

*缺失终点基于pFerX8序列编号。
**SEAP基因构成该质粒的1557bp。
pFerX11SEAP载体表现与pFerX8SEAP载体相似,表示在表5中所描述的~3.9kb的3’区缺失不是有损害的。pFerX10SEAP及pFerX12SEAP载体表现不如pFerX8SEAP,表示在表5中所描述的~4.9kb的5’缺失对功能是有损害的。
等同物虽然已经参照本发明一些具体实施方案详细地说明并描述了本发明,本领域技术人员应当明白可以在形式上和细节上进行各种修改而不背离所附权利要求限定的本发明精神和范围。本领域技术人员仅用常规试验即可认识到或能确定本发明在此具体描述的具体实施方案的许多等同物。这些等同物也应在所附权利要求所覆盖的范围内。
权利要求
1.用于在真核细胞内进行稳定转染并表达所需蛋白的基因载体,其包含(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)第一异源编码序列的至少一个第一插入位点;以及(d)近端3’调节序列,其对真核基因座的转录终止有效;其中所述序列以5’到3’的方向按(a)-(d)的顺序可操作地连接,并且相邻序列间有任选的接头序列;以及其中(1)所述远端5’调节序列包含至少20个碱基的序列,后者具有与在自铁蛋白重链基因座翻译起始密码子5’起的1bp与10,000bp之间发现的核苷酸序列至少70%的同一性;或(2)所述近端5’侧翼序列包含至少100个碱基的序列,后者具有与在自铁蛋白重链基因座转录起始位点5’起的20bp与100,000bp之间发现的核苷酸序列至少70%的同一性。
2.用于在真核细胞内进行稳定转染并表达所需蛋白的基因载体,其包含(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)编码所述所需蛋白的至少一种第一异源编码序列;以及(d)近端3’调节序列,其对真核基因座的转录终止有效;其中所述序列以5’到3’的方向按(a)-(d)的顺序可操作地连接,并且相邻序列间有任选的接头序列;以及其中(1)所述远端5’侧翼序列包含至少100个碱基的序列,后者具有与在自铁蛋白重链基因座转录起始位点5’起的20bp与100,000bp之间发现的核苷酸序列至少70%的同一性;或(2)所述近端5’调节序列包含至少20个碱基的序列,后者具有与在自铁蛋白重链基因座翻译起始密码子5’起的1bp与10,000bp之间发现的核苷酸序列至少70%的同一性。
3.权利要求1-2中任一项的基因载体,其中所述远端5’侧翼序列来自铁蛋白重链基因座。
4.权利要求1-2中任一项的基因载体,其中所述近端5’调节序列来自铁蛋白重链基因座。
5.权利要求1-2中任一项的基因载体,其中所述近端5’调节序列及所述远端5’侧翼序列来自铁蛋白重链基因座。
6.权利要求1-5中任一项的基因载体,其中所述近端3’调节序列来自铁蛋白重链基因座。
7.权利要求1-6中任一项的基因载体,其还包含铁蛋白重链基因座的远端3’侧翼序列。
8.权利要求1及3-7中任一项的基因载体,其中异源序列的所述插入位点包含至少一个限制性核酸内切酶位点。
9.权利要求8的基因载体,其中异源序列的所述插入位点是包含至少两个限制性核酸内切酶位点的多接头位点。
10.权利要求1-9中任一项的基因载体,其中所述近端5’调节序列包含真核内含子序列。
11.权利要求10的基因载体,其中所述真核内含子序列来自铁蛋白重链基因的内含子1。
12.权利要求1-11中任一项的基因载体,其中所述近端5’调节序列包含未翻译的外显子序列。
13.权利要求1-12中任一项的基因载体,其中所述远端5’侧翼序列和所述近端5’调节序列的总长度在1,000到10,000个碱基之间。
14.权利要求1-12中任一项的基因载体,其中所述近端3’调节序列和任何远端3’侧翼序列的总长度在1,000到10,000个碱基之间。
15.真核细胞,其由权利要求1-14中任一项的载体转染。
16.权利要求15的真核细胞,其中所述载体已稳定地整合到该细胞的染色体中。
17.权利要求15-16中任一项所述真核细胞,其中所述第一编码序列在该细胞中表达。
18.真核细胞,其包含(a)真核基因座的远端5’侧翼序列;(b)真核基因座的近端5’调节序列;(c)至少一种第一编码序列;以及(d)近端3’调节序列,其对真核基因座的转录终止有效;其中所述序列以5’到3’的方向按(a)-(d)的顺序可操作地连接,并且相邻序列间有任选的接头序列;以及其中(1)所述远端5’侧翼序列包含至少100个碱基的外源序列,后者具有与在自铁蛋白重链基因座转录起始位点5’起的20bp与100,000bp之间发现的核苷酸序列至少70%的同一性;或(2)所述近端5’调节序列包含至少20个碱基的外源序列,后者具有与在自铁蛋白重链基因座翻译起始密码子5’起的1bp与10,000bp之间发现的核苷酸序列至少70%的同一性。
19.真核细胞,其包含来自铁蛋白重链基因座的外源性5’远端侧翼序列,其与编码序列可操作地连接。
20.在真核细胞中产生所需蛋白的方法,其包括(a)提供至少一种按权利要求15-19中任一项所述的细胞或其后代;(b)在允许高表达所述所需蛋白的条件下将所述细胞维持在培养基中;以及(c)从所述培养基分离该所需蛋白。
全文摘要
本发明公开了部分基于铁蛋白重链基因座的高表达基因座载体。这种载体包含来自铁蛋白重链基因座的远端5’侧翼序列和/或近端5’调节序列。这种载体包含异源序列、近端3’调节序列和远端3’侧翼序列的插入位点。近端3’调节序列和远端3’侧翼序列任选地来自铁蛋白重链基因座。本发明还公开了载体转化的细胞以及产生载体编码的异源蛋白质的方法。
文档编号C12N15/64GK1732258SQ200380107498
公开日2006年2月8日 申请日期2003年10月22日 优先权日2002年10月24日
发明者霍利·普伦蒂斯 申请人:比奥根艾迪克Ma公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1