蛋白质的生产和蛋白质的输送的制作方法

文档序号:578171阅读:470来源:国知局
专利名称:蛋白质的生产和蛋白质的输送的制作方法
近年已发展了使用治疗性蛋白质治疗疾病的方法,它包括体外生产供常规药物输送(例如静脉注射、皮下注射或肌内注射)的治疗用蛋白质,并且最近建立了基因治疗方法。
具治疗活性的蛋白质,一般是通过将编码治疗活性蛋白质的外源DNA导入适当细胞中而制备的。例如,将编码所需的治疗用蛋白质的外源DNA,在质粒之类的载体中导入像永久化细胞这样的细胞中,在其中被编码蛋白质得以表达。并且,已有人提出,外源细胞基因及其表达可以由基因击靶加以修饰,例如参见美国专利No.527071、WO91/06666、WO91/06667及WO90/11354。
目前可采纳的基因治疗方法是利用感染性载体,例如反转录病毒载体,它包括欲表达的遗传物质。该方法有局限性,例如在载体生产期间可能产生具复制能力的病毒治疗性病毒和内源反转录病毒基因组之间的重组,有可能产生具有新的细胞特异性、宿主范围或增加了毒性及细胞毒性的感染因子;独立整合到大量细胞中,增加了致瘤插入活动的危险;反转录病毒中有限的克隆能力(它限制了治疗适用性)以及有用产物的短寿命体内表达。一种较好的提供基因产物的方法,特别是一种能避免目前所用方法相关联的局限性和危险性的方法是有价值的。
本发明涉及治疗用蛋白质的体外生产及通过基因治疗产生和传送治疗用蛋白质的改进方法。在本方法中,所需的靶基因在细胞(即一种所需的内源细胞基因)中的表达,通过将至少包括调节序列、外显子及拼接供体位点的DNA,在予先选定的位点经同源重组导入细胞基因组中而加以改变。这些成分以这样一种方式导入染色体(基团组)DNA中,即要使之导致产生新的转录单位(其中存在于DNA构建体中的调节序列、外显子及拼接供体位点被可操作地连接到内源基因上)。由于这些成分引入染色体DNA中,其结果是改变了所需内源基因的表达。
正如本文中所用的,改变的基因表达包括激活(或者使之能表达)获得时在细胞中通常处于静止(不表达)状态的基因,提高获得时在细胞中不能以生理学上有意义的水平表达的基因的表达水平,改变调节或诱导特性,以使它与获得时在细胞中出现的不同,并且降低(包括消除)原获得时在细胞中表达的基因表达水平。
本发明还涉及适用于改变靶基因表达的方法中的DNA构建体。该DNA构建体包含(a)击靶序列;(b)调节序列;(c)外显子;和(d)未配对的拼接供体位点。DNA构建体中该击靶序列指导元件(a)~(d)整合进细胞内的靶基因中,以使元件(b)~(d)以可操作方式连接到内源靶基因序列上。在另一个实施方案中,该DNA构建体包含(a)击靶序列,(b)调节序列,(c)外显子,(d)拼接供体位点,(e)内含子,以及(f)拼接受体位点,其中击靶序列指导元件(a)~(f)的整合,以使元件(b)~(f)以可操作方式连接到内源基因上。击靶序列是与细胞染色体DNA(借助它而发生同源重组)中的予选择位点同源的。在该构建体中,外显子一般是调节序列的3′,而拼接供体位点是内显子的3′。
下述内容用于描述本发明的两个实施方案,其中将人促红细胞生成素(hEPO)基因的序列上游改变,以使hEPO能在初级、次级或永久化细胞中得以表达,而这些细胞在刚获得,处于未被转染状态时不能以可检测出的量表达EPO。在第一个实施方案中,击靶构建体含有两个击靶序列。第一个击靶序列同源于第二击靶序列的5′序列,而两序列是hEPO编码区域的上游。击靶构建体也含调节区域(mMT-1启动子)、外显子(人生长激素(hGH)外显子1)以及未配对的拼接供体位点。具有该击靶构建体的同源重组产物示于

图1中。
实施方案2中,击靶构建体也含有两个击靶序列。第一击靶序列与内源hEPO调节区域中的序列同源,而第二击靶序列与hEPO内显子1同源。击靶构建体也包含调节区域(mMT-1启动子)、外显子(hGH外显子1)和未配对的拼接供体位点。具有该击靶构建体的同源重组产物示于图2。
两实施方案中,击靶过程的产物是嵌合转录单位,该嵌合转录单位产生一种hGH基因的第一外显子定位于hEPO外显子2~5上游的成熟mRNA、转录、拼接和转译的产物是一种蛋白质,其中hEPO信号肽的氨基酸1~4被hGH的氨基酸残基1~3取代。这两个实施方案,在有关被插入的击靶构建体的调节序列的相对位置,和为产生最后的被加工的转录本所需出现的拼接特异性方式方面是不同的。
本发明还涉及借助同源重组,将上述构建体导入宿主细胞染色体DNA中而产生同源重组体细胞以于体外或体内生产蛋白质的方法。然后将该同源重组体细胞维持在能使其转录、转译和分泌的条件下,从而产生有用蛋白质。
本发明涉及用于生产蛋白质,特别是治疗性蛋白质的被转染细胞,例如被转染的初级或次级细胞(即非永久化细胞)和被转染的永久化细胞、制得这类细胞的方法、使用这类细胞于体外生产蛋白质的方法以及基因治疗的方法。本发明的细胞来源于脊椎动物,特别是哺乳动物,更具体地的是来源于人。由本发明的方法产生的细胞含有编码治疗产物的DNA、本身是治疗产物的DNA、和/或能引起被转染细胞高水平表达基因、或具有不同于相应未被转染细胞所出现的调节或诱导方式的DNA。
本发明还涉及借以使细胞,例如初级、次级和永久化细胞被转染以包含外源遗传物质的方法、产生克隆细胞株或异源细胞株的方法、以及使用被转染的初级、次级或永久化细胞免疫动物,或在被免疫动物体内产生抗体的方法。
本发明特别涉及在真核细胞中,例如真菌、植物或动物例如脊椎动物,特别是哺动物,更具体的是人来源的细胞中基因击靶或同源重组的方法。即涉及到通过同源重组,将DNA导入脊椎动物源的初级、次级或永久化细胞中的方法,这样该DNA被导入初级、次级或永久化细胞基因组DNA的予选择位点。所用的击靶序列可参照击靶DNA构建体中DNA准备插入的位点来选择。本发明还涉及到按本发明的方法生产的同源重组体初级、次级或永久化细胞,称之为同源重组体(HR)初级、次级或永久化细胞,以及HR初级、次级或永久化细胞的使用。
本发明的一个实施方案中,基因的表达被改变,基因被激活。即存在于脊椎动物源的初、次级或永久化细胞中的,获得时通常于原细胞中不被表达的基因被激活,结果编码蛋白质得以表达。该实施方案中,使用同源重组以取代、减损或破坏调节区域,该区域通常与通过插入能引起基因以高于相应未被转染细胞的水平表达的调节序列而获得的细胞基因有关。
在一个实施方案中,被激活的基因可进一步通过包括一个可扩增性可选择性标志基因的方法来加以扩增,该标志基因是有这样的性质,即含可选择标志基因的已扩增拷贝的细胞,可通过在适当的可选择因子存在下来培养细胞而被选择。已激活的内源基因以与可扩增性可选择标志基因以串联的方式被扩增。含被激活内源基因的许多拷贝的细胞可用于体外生产蛋白质和基因治疗。
正如本发明所述,基因击靶和扩增作用对激活形成转录单位的基因的表达是特别有用的,所说的转录单位足够大以致使其难以分离和表达,或者对于激活整个蛋白质编码区域不可利用或尚未被克隆的基因是特别有用的。
在另一个实施方案中,基因的表达比刚获得时在细胞中的表达得到提高,或者显示出不同于相应未被转染细胞情况下出现的调节或诱导特征。在又一实施方案中,基因的表达比刚获得时在细胞中的表达水平低(即减少或消除)。为转移到酵母或细菌中用于体外蛋白生产,本发明还描述了利用同源重组将基因转变成没有内显子的cDNA拷贝的方法。
本发明的被转染细胞在人和动物中有很多用途。在一个实施方案中,该细胞可植入人体或动物体内,借以在人体或动物体内输送蛋白质。例如,为治疗目的,可将hGH、hEPO,人促胰岛素及其它蛋白质全身或局部地输送到人体内。此外,也可生产产生生长激素、促细胞生成素、促胰岛素及其它非人来源蛋白质的被转染的非人细胞。
含表达治疗产物的被转染细胞的屏障装置(借助该装置治疗产物可自由渗透)可被用来于体内固定位置限制细胞,或保保护和从宿主免疫系统中分离细胞。屏障装置是很有用的,它能使被转染的永久化细胞、被转染的异种细胞或被转染的同种异体细胞被植入,以治疗人或动物的病症或应用于农业(例如产生长激素用于牛奶生产)。当因为某些原因使治疗方法受到阻止时,屏障装置由于能提供容易接近要除去的细胞而可以进行方便的短期(即暂时的)治疗。另外,被转染异种和同种异体细胞,可在没有屏障装置的情况下被用于短期基因治疗,这样由细胞产生的基因产物将在体内被输送,直至细胞被宿主的免疫体系排斥为止。
本发明的被转染细胞也可用于激发抗体产生,或免疫人和动物以对抗致病因子。植入的被转染细胞可用于输送能刺激宿主细胞和体液免疫反应的免疫抗原。这些免疫反应可设计来保护宿主以免受未来的感染因子感染(即免疫接件),以激发和提高针对不断发展的感染的抗病能力,或产生针对由可用于治疗和诊断目的的被转染细胞在体内产生的抗原的抗体。含该细胞的可除去的屏障装置可用作终止经受抗原的简单工具。此外,最终将被排斥的细胞(异种或同种异体被转染细胞)也可用于限制经受抗原,因为当细胞被排斥时,抗原的产生将停止。
本发明的方法可用来生产能产生广泛的各种各样治疗有用的产物的初级、次级或永久化细胞包括(但不只限于)激素、细胞激动素、抗原、抗体、酶、凝血因子、运输蛋白质、受体、调节蛋白质、结构蛋白质、转录因子、核糖酶(ribozymes)或反义RNA。此外,本发明的方法也可采用来生产能产生非天然出现的核糖酶(ribozy-mes)、蛋白质或核酸(它们被用于体外产生治疗产物或用于基因治疗)的细胞。
附图简要说明图1是表示转录激活hEPO基因方法的示意图;粗线小鼠金属硫因I启动子;竖条线方框hGH的5′未转译区;实心方框hGH外显子1;横条线方框hEPO内含子1的10bP拼接供体序列;交叉影线方框hEPO的5′未转译区;空心编号方框hEPO编码序列;划斜线方框hEPO 3′未转译序列;HIIIHindIII位点。
图2是表明转录激活hEPO基因方法的示意图;粗线小鼠金属硫因I启动子;竖条线方框hGH的5′未转译区;实心方框hGH外显子I;空心编号方框hEPO编码序列;划斜条纹方框hEPO 3′未转译序列;HIIIHindIII位点。
图3表示质粒pXGH5的示意图,该质粒包含处于小鼠金属硫因启动子控制下的hGH基因。
图4表示质粒pE3neoEPO的示意图。其中指出了人促红细胞生成素基因和新霉素磷酸转移酶基因(neo)及氨苄青霉素(amp)抗性基因的位置。箭头指示各基因的转录方向。pmMT1代表小鼠金属硫因启动子(驱动hEPO表达),pTK代表单纯疱疹病毒胸苷激酶启动子(驱动neo表达)。基因图中点区域表示来自人次黄嘌呤-鸟嘌呤磷酸核糖基转移酶(HPRT)所在地的序列的位置。其中标出了限制性核酸内切酶识别位点的相对位置。
图5表示质粒pcDNEO的示意图,该质粒包含插入到质粒pcD的BamHI位点中的来自质粒pSV2neo的neo编码区(BamHI-BglII片段)、来自pBR 322的Amp-R和pBR 322 Ori序列,以及polyA、16S拼接接合区和来自SV40的早期启动子区域。
图6表示质粒pREPO4示意图。
图7图示在0.02、0.05、0.1、0.2和0.4μM氨甲喋呤中经受逐步选择的中靶人细胞系内的促红细胞生成素表达。
图8表示质粒pREPO15的示意图。填充框表示来自基因组hEPO序列的片段。BamHI(3537)和BglII′/HindIII′间的区域相当于Genba-nK记入HUMERPALU中1~4008位上的序列。BglII′/HindIII′(11463)间的区域相当于Genbank记入HUMERPALU中4009~5169位上的DNA序列。HindIII(11463)与XhoI(624)间的区域含有相当于Genbank记入HUMEPA的7~624位的序列。空心框表示CMV启动子序列,其中含有来自Genbank序列HS5MIEP中核苷酸546~2105的序列。带箭头的空心框表示neo基因。划影线框表示驱动neo基因表达的胸苷激姆(tk)启动子。细线表示包括amp基因的pBSIISK+序列。
图9A列出限制性内切酶图,并图示消化内源性hEPO基因后观察到的产物(上方),以及与pREO15的击靶片段同源重组后激活的hEPO基因(下方)。
图9B列出对未处理(HF)和中靶(T1)人成纤维细胞克隆HF342~15进行限制性内切酶消化和Southern杂交分析的结果(参见实施例7) 。
图10表示质粒pREPO18的示意图。填充框代表得自基因组hEPO序列的片段。BamHI(3537)和ClaI(7554)间的区域相当于Genbank记入HUMERPALU中1~4008位上的序列。ATG(12246)和HindIII(13426)间的区域相当于Genbank记入HUMERPLAU中4009~5169位上的DNA序列。HindIII(13426)和XhoI(624)之间的区域含有相当于Genbank记入HUMERPA中7~624位的序列。CMV启动子序列以空心框表示,并且含有来自Genbank序列HS5MIEP中核苷酸546~2015的序列。二氢叶酸还原酶(dhfr)转录单位以带箭头的点框表示。neo基因以带箭头的空心框表示。驱动neo基因的tk启动子以划影线框表示。细线代表含amp基因的pBSIISK+序列。
图11图示本发明的用于激活和扩增无内含子基因,α干扰素基因的构建体,其中该构建体包含第一击靶序列(1)、可扩增标志基因(AM)、可选择标志基因(SM)、调节序列、CAP位点、拼接供体位点(SD)、内含子(细线)、拼接受体位点(SA)和第二击靶序列(2)。黑框代表编码DNA,且点框代表未转译序列。
图12图示本发明用于激活和扩增内源性基因的构建体,其中第一外显子促使信号肽、人GM-CSF基因,所述构建体包含第一击靶序列(1)、可扩增标志基因(AM)、可选择标志基因(SM)、调节序列、CAP位点、拼接供体位点(SD)和第二击靶序列(2)。黑方框代表编码DNA而点方框代表未转译序列。
图13图示本发明用于激活和扩增内源性基因的构建体,其中第一外显子促使信号肽、人G-CSF基因,该构建体包含第一击靶序列(1)、可扩增的标志基因(AM)、可选择的标志基因(SM)、调节序列、CAP位点,拼接供体位点(SD)和第二击靶序列(2)。黑方框代表编码DNA而花点方框代表未转译序列。
图14图示本发明用于激活和扩增内源性基因的构建体,其中第一外显子是非编码,人FSHβ基因,该构建体包含第一击靶序列(1),可扩增标志基因(AM)、可选择标志基因(SM)、调节序列、CAP位点、拼接供体位点(SD)和第二击靶序列(2)。黑框代表编码DNA而点框代表未转译序列。
本发明是基于发现可通过同源重组在细胞基因组中预选位点插入DNA的构建体来改变细胞中有用内源性基因的调节作用或其活性,所述构建体包含(a)击靶序列;(b)调节序列;(c)外显子和(d)非配对拼接供体位点,其中击靶序列指导元件(a)~(d)的整合,以使元件成分(b)~(d)可操作地连接到内源性基因上。在另一实施例方案中,DNA构建体包含(a)击靶序列,(b)调节序列,(c)外显子,(d)拼接供体位点,(e)内含子,和(f)拼接受体位点,其中击靶序列指导元件(a)~(f)的整合,以使元件(b)~(f)可操作地连接到内源性基因的第一外显子上。可根据待插入DNA的位点而选择所使用的击靶序列。在两实施方案中,击靶过程用于产生新的转录单位,它是一种由击靶DNA构建体和内源性细胞基因导入的序列的融合产物。如本文中所讨论的,例如可通过向宿主细胞的基因组DNA中导入本发明的构建体以形成新的转录单位,从而使转录静止基因(即在转染之前不能在细胞内表达基因)在宿主细胞中被激活。也如本文所讨论的,可通过使用本发明的方法和DNA构建体来改变在细胞内表达的内源性基因的表达,其中可以是表达水平的提高、降低包括消除,或者可改变调节或诱导特征。
如上文提到的,本发明涉及以真核来源细胞,如真菌、植物或动物,如脊椎动物,特别是哺乳动物,更具体地是人来源的细胞内的基因或DNA击靶的方法。就是说,本发明涉及通过DNA的同源重组或击靶将DNA导入脊椎动物来源的细胞如初级、次级或永久化细胞内的方法,其中所说的DNA在预选定的位点导入细胞的基因组DNA中。更具体地说,本发明涉及同源重组,其中通过使用包含击靶序列、调节序列、外显子和拼接供体位点的DNA构建体来修饰内源基因的转录和/或转译产物。本发明还涉及按本方法产生的同源重组体细胞以及同源重组体细胞的应用。
本发明也涉及激活存在于脊椎动物来源的初级细胞、次级细胞或永久化细胞内,但通常不在这些细胞中表达的基因的方法。使用同源重组或击靶以将DNA导入细胞的基因组序列中,致使基因在受体细胞内得以表达。在另一实施方案中,通过导入DNA构建体,提高基因在细胞中基因的表达水平或改变基因的调节或诱导特征。结果使被编码的产物以比在相应非转染细胞中更高的水平被表达。本发明方法和DNA构建体还可用于产生这样的细胞,即其中所需产物在被转染细胞内的表达比在相应未被转染细胞内的表达水平低。就是说,在被转染细胞内比所得到的原细胞内产生更少的蛋白质(包括非蛋白质)。
在另一实施方案中,编码所需产物的正常静止基因在被转染的初级、次级或永久化细胞内被激活并扩增。该实施方案是一种通过与基因组DNA同源重组而导入通常没有在功能上与内源性基因连接的DNA序列的方法,其中(1)当该DNA序列在内源基因处或附近被插入宿主基因组中时,即可用以改变(如激活)内源基因的表达,并且(2)得以选择那些其中激活的内源基因被扩增的细胞。另外,在所得原细胞中通常表达的基因的表达水平得以提高并且基因也被扩增。
下文描述本发明的DNA构建体,用这些DNA构建体产生被转染细胞的方法、转染细胞以及这些细胞的应用。
DNA构建体本发明的DNA构建体至少包括下列成分击靶序列、调节序列、外显子和未配对拼接供体位点。在该构建体中,外显子在调节序列的3′侧,而未配对拼接供体位点在外显子的3′侧。另外,在侧接有未配对拼接供体位点的外显子前面(5′方向)可以有多个外显子和/或内含子。如本文所讨论的,通常有附加的构建体成分,如可选择标志或可扩增标志。
构建体中DNA可以被称为外源性的。本文所用的术语“外源性”被定义为借助本发明的方法,如借助本文限定的DNA构建体导入到细胞内的DNA。外源性DNA可以具有与存在于转染前细胞内的内源性DNA相同或不同的序列。
击靶序列击靶序列是允许合理同源重组到所选择的含有用基因的细胞的基因组中的DNA序列。击靶序列一般是与正常存在于所得原细胞的基因组中的DNA序列(如位于有用基因的转录起始位点上游、转染终止位点内或下游的编码或非编码DNA,或者通过原先的修饰而存在于基因组中的序列)同源(即与细胞DNA相同或有足够的相似,以使击靶序列和细胞DNA能够发生同源重组)的DNA序列。可参照将向其中插入DNA构建体的DNA的位点来选择所用的击靶序列。
可利用一个或多个击靶序列。例如,环形质粒或DNA片段优选使用单一击靶序列。线性质粒或DNA片段优选使用两个击靶序列。击靶序列可任意地在有用基因(如外显子和/或内含子的序列)之内、直接邻接到有用基因上(即在击靶序列和有用基因的编码区之间没有另外的核苷酸)、在有用基因的上游(如上游非编码区的序列或内源性启动子序列)、或在基因的上游并离开一定的距离(如内源性启动子的上游序列)。击靶序列可以包括那些目前已知的或已测定了序列的被击中基因的区域,和/或结构上没有确定但可使用限制性内切酶制出基因图并由本发领域技术人员确定的更上游区域。
如本文所教导的,可用基因击靶方法将分离自不同基因的、由分离自不同细胞和/或病毒来源的成分组装的、或作为新的调节序列以基因工程方法合成的调节序列插入到内源细胞基因内、与之直接相邻处、上游或与之有相当距离的位点中。另外,可通过击靶来取代、除去、加入或修饰可影响所产生的RNA或蛋白质的结构或稳定性的序列。例如,可修饰RNA分子的RNA稳定性元件、拼接位点和/或前导序列,以改善或改变RNA分子的功能、稳定性和/或转译能力。也可以改变蛋白质序列如信号序列、原肽序列、活性位点和/或结构序列以改善或修饰蛋白质的运输、分泌或功能特性。根据该方法,导入外源DNA可导致基因的正常表达性质和/或蛋白质或RNA的结构特性的改变。
调节序列DNA构建体的调节序列可由一个或多个启动子(如构成的或可诱导的启动子)、增强子、骨架连接区或基质连接位点、负调节元件、转录因子结合位点或所述序列的结合物。
调节序列可包含可诱导的启动子,这样原产生时可被导入个体内时的细胞并不表达产物即可被诱导以表达(即在被转染细胞产生后但植入之前或在植入之后被诱导表达)。当然,可以按导入时进行表达的方式(例如,在构成的启动子条件下)将编码所需产物的DNA导入细胞内。可从细胞或病毒基因组中分离调节序列,这样的调节序列包括调节SV40早期或晚期基因、腺病毒大晚期基因、小鼠金属硫因-I基因、延长因子-1α基因、细胞巨大病毒基因、胶原蛋白基因、肌动蛋白基因、免疫球蛋白基因或HGM-CoA还原酶基因表达的序列。调节序列较好的含有转录因子结合位点,如TATA盒、CCAAT盒、AP1、SP1或NF-KB结合位点。
附加的DNA构建体元件DNA构建体还包含一个或多个外显子。本文中将外显子定义为被拷贝成RNA并以成熟mRNA分子存在的DNA序列。外显子可任选地含有编码一个或多个氨基酸和/或部分地编码某种氨基酸(即密码子的一个或两个碱基)的DNA。另外,外显子还含有相当于5′非编码区的DNA。如外源性外显子编码一个或多个氨基酸和/或某氨基酸的一部分,设计DNA构建体以使在转录和拼接时使解读码与靶基因的第二个外显子或编码区为码内的。本文所用术语“码内的”是指当第一外显子和第二外显子的编码序列融合时,核苷酸就以并不改变由第二外显子衍生的mRNA部分的适当解读码的方式连接在一起。
如中靶基因的第一外显子含有用以启动转译的序列ATG,则构建体的外源性外显子优选地含有ATG,并且必要时还含有一个或多个核苷酸,从而使所得的包括中靶基因的第二个和继后外显子的mRNA编码区是在码内的。这种其中第一外显子含有ATG的靶基因的例子包括编码hEPO、hGH、人的粒细胞/巨噬细胞集落刺激因子(hGM-CSF)和人的粒细胞集落刺激因子(hG-CSF)的基因。
如靶基因编码促红细胞生成素,外源性外显子可衍生于任何基因,所述基因中外显子包含ATG起始密码子并编码蛋白质的一部分。外显子进一步终止在密码子的第一个核苷酸处。例子包括脱脂蛋白E基因(外显子1和2)、胎盘促乳激素基因(由hCS-A和hCS-B基因编码的)、促乳素基因、人生长激素变体基因(hGH-B)、人绒毛膜生长催乳激素-L基因(hCS-L)和粒细胞/巨噬细胞集落刺激因子基因(EM-CSF)。
拼接供体位点是指导一个外显子拼接到另一个外显子上的序列。通常,第一外显子位于第二外显子的5′侧,重叠并侧接第一外显子在其3′侧上第一外显子的拼接供体位点识别侧接在第二外显子5′侧上第二外显子的拼接受体位点。拼接供体位点具有以(A/C)AGGURAGU(其中R代表嘌呤核苷酸)为代表的特征性相符序列,要求第四和第五位上是GU(Jakson,I.J.,Nucleic Acids Research 193715-3798(1991)。拼接供体相符位点的前三个碱基为外显子的后三个碱基。拼接供体位点在功能上是由它们影响mRNA拼接途径内适当反应的能力来限定的。
本文中未配对拼接供体位点被定义为存在于击靶构建体中并且不与构建体中位于该未配对拼接供体位点3′侧的拼接受体位点相伴随的拼接供体位点。未配对拼接供体位点导致与内源拼接受体位点的拼接。
与拼接供体位点一样,序列中的拼接受体位点也是指导一个外显子与另一个外显子的拼接。基于在与拼接供体位点结合中发挥的作用,拼接机构使用拼接受体位点以除去内含子。拼接受体位点具有以YYYYYYYYYYNYAG代表的特征性序列,其中Y代表任何嘧啶碱基而N代表任何核苷酸(Jackon,I.J.,Nacleic Acids Research 193715-3798(1991))。
内含子定义为位于两个外显子之间的,并在mRNA分子形成过程中通过拼接从前体RNA分子除去的一个或多个核苷酸的序列。
调节序列是例如可操作地连接到ATG起始密码子上,它可启动转译。选择性地,CAP位点(与调节区相连并被调节区利用的特异性mRNA起始位点)可操作地连接到调节序列和ATG起始密码子上。另外,与调节序列相连并被调节序列利用的该CAP位点不包括在击靶构建体中,并且转录机构将限定一个新的CAP位点。对于大多数基因来说,CAP位点通常见于TATA盒3′侧约25个核苷酸处。在一实施方案中,拼接供体位点位于与ATG直接相邻处,例如当外源性外显子与靶基因的第二外显子是同在码内时,便不一定要求存在一个或多个核苷酸。编码一个或多个氨基酸或氨基酸部分的DNA与靶基因的编码序列在码内时,则它最好位于直接与其3′侧上的ATG相邻处。在这样一个实施方案中,拼接供体位点位于直接与其3′侧上的编码DNA相邻。
可操作地连接的或功能上安置的是指一种构型,其中外源性调节序列、外显子、拼接供体位点,和任选地存在的某序列及拼接受体位点被适当地击靶在与内源性基因相对应的位置上,从而使调节元件指导初级RNA转录物的产生,该转录物在CAP位点处开始(可任选地包括在击靶构建体中)并包括相当于击靶构建体之外显子和拼接供体位点的序列、位于内源性基因调节调节区(如存在的话)上游的DNA、内源性基因的调节区(如存在的话)、内源性其因的5′非转录区(如存在的话)、和内源性基因的外显子和内含子(如存在的话)。在可操作地连接的构型中,击靶构建体的拼接供体位点指导一个与侧接内源性基因的外显子之一的拼接受体位点相拼接的过程,从而能够从全拼接的成熟转录物产生所需的蛋白质。在一个实施方案中,拼接受体位点是内源性的,这样拼接过程是针对着内源性外显子,例如内源基因的内源性外显子。在另一个实施方案中,拼接受体位点被包括在击靶构建体中,这种拼接过程可除去由击靶构建体导入的内含子。
所用的编码DNA(如在击靶构建体的外显子1中)可任选地编码一个或多个氨基酸,和/或某氨基酸的一部分,它们是与内源蛋白质的编码DNA同样的。本文所用的编码DNA序列例如可相应于有用基因的第一外显子。另外该编码DNA可编码不同于有用蛋白质的第一外显子的一个或多个氨基酸或某氨基酸的一部分。当有用蛋白质的第一外显子的氨基酸对于该蛋白质的一种或多种活性不是很关键的情况下,这样一个实施方案是特别有意义的。例如,当构建与内源性hEPO基因形成融合体时,则可利用编码hGH的第一外显子的序列。在这个例子中,hGH外显子1与hEPO外显子2的融合导致有功能活性的杂合信号肽的形成。在相关的构建体中,可使用其中被编码的氨基酸并不阻碍杂合信号肽的功能的任何人或非人来源的外显子。在一相关实施方案中,也可使用该技术以纠正见于靶基因中的突变。
如所需产物是内源蛋白质和击靶构建体中编码序列的融合蛋白质时,按本方法掺入到细胞内的外源性编码DNA包括编码一个或多个外显子的DNA,或相当于被融合到内源靶基因产物上的转译或转录产物的cDNA序列。在该实施方案中,使用击靶方法制备嵌合或多功能蛋白质,它将来自两个或多个蛋白质的结构、酶促、或配基或受体结合性质组合到一个多肽中。例如,外源DNA可编码在靶蛋白质膜上定位的锚地肽或信号肽,以提供或改善细胞分泌、前导序列、酶促区域、跨膜优势区域、辅因子结合区域或其他功能性区域。正常情况下不分泌但可与信号蛋白质融合以提供分泌的蛋白质实例包括多巴脱羧酶、转录调节蛋白、α-半乳糖苷酶和骆氨酸羟化酶。
如靶基因的第一外显子相当于非编码区(例如促滤泡激素β(FSHβ)基因的第一外显子),则不必有或较好删除外源ATG。
可从天然来源得到,或使用基因工程技术或合成方法产生构建体的DNA。
靶基因和所得产物当转染到细胞如初级、次级或永久化细胞内之后,DNA构建体即可控制所需产物如蛋白质或RNA的活性或功能性部分的表达。产物例如可以是激素、细胞激活素、抗原、抗体、酶、凝血因子、运输蛋白质、受体、调节蛋白、结构蛋白、转录因子、反义RNA或核糖酶(ribozyme)。另外,产物也可以是自然界不存在的蛋白质或核酸(即融合体蛋白质或核酸)。
本文所述的方法可产生一种或多种治疗产品,如促红细胞生成素、降钙素、生长激素、胰岛素、促胰岛激素、类胰岛素生长因子、甲状旁腺激素、干扰素β和神经生长因子、FSHβ、TGF-β、肿瘤坏死因子、胰高血糖素、骨生长因子2、骨生长因子7、TSH-β、白介素1、白介素2、白介素3、白介素6、白介素11、白介素12、CSF-粒细胞、CSF-巨噬细胞、CSF一粒细胞/巨噬细胞、免疫球蛋白、催化抗体、蛋白激酶C、萄糖脑苷酯酶、过氧化物岐化酶、组织血纤维蛋白溶酶原激活剂、尿激酶、抗凝血酶III、DNAse、α-半乳糖苷酶、酪氨酸羟化酶、凝血因子V、凝血因子VII、凝血因子VIII、凝血因子IX、凝血因子X、凝血因子XIII、脱脂蛋白E或脱脂蛋白A-I、珠蛋白、低密度脂蛋白受体、IL-2受体、IL-2拮抗剂、α-1抗胰蛋白酶、免疫反应修饰剂和可溶性CD4。
可选择标志和扩增可使用一个或多个可选择的标志基因以利于鉴定击靶过程。这些标志可包括在击靶构建体中或出现在不同构建体上。可选择标志可分为两类阳性可选择的和阴性可选择的(换句话说,即进行阳性选择或阴性选择的标志)。在阳性选择中,表达阳性可选择标志的细胞能够用选择剂(如neo、黄嘌呤一鸟嘌呤磷酸核糖基转移酶(gpt)、dhfr、腺苷脱氨酶(ada)、嘌呤霉素(pac)、潮霉素(hyg)、编码氨甲酰磷酸合成酶的CAD、天冬氨酸转氨甲酰酶、和二氢乳清酶、谷氨酰胺合成酶(GS)、多药物抗性1(mdrl)和组氨酸D(his D)存活处理,从而可以选择出其中击靶构建体已整合到宿主细胞基因组内的细胞。在阴性选择中,在选择剂存在下表达阴性可选择标志的细胞被破坏。可使用一个或多个呈现阴性选择特性的标志基因以利于鉴定击靶过程,这样就使阴性可选择标志连接到外源DNA上,但所形成排布关系是使阴性可选择标志连接在击靶序列的侧翼,并从而与宿主细胞基因组中序列形成正确的同源重组不会导致阴性可选择标志的稳定整合(Mansour,S.L.et al.,Nature 336348-352(1988))。用于这一目的的标志包括单纯疱疹病毒胸苷激酶(TK)基因或细菌gpt基因。
可将各种可选择标志掺入到初级、次级或永久化细胞中。例如,可使用具有可选择表型如药物抗性、营养缺陷型、对细胞毒性剂的抗性或表面蛋白质的表达等可选择标志。可使用的可选择标志基因包括neo、gpt、dhfr、ada、pac、hyg、CAD、GS、mdr1和hhisD。所赋予的可选择表型使具有可能鉴定和分离受体细胞。
编码可选择标志的可扩增基因(如ada、GS、dhfe和多功能CAD基因)具有外加特征,该特征可使它们能够选择含有被插入到基因组内的可选择标志的已扩增拷贝的细胞。这一特征提供了一种显著增加期望扩增的相邻或相连基因的拷贝数的机制。也可使用显示改善了选择特性的这些序列的突变体及其它他可扩增序列。
DNA构建体中各构成部分的排列次序可以是不同的。当构建体是环形质粒时,所得结构中各元件的次序可以是击靶序列-质粒DNA(由用于选择和/或复制微生物或其他适当宿主中击靶质粒的序列构成)-可选择标志-调节序列-外显子-拼接供体位点。较好地是使用在击靶序列内切割一次或多次的限制性内切酶切割含有击靶序列和外源DNA元件的质粒,以在导入受体细胞前产生线性或带缺口的分子,从而使游离DNA末端增加如本文所述的预期同源重组过程的频率。另外,可用核酸外切酶处理游离DNA末端以产生悬垂单股DNA末端的突出的5′或3′,从而增加预期同源重组过程的频率。在该实施方案中,击靶序列和细胞靶之间的同源重组将产生两个侧接于包含在被导入质粒内的元件上的击靶序列的拷贝。
如构建体是线性的,该次序列如可以是第一击靶序列-可选择标志-调节序列-外显子-拼接供体位点-第二击靶序列;或者可以是第一击靶序列-调节序列-外显子-拼接供体位点-编码可选择标志的DNA-第二击靶序列。稳定地整合构建体的细胞将用选择剂存活处理;稳定转染的细胞的一个亚群将是同源重组体细胞。可用PCR、Southern杂交及表型筛选多种技术鉴定同源重组体细胞。
在另一实施方案中,构建体各部分的次序可以是第一击靶序列-可选择标志-调节序列-外显子-拼接供体位点-内含子-拼接受体位点-第二击靶序列。
或者,DNA构建体中各组成部分的次序列如可以是第一击靶序列-可选择标志1-调节序列-外显子-拼接供体位点-第二击靶序列-可选择标志2,或者可以是第一击靶序列-调节序列-外显子-拼接供体供点-可选择标志1-第二击靶序列-可选择标志2。在此实施方案中,可选择标志2表现有阴性选择的特征。就是说,可根据不在含有某种试剂(一般是药物或代谢物类似物)的适当培养基配制物中的生长来选择可选择标志2的基因产物,其中所述试剂可杀死表达可选择标志2的细胞。侧接可选择标志1的击靶序列与宿主细胞基因组中同源序列间的重组造成可选择标志1的定位整合,而可选择标志2则不被整合。这样的重组过程产生被可选择标志1稳定转染但不被可选择标志2稳定转染的细胞,并可根据在含有选择可选择标志1的选择剂及不选择可选择标志2的选择剂的培养基中的生长情况来选择这些细胞。
DNA构建体还可包括允许选择含有该标志的已扩增拷贝的细胞的阳性可选择标志。扩增这样一个标志导致侧接DNA序列的共扩增。在此实施方案中,构建体各组分的排列次序例如是第一击靶序列-可扩增的阳性可选择标志-第二可选择标志(可任选的)-调节序列-外显子-拼接供体位点-第二击靶DNA序列。
在此实施方案中,可通过包含可选择标志基因进一步扩增被激活的基因,所述标志基因具有能通过在有适当可选择制剂的培养基中培养细胞而选择含有可选择标志基因的已扩增拷贝的细胞的性质。被激活的内源基因将与已扩增的可选择标志基因相继被扩增。含有许多被激活内源基因的拷贝的细胞可产生很高量的所需蛋白质,并可用于体外蛋白质生产和基因治疗。
在任何实施方案中,可选择和可扩增标志基因均不必彼此直接相邻。
任选地DNA构建体可以含有允许在细菌或任何其它适当克隆/宿主系统中大量增殖质粒的细菌复制原点和细胞抗生素抗性标志或其它可选择标志。可使用包含编码可选择标志的DNA连同附加序列如启动子和拼接接合点一起的DNA构建体以赋予被转染的细胞以可选择表型(如图4中示意表示的质粒pCDNEO)。可使用本文所述方法将这样的DNA构建体连同击靶DNA序列共转染到初级或次级细胞内。
转染和同源重组根据本方法,将构建体作为单一DNA构建体或分离的DNA序列导入细胞如初级、次级或永久化细胞中,其中分离的DNA序列渐渐掺入到被转染细胞的染色体或核DNA中。
可以在单一DNA构建体或在分离的构建体上将含有击靶序列、调节序列、外显子、拼接供体位点和可选择标志基因的击靶DNA构建体导入细胞内。DNA构建体的总长度将根据组分(例前击靶序列、调节序列、外显子、可选择标志基因和基它元件)的数目和各组分的长度而定。整个构建体的长度一般为至少约200个核苷酸。另外,该DNA可作为线型、双股(在一个末端或两末端有或没有单股区)、单股或环状DNA而被导入。
然后将本发明公开的任何一种形式的构建体导入细胞内以得到被转染的细胞。在如本技术领域中已知的允许发生同源重组的条件下维持被转染的细胞(Capecchi,M.R.,Science 2441288-1292(1989)。当在足以转录DNA的条件下维持同源重组细胞时,被击靶构建体导入的调节区(如启动子)将激活转录过程。
可借助多种物理或化学方法将DNA构建体导入细胞内,这些方法包括电穿孔、微注射、微弹轰击、磷酸钙沉淀、以及脂质体、聚乙烯(polybrene-)或DEAE葡聚糖介导的转染。此外也可使用传染性载体如反转录病毒、疱疹病毒、腺病毒、腺病毒相关的腮腺炎和脊髓灰质炎病毒载体以导入DNA。
任选地也可以按两个或多个分离的DNA片段的形式将击靶DNA导入细胞内。在使用两个片段的情况下,一个片段的3′末端和另一个片段的5′末端共享DNA序列同源性(交叠),而一个片段携带第一击靶序列且另一个携带第二击靶序列。在导入细胞时,两片段可进行同源重组以形成单一片段,其中第一和第二击靶序列侧接两原始片段间的交叠区域。这样所得产物片段是适用于与细胞靶序列的同源重组。也可以使用两个以上的片段,设计要使这些片段能彼此进行同源重组,以最后形成适于按上述方法与细胞靶序列同源重组的产物。
同源重组体细胞击靶过程导致击靶构建体的调节序列的插入,使内源基因处于它们的控制下(例如通过在内源基因或调节区的上游插入启动子或增强子)。任选地,击靶过程可以同时造成内源调节元件的缺失,如组织特异性负调节元件的缺失。击靶过程可置换已有的元件,例如组织特异性增强子可被比天然元件有更宽或不同细胞类型特异性的增强子所取代,或者呈现出有不同于相应未转染细胞的调节或诱导特征。在此实施方案中,天然存在的序列被删除而加入了新的序列。另外,也可以是内源调节元件未被除去或置换,而是借助击靶过程如针对内源调节元件内外源序列的击靶过程使之破坏或失去活性。
在将DNA导入细胞后,在本领域已知的、适于在基因组DNA和被引入的DNA部分间发生同源重组的条件下维持细胞(Capecchi,M.R.,Science 2441288-1292(1989))。
基因组DNA与被导入的DNA间的同源重组产生同源性重组体细胞如真菌、植物或动物细胞,特别是初级、次级或永久化人或其它哺乳动物细胞,其中改变内源基因表达的序列被可操作地连接到编码某产物的内源基因上,产生具有不同于内源基因的表达和/或编码潜能的新的转录单位。具体地说,本发明包括含有调节序列和外显子的同源重组体细胞,所说的调节序列和外显子侧接有拼接供体位点,借助击靶DNA构建体在预定位点导入并被可操作地连接到内源基因的第二外显子上。任选地,也可以有多个可操作地连接到内源基因的任何外显子上的外源外显子(编码或非编码的)和内含子。在选择扩增编码可扩增标志和新的转录单位(如适当的话)的DNA的条件下培养所得到的同源重组体细胞。无论是否扩增,均可在本领域已知的适于蛋白质表达的条件下培养用该方法产生的细胞,从而在体外生产蛋白质,或者将细胞用于体内输送治疗性蛋白质(即基因治疗)。
本文所说的初级细胞包括存在于从脊椎动物组织源分离的细胞悬液(在将它们辅敷在即结合在组织培养基质如平皿或培养瓶之前)中的细胞、存在于得自组织的外植体中的细胞(这两种细胞都是用于第一次铺板的原型细胞)和从这些铺板细胞得到的细胞悬液。术语次级细胞或细胞株是指在培养中所有继后步骤的细胞。就是说,从培养基质中除去第一次铺板的初级细胞并重新铺板的(传代的),以及继后传代的所有细胞本文称为次级细胞。次级细胞是由已传代一次或多次的次级细胞构成的细胞株。一种由次级细胞构成的细胞株是1)已传代一次或多次;2)在培养物中呈现有限数目的平均种群倍增特性;3)表现有接触抑制的、锚地依赖性生长特性(锚地依赖性并不适用于在悬浮培养物中增值的细胞);以及4)非永化的。
永久化细胞是细胞系(与专为初级和次级细胞而定的“细胞株”这一定义相对的),其主要特征是它们在培养物中表现出显然无限的寿命。
为本主题方法而选用的细胞可分为四种类型或大类1)如原得到时那样并不制造或含有蛋白质或产物(如通常不被细胞表达的蛋白质或自然界通常没有的融合蛋白质)的细胞;2)制造或含有某蛋白质或产物的细胞,但其制造或含有量并不是所预期的量(如其量低于其所得到时的原细胞的生理上通常的低水平);3)如原得到时的原细胞的一生理上通常的低水平制造某蛋白质或产物的细胞,但其含量或产量将被提高或增大;以及4)可望改变其中编码某蛋白质的基因的调节或诱导特征的细胞。
可从各种组织得到用本方法转染的初级、次级和永久化细胞,并包括所有可在培养物中维持的细胞类型。例如,可用本方法转染的初级和次级细胞包括成纤维细胞、角质细胞、上皮细胞(如乳腺上皮细胞、小肠上皮细胞)、内皮细胞、胶质细胞、神经细胞、血液的形成成份(如淋巴细胞、骨髓细胞)、肌细胞和这些体细胞的前体细胞。如同源重组体细胞要用于基因治疗,初级细胞较好是从将接受被转染的初级或次级细胞的个体体内得到的。但初级细胞可以从同种的供体(受体以外的个体)得到。
也可以用本方法产生同源重组体永久化细胞并用于蛋白质生产或基因治疗。用于按本方法生产蛋白质或基因治疗的永久化人细胞系的实例包括但不只限于HT1080细胞(ATCC CCL 121)、HeLa细胞和HeLa细胞的衍生物(ATCC CCL 2、2.1和2.2)、MCF-7乳腺癌细胞(ATCC BTH 22)、K-562白血病细胞(ATCC CCL 243)、KB癌细胞(ATCC CCL 17)、2780AD卵巢癌细胞(Van der Blick,A.M.et al.,Cancer Res.,485927-5932(1988))、Raji细胞(ATCC CCL 86)、Jurkat细胞(ATCC TIB 152)、Namalwa细胞(ATCC CRL 1432)、HL-60细胞(ATCC CCL 240)、Daudi细胞(ATCC CCL 213)、RPMI 8226细胞(ATCC CCL 155)、V-937细胞(ATCC CRL 1593)、Bowes黑素瘤细胞(ATCC CRL 9607)、WI-38VA13亚系2R4细胞(ATCC CCL 75.1)和MO LT-4细胞(ATCC CRL1582),以及经融合人细胞和另一种类细胞所产生的异种杂交瘤细胞。可使用次级人成纤维细胞细胞株如WI-38(ATCC CCL 75)和MRC-5(ATCC CCL 171)。另外,可使用初级、次级和永久化人细胞,以及显示出体外基因扩增性质的其它种属的初级、次级或永久化细胞进行体外蛋白质生产或基因治疗。
将基因转变成cDNA拷贝的方法本发明还涉及使用同源重组将基因转变成cDNA拷贝(没有内含子的基因拷贝)的方法。可将cDNA拷贝转换到酵母或细菌中以进行体外蛋白质生产,或者将cDNA拷贝插入哺乳动物细胞中以进行体外或体内蛋白质生产。如果cDNA将被转移到微生物细胞内,可经同源重组导入两个含有击靶序列的DNA构建体,一个是编码治疗性蛋白质的人基因的上游构建体,一个是所说基因的下游构建体。例如,导入上游的序列包括与编码成熟的经加工的治疗性蛋白质的第一个氨基酸的DNA或其上游基因组DNA序列同源的DNA序列、反转录病毒长期重复(LTR)、编码在微生物细胞中用于选择的标志的序列、在微生物细胞中有功能的调节元件、以及具有拼接供体位点的编码启动微生物细胞分泌的前导肽的DNA。导入上游的序列是在编码成熟的经加工的治疗性蛋白质的第一氨基酸的基因组DNA附近和上游被导入的。导入下游的序列包括与编码成熟的经加工的蛋白质的最后一个氨基酸的DNA或其下游的基因组DNA序列同源的DNA序列、微生物的转录终止序列、能指导DNA在微生物细胞中复制的序列和反转录病毒LTR。导入下游的序列是在编码成熟的经加工的治疗性蛋白质的终止密码子的DNA相邻处和下游被导入的。在这两个DNA构建体被导入细胞内之后,在适合于被导入DNA与基因组DNA间发生同源重组的条件下维持所得细胞,从而产生同源重组体细胞。有时,DNA构建体之一或两者可编码用于含有DNA构建体的细胞的阳性或阴性选择的一个或多个标志,并且可在将其中之一或两种DNA构建体导入细胞后在本方法中增加一个选择步骤。另外,编码在微生物细胞内的选择标志的序列和能够指导DNA在微生物细胞中复制的序列可以是两者都存在于上游或下游击靶构建体中,或者可以是在微生物细胞内用于选择的标志存在于下游击靶构建体中而能够指导DNA在微生物细胞中复制的序列可以存在于上游击靶构建体中。然后在适于LTR指导的转录、编码治疗性蛋白质的基因的RNA产物的加工和反转录的条件下培养同源重组体细胞。反转录的产物是含有编码治疗性蛋白质的无内含子DNA拷贝的DNA构建体。它可操作地连接到含上述两个外源DNA构建体的DNA序列上的。然后将按本方法生产的无内含子DNA构建体导入微生物细胞中。在适于治疗性蛋白质的表达和分泌的条件下培养该微生物细胞。
体内蛋白质生产本发明的同源重组体细胞可作为同源重组体细胞系的群体、作为同源重组体初级次级细胞的群体、同源重组体克隆细胞株或细胞系、同源重组体异源细胞株或细胞系,以及作为其中含有前述四类同源重组体细胞之一的至少一种代表性细胞的细胞混合物使用。这样的细胞可用于治疗患有对治疗性产物传送起反应的异常或不期望状态的个体的传送系统,所说的治疗性产物是1)治疗性蛋白质(例如个体体内没有的、相对于个体的生理需要生产不足的、个体有缺陷的或无效地或不适当地利用的蛋白质;有新的功能如酶促或运输功能的蛋白质),或2)治疗性核酸(如抑制基因表达或具有固有酶促活性的RNA)。在本发明的提供治疗性蛋白质或核酸的方法中,给患有待治疗或预防的异常或不期望的病理状态的个体,以适当的途径使用足量的同源重组体初级细胞、克隆细胞株或异源细胞株,以在生理相关水平上表达或制备可得的该蛋白质或外源DNA。生理相关水平是接近体内正常产生的产物水平或导致异常或不期望的状态得以改善的产物水平。根据本文所述的本发明实施方案,待用于个体的同源重组体永久化细胞系可被转入一个或多个半透性屏障装置内。装置的渗透性质是要在植入动物体内后可阻止细胞离开装置,而治疗性产物能自由透过并可离开屏障装置而进入植入物周围的局部空间或进入全身循环。例如,可使hGH、hEPO、人促胰岛激素、hGH-CSF、hG-CSF、人α干扰素或人FSHβ在人体内全身传运而有助于治疗。
屏障装置是特别有用的,并可使要植入的同源重组体永久化细胞、来自其它种的同源重组体细胞(同源重组体外源细胞),或来自非组织相容性匹配供体的细胞(同源重组体同种异体细胞)用以治疗人或动物的病理状态,或在农业上应用(即用于肉和奶生产)。当由于任何原因而要停止治疗时,屏障装置可通过提供迅速地接近以除去细胞的途径而进行方便的短期(即短暂)治疗。
有许多合成的、半合成的或天然的滤膜都可用于这一目的,它们包括,但不限于,纤维素、醋酸纤维素、硝酸纤维素、聚砜、聚偏二氟乙烯、聚氯乙烯聚合物和聚氯乙烯衍生物的聚合物。利用屏障装置时,可使来自另一种属的初级、次级或永久化细胞也能用于人的基因治疗。
体外蛋白质生产根据本发明,来自人或非人种属的同源重组体细胞也可用于体外蛋白质生产。在本领域已知的、导致蛋白质表达的条件下维持细胞。为纯化所需的蛋白质,可使用已述方法将表达的蛋白质以细胞溶胞产物或细胞上清液中纯化。按照本方法制得的蛋白质包括治疗性蛋白质,它可用本领域已知的常规给药途径(如口服、静脉内、肌肉内、鼻内或皮下等途径)输送到人或非人动物体内。这些蛋白质包括hGH、hEPO和人促胰岛激素、hGM-CSF、hG-CSF、FSHβ或α干扰素。这些细胞可以是永久化、初级或次级细胞。在非人细胞有利于进行治疗性或商用非人蛋白的蛋白生产时,可以使用来自其它种属的细胞,例如使用得自鲑鱼的细胞以生产鲑鱼降钙素,使用得自猪的细胞以生产猪胰岛素,并使用牛细胞以生产牛生长激素。
在另一实施方案中,本发明描述了在被转染的初级、次级或永久化细胞中激活(即打开)和扩增编码所需产物的内源基因的方法。即本发明涉及经与基因组DNA同源重组而导入的方法,DNA序列通常不与内源基因功能连接,并且(1)当将其在内源基因上或其附近插入宿主基因组中时,用于改变(如激活)内源基因的表达,并还有(2)允许选择那些其中已激活的内源基因被扩增的细胞。用于本发明的可扩增DNA序列包括,但不限于,编码可选择标志二氢叶酸还原酶、腺苷脱氨酶的序列和CAD基因(编码三功能性蛋白质氨甲酰磷酸合酶、天冬氨酸转氨甲酰酶和二氢乳清酸酶)。也可使用这些序列和其它可扩增序列的改良的变体。根据本发明的方法,将编码可选择标志的可扩增DNA序列和改变内源基因表达的调节功能的DNA序列在细胞基因组的预选择位点以与基因组DNA同源的DNA序列相联系的方式导入初级、次级或永久化细胞内。该预选择的位点一般是在编码治疗性产物的基因之内或其上游,或在一影响所需基因功能的位点上。可作为单一DNA构建体,或作为物理上成为连接在被转染细胞的基因表达的分离的DNA序列,将改变内源基因表达的DNA序列、编码可选择标志的可扩增序列和与基因组DNA中预选择的位点同源的序列导入初级、次级或永久化细胞中。另外,可以线性、在其一个末端或两末端有或没有单股区域的双股DNA将DNA导入,或以环形DNA将DNA导入。在将外源DNA导入细胞后,在适合于基因组DNA和被导入的DNA的一部分之间发生同源重组的条件下维持该细胞。基因组DNA与被导入DNA之间的同源重组导致同源重组体初级、次级或永久化细胞,在这些细胞中改变内源基因表达的序列和编码可选择标志可扩增序列都被可操作地连接到编码治疗性产物的内源基因上。在选择编码可选择标志的扩增DNA的扩增条件下培养所得的同源组组体细胞,产生含有已扩增的可选择标志和已改变了其表达的共扩增的内源基因的细胞。可在适于治疗性蛋白质的表达的条件下培养以此方法产生的细胞,从而在体外产生治疗性蛋白质,或可将细胞用于体内传送治疗性蛋白质(即基因治疗)。
本发明还涉及将击靶DNA序列导入细胞的基因组DNA中的方法,其中构建体包含编码产物的外源DNA、击靶序列和可扩增的标志基因,这样在整合到细胞的基因组中之后,细胞含有已扩增的编码标志的DNA和共扩增的外源基因,其中这些细胞能够表达已共扩增的外源基因。
DNA构建体包括阳性可选择标志,它可用于选择含有该标志的已扩增拷贝的细胞。扩增这样一个标志导致侧接DNA序列的共扩增。在此实施方案中,构建体组成的次序例如可以是击靶序列-编码可扩增的阳性可选择标志的DNA-编码第二个可选择标志(如果有的话)的DNA-相当于在适当启动子控制下待表达的外源基因的或在只有其定位以激活内源基因的启动子的DNA序列-击靶DNA序列。
优点本发明的方法学、DNA构建体、细胞和所得蛋白质具有多方面的功能和超过基因击靶技术中目前所用方法的许多其它优点。通过在从直接相邻有用基因处(直接与正常基因的已转录区相融合)到内源基因的被转录区上游30kb或更上游处,或在内源基因的内含子内的不同位置定位外源调节序列,对于激活内源基因的能力在细胞内的基因表达方面是特别有利的。例如,它可用于将调节元件定位在通常静止或对基因有负调节功能的区域的上游或下游。在这样一个区域的上游或下游定位调节元件可消除这种通常抑制转录的主要负效果。另外,可使用本文所述的击靶构建体删除通常抑制转录或对基因的表达有另外的不利影响的DNA区域。
此外,因为已知启动子功能在很大程度上取决于局部环境,所以为了找出那些适于功能发挥的局部环境而可以摸索宽范围的定位。然而,因ATG起始密码子频繁地见于哺乳动物DNA中(大约每48个碱基对出现1个),所以在基因上游的任何位置不能简单地开始转录并产生在正确的ATG起始密码子之前含有长前导序列的转录物,因为在这样一个前导序列中频繁出现ATG密码子将妨碍正确基因产物的转译并使信息失效。因此,在含有调节区的击靶构建体内掺入外源外显子、拼接供体位点和可任选地,一种内含子及拼接受体位点,可允许通过鉴定对于调节区域来说最佳化的位点来达到基因的最佳表达,而不必受到需要避免在所产生的mRNA表现不适当的ATG起始密码子所施加的限制。这样就为定位构建体提供了显然更大的灵活性并使之有可能激活更宽范围的基因。本发明的DNA构建体例如在制造由重组体或外源序列及内源序列编码的融合体蛋白质的方法中也是有用的。
上文所述的基因击靶和扩增特别适用于改变形成转录单位的基因的表达(所说的转录单位足够地大以致使它们难以分离和表达),或适用于打开那些其中完整的蛋白质编码区不能得到或尚未被克隆的基因。因此,上述DNA构建体适用于以一定方式将外源调节元件可操作地连接到内源基因上,所说的方式在于可精确地限定转录单位,为外源调节元件和内源基因的相对定位提供灵活性,最终使之能够成为一个得到并调节治疗上有价值的基因表达的高度控制的系统。
对实施例的解释如本文所述,申请人已证明可将DNA导入细胞如初级、次级或永久化脊椎动物细胞中并可经同源重组整合到被转染细胞的基因组中。他们已进一步表明,外源DNA在同源重组体(HR)细胞中具有预期的功能,并且可基于由适当的靶DNA赋予的可检测表型来鉴定正确的靶细胞。
申请人描述用以击中人基因组中特定座位(HPRT座位)的质粒的构建,和基于药物抗性表型的选择(实施例1a)。该质粒被定名为pE3Neo,它在HPRT座位整合到细胞基因组中产生具有hprt-,6-TG抗性表型并且还有G418抗性的细胞。如上所述,通过证明,被导入已建立的细胞系内的DNA在HPRT基因的外显子3内的定位后,他们已表明在基因击靶中pE3Neo可在已建立的人成纤维细胞系中适当地发挥功能(实施例1b)。
另外,申请人证明可使用pE3Neo在初级和次级人皮肤成纤维细胞中进行基因击靶(实施例1c)。本申请进一步证明对DNA末端的修饰可提高DNA进入基因组DNA的命中率(实施例1c和1e)。申请人还描述了以基因击靶技术在预选的位点将基因插入细胞如初级、次级或永久化细胞的基因组中的方法(实施例1d)。
另外,本发明涉及使用被转染的细胞生产蛋白质的方法。该方法包括用编码治疗产物的外源DNA或用足以击向编码治疗产物的内源性基因的DNA而转染细胞,如初级细胞、次级细胞或永久化细胞。例如,实施例1g、1h、1j、1k、2、3、4和6-9描述了通过用将改变内源基因表达的DNA序列元件对选择的内源性基因击靶以生产蛋白质的方法。
申请人还描述了用于扩增已通过基因击靶激活的内源性细胞基因的DNA构建体和方法(实施例3、6、8和9)。
实施例1f~1h、2、4和6描述了本发明的实施方案,其中改变人EPO基因的上游正常调节序列,以允许在未被转染状态下不能以可检测的量表达EPO的初级或次级成纤维细胞株中表达hEPO。在一个实施方案中,击靶的产物保持了正常EPO蛋白质完正,但须处在小鼠金属硫因启动子的控制之下。实施例1i和1j证明可使用相似的击靶构建体以激活初级或次级人成纤维细胞中的内源性生长激素基因。在其它实施方案中描述了为激活人成纤维细胞中的EPO表达,击靶过程的产物是嵌合的转录单位,其中人生长激素基因的第一个外显子被定位在EPO外显子2~5的上游。转录(受小鼠金属硫因启动子控制的)、拼接和转译的产物是蛋白质,其中hEPO信号肽的氨基酸1~4被hGH的氨基酸残基1-3取代。该蛋白质的嵌合部分、信号肽在从细胞中分泌之前被除去。实施例5描述了用以生产将基因(有内含子)转化成该基因的可表达cDNA拷贝(无内含子),以及在微生物(如酵母或细菌)细胞中回收这些可表达cDNA分子的击靶构建体和方法。实施例6描述了对其中的hhfr基因已被扩增的细胞进行双重选择和选择的,定名为pREPO4的击靶载体的构建。质粒pREPO4已被用于在通过同源重组激活内源性hEPO基因后在HT 1080细胞(一种永久化人细胞系)中扩增人EPO(hEPO)座位。如前所述,在含氨甲喋呤培养基中分步选择可使对0.4μM氨甲喋呤有抗性的细胞中的hEPO生产量增加70倍。
实施例7和8描述了在正常EPO启动子的上游插入调节序列的方法及使用这样的构建体生产EPO的方法。另外,实施例8描述了扩增按实施例7的方法生产的靶EPO基因的方法。实施例9描述了击靶人α干扰素、GM-CSF、G-CSF和FSHβ基因以产生用于蛋白质生产的细胞的方法。
实施例提供了通过基因击靶以激活或激活并扩增内源基因的方法,其中不需要操作或另外使用靶基因的蛋白质编码区。使用本文教导的方法和DNA构建体或质粒或其对本领域普通技术人员来说显而易见的修饰形式,可以改变期望具有体外蛋白质生产的特性(如生产药物),或具有适于体内蛋白质传送方法(如基因治疗)的特征的细胞中的基因表达。图5和6图解说明转录上激活hEPO基因的两种方案。
使用本文公开的方法和DNA构建体或质粒或其对于本领域普通技术人员来说显而易见的修饰形式,可在预选定的位点将编码治疗性产物(如蛋白质、核糖酶、反义RNA)的外源DNA插入脊椎动物(如人和非人哺乳动物)初级或次级细胞的基因细胞中。
现将借助下列实施例说明本发明,但这些实施例并不以任何方式限制本发明。
实施例实施例1通过基因击靶生产被转染的细胞株当通过同源重组将转染DNA整合到或部分置换染色体DNA序列时发生基因击靶。虽然这种情况可能发生在任何特定转染实验的过程中,但它们通常被过多的由非同源的或不合理的重组过程所引起的质粒DNA整合所掩饰。
a.用于选择人细胞中基因击靶的构建体的产生选择击靶后果的一种方法是通过遗传选择由于转染DNA的整合所导致的基因功能丧失。人HPRT座位编码次黄嘌呤-磷酸核糖基转移酶。可根据在含有核苷类似物6-硫基鸟嘌呤(6-TG)的培养基中生长情况选择hprt-细胞带有野生型(HPRT+)等位基因的细胞被6-TG杀死,而带有突变体(hprt-)等位基因的细胞可以存活。因此可在6-TG培养基中选择包藏破坏HPRT基因功能的靶目标的细胞。
为了构建击中HPRT座位的质粒,将HPRT序列(Genedank名称HUMHPRTB;Edwards,A.et al.,Genomics 6593-608(1990))中从位置11,960~18,869延伸的并包括HPRT基因的外显子2和3的6.9 kbHindIII片段亚克隆到pUC12的HindIII位点中。在HPRT基因片段的外显子3中的唯一XhoI位点上切割所得克隆并插入含有来自pMClNeo(Stratagene)的neo基因的1.1 kb SalI-XhoI片段,破坏外显子3的编码序列。选择一个具有与HPRT转录相反的neo转录方向的定向者并命名为pE3Neo。用neo破坏的变体取代正常HPRT外显子3将产生hprt-,6-TG抗性表型。这样的细胞也将是G418抗性的。
b.在已建立的人成纤维细胞系中的基因击靶作为在永久化细胞系中击靶的证据,并确定在基因击靶中pE3Neo适当发挥功能,通过电穿孔法用pE3Neo转染人纤维肉瘤细胞系HT 1080(ATCC CCL 121)。
在电穿孔前将HT 1080细胞维持在添加有HAT(次黄嘌呤/氨基蝶呤/黄嘌呤)的含15%小牛血清DMEM(Hyclone)中。电穿孔前两天将细胞转移到无氨基蝶呤的同一培养基中。用胰酶消化指数生长细胞并在DMEM/15%小牛血清中稀释,离心,并以每毫升13.3×106细胞的细胞终体积重新悬浮在PBS(磷酸缓冲盐水)中。用HindIII消化pENeo,将8 kb HPRT-neo片段与PUC 12主链分离,经苯酚提取的乙醇沉淀进行纯化,并以600μg/ml的浓度重新悬浮。取50 ml(30μg)连同750μl细胞悬液(10×106细胞)加到电穿孔小池(0.4cm电极间距,Bio-Rad Laboratories)内。电穿孔条件为450伏,250微法(Bio-Rad Gene Pulser;Bio-Rad Laboratories)。将小池内容物立即加到含15%小牛血清的DMEM中得到每25ml培养基含1×106细胞的细胞悬液。将25ml经处理的细胞悬液铺敷在150mm直径组织培养皿中并在37℃含5%CO2环境中保温。24小时后,将G418溶液直接加到平皿上,得到终浓度为800μg/ml的G418。5天后,用DMEM/15%小牛血清/800μg/ml G418替换培养基。电穿孔后9天,用DMEM/15%小牛血清/800μg/ml G418和10μm 6-硫基鸟嘌呤替换培养基。开始双重选择后14~16天使用克隆圆柱采集对G418和6-TG有抗性的集落。
在HT 1080细胞中进行的5次有代表性击靶实验的结果示于表1中。
表1转染处理细胞的数目G418r和6-TGr克隆的数目1 1×107322 1×107283 1×107244 1×107325 1×10766
对于转染实验5,设计以确定G418r集落的总得率的对照平皿表明可从最初1×107个被处理的细胞产生33,700个G418r集落。因此,被击中者对未被击中者的比例为66/37,700或1∶510。将5次实验合并计算,发生击中者的频率为3.6×106,或占被处理细胞的0.00036%。
限制性酶和使用衍生于neo和HPRT基因的探针进行的Southern杂交实验将neo基因定位到HPRT外显子内,予定位点的HPRT座位。
c.在初级和次级人皮肤成纤维细胞内基因击靶用HindIII消化pE3Neo,从pUC12主链中分离8 kb HPRT-neo片段,并经苯酚提取和乙醇沉淀纯化。以2mg/ml的浓度重新悬浮DNA。用100μg HindIII pE3Neo(50μl),在250伏和960微法条件下对体积为0.5ml的3×106个次级人包皮成纤维细胞进行电穿孔。对总共9×106个被处理的细胞进行三次分开的转染。加工处理并选择G418抗性细胞。每150mm培养皿中铺敷500,000个细胞进行G418选择。选择下培养10天后,将培养基换成含有400μg/ml G418和10μM 6-TG的人成纤维细胞营养培养基。结合使用两种药物再继续选择10天。显微镜下检查平皿,以定位对两种药物均有抗性的人成纤维细胞集落。G418rt-TGr集落部分为每9×106个处理的细胞有4个集落。这些集落占所有能形成集落的细胞的0.0001%(或者百万分之一)。设计确定G418r集落的总产率的对照平皿表明可从初始9×106个处理的细胞产生2,850个G418r集落。因此,中靶的对未中靶的比例为4/2,850或1比712。用限制性酶和衍生于neo及HPRT基因的探针进行Southern杂交实验,确定neo基因定位到HPRT外显子3内预定的位点的HPRT座位,并证明击靶发生在这四个克隆细胞株中。也已通过转染初级细胞(1/3.0×107)分离对两种药物有抗性的集落。
这些pE3Neo击靶实验的结果综述于表2中。直接转染或用核酸外切酶III处理HindIII消化的pE3Neo以在转染前产生5′单股突出部分(见实施例1c)。试验带有长度从175到930碱基对的单股区域的DNA制剂。使用只经HindIII消化的pE3neo,通过限制性切酶和Sou-thern杂交分析法根据具有在HPRT座位上中靶插入的neo基因而鉴定出1/799 G418抗性集落(共分离到24个中靶克隆)。当使用175 bp突出部分时击靶受到最大程度的刺激(约10倍刺激),1/80的G418r集落显示出对于在HPRT处击靶有探查作用的限制性片段(共分离出9个中靶克隆)。因此,使用本文所述的条件和重组DNA构建体,很容易地观察到在正常人成纤维细胞中的击靶,并且通过用含单股突出尾部的击靶,按实施例1e中所述方法转染,能刺激总的击靶频率(中靶克隆数除以被稳定地转染为G418抗性的克隆的总数)。
表2在人成纤维细胞中对HPRT座位击靶PE3neo处理实验数目 每个G418r克隆的中靶数 中靶克隆总数HindIII消化 6 1/79924175 bp突出部分 1 1/80 9350 bp突出部分 3 1/11720930 bp突出部分 1 1/1441d.用于将治疗有用的基因靶向插入人基因组内的构建体的产生和其在基因击靶中的应用可使用其中在相邻或接近于neo基因处将治疗有用的基因插入HPRT编码区中的pE3Neo的变异体,以将治疗有用的基因定点导向受体初级或次级细胞基因组中的特定位置。可以构建这种将hGH基因击向HPRT座位的pE3Neo的变异体。
用EcoRT消化pXGH5(图示于图3中),并分离含有hGH基因并连接小鼠金属硫因(mMT)启动子的4.1 kb片段。用来自大肠杆菌DNA聚合酶的Klenow片段填充EcoRI突出部分。单独地用在neo片段和HPRT外显子3的接合处(插入外显子3中的3′接合处)进行切割的XhoI消化pE3Neo。用来自大肠杆菌DNA聚合酶的Klenow片段充填线性化质粒的XhoI突出末端,并将所得片段连接到4.1 kb平头末端hGH-mMT片段上。用限制性酶分析hGH-mMT片段上的单一拷贝插入,以筛选从连接反应混合物衍生的细菌集落,选择出hGH基因转录与neo基因方向相同的定位并定名为pE3Neo/hGH。用HindIII消化pE3Neo/hGH,释放出含有HPRT、neo和mMt-hGH序列的12.1 kb片段。按实施例1c中所述处理经消化的DNA并转染到初级或次级人成纤维细胞中。按实施例1c中所述方法选择G418rTGr集落并分析mMT-hGH和neo序列在HPRT基因中的定靶插入。使用商品免疫检测药盒(Nichols Instit-ute)分析单个集落的hGH表达。
用pE3Neo/hGH转染次级人成纤维细胞,分析巯基鸟嘌呤抗性集落的稳定hGH表达,并对其进行限制性酶和Southern杂交分析。在所分析的13个TGr集落中,鉴定出8个有hGH基因插入到内源性HPRT座位中的集落。所有8个菌株均稳定地表达了显著量的hGH,平均表达水平为22.7μg/106细胞/24小时。另外,也可将图4所示的质粒pE3neo EPO用于将EPO基因定靶导向人HPRT座位。
使用同源重组将治疗上有用的基因定靶导向细胞基因组DNA中的特定位置,这一技术可以扩大并使之更适用于通过插入基因的生产治疗目的的产品(如药物、基因治疗),通过向细胞内插入基因使细胞暴露于适当的药物选择环境条件下而选择含有已扩增的该基因拷贝的细胞。例如,可在直接相邻于pE3neo/hGH中hGH或neo基因的位置插入dhfr、ada或CAD基因,从而修饰pE3neo/hGH(实施例1d)。可用这样一个质粒转染初级、次级或永久化细胞并鉴定正确的定靶插入结果。进一步用渐增浓度的适于选择含扩增基因的细胞的药物处理这些细胞(对dhfr的选择剂是氨甲喋呤,对CAD的选择剂是N-(磷酸乙酰基)-L-天冬氨酸(PALA)、对ada的选择剂是腺嘌呤核苷(如硝基羟基丙氨酸))。治疗上有用的基因的整合将连同其扩增的拷贝得以被选择的基因一起以这种方式被共扩增。因此,可以很容易地通过预选择特定位点来控制细胞的遗传工程,以生产治疗用的基因,其中击靶构建体在所说的位点整合到细胞基因组中并且扩增的拷贝在该位点处保存在已扩增的细胞内。
e.修饰DNA末端以提高击靶效率有几方面的证据表明3′突出的末端参予大肠杆菌、噬菌体、啤酒酵母和爪蟾的某些同源重组途径。在爪蟾卵细胞中,带有长度达几百个碱基对的3′突出末端的分子在微量注射后要比带有经限制酶消化后产生的很短突出末端(4 bp)的分子更为迅速地与相似处理过的分子发生重组。在酵母中,长度达几百个碱基对的3′突出末端的产生似乎是减数分裂重组中的限速步骤。尚未见报导在人细胞的重组中有3′突出末端参与的证据,并且没有表示有任何类型的已被修饰的DNA底物可在任何种属中促进击靶(同源重组的一种形式)的情况。下列实施例和实施例1c中描述的实验提示,5′突出的末端对于刺激初级、次级和永久化人成纤维细胞中的击靶是有效的。
还没有关于通过修饰转染DNA分子的末端提高击靶效率的报导。本实施例旨在说明通过将双股形式的分子的末端转变为单股形式而对线性DNA分子的末端进行修饰,可刺激向初级和次级人成纤维细胞内基因组的击靶插入。
用HindIII消化1100μg质粒pE3Neo(实施例1a)。可在苯酚提取和乙醇沉淀后直接使用该DNA,或者可用凝胶电泳法从pUC12载体序列中分离出只含有HPRT和neo基因的8 kb HindIII片段。用ExoIII消化已用HindIII消化过的DNA,导致在起始于各游离3′末端的广泛的核酸外切水解消化并产生5′突出的末端。因此可通过改变ExoIII消化的时间来控制核酸外切消化作用的程度和所得5′突出端的长度。按照供应商推荐的条件用ExoIII将100μg业经HindIII消化的pE3Neo消化30秒钟、1分钟、1.5分钟、2分钟、2.5分钟、3分钟、3.5分钟、4分钟、4.5分钟和5分钟。为了监测消化的程度,在供应商推荐的条件下,用绿豆(mung bean)核酸酶(Promega)处理各时间点上含1μg ExoIII处理的DNA的等分样品,并经凝胶电泳分离样品。检测未处理的、HindIII消化的pE3Neo和用ExoIII与绿豆核酸酶处理的同样分子间在大小上的差异。这一大小差值除以2得到分子各末端5′突出部分的平均长度。在上述时间点,并于30℃消化,所产生的5′突出部分长度范围应为100至1,000碱基。
纯化各时间点上得到的60μg ExoIII处理的DNA(pE3Neo的总HindIII消化产物),并在实施例1c所述条件下将其电穿孔到初级、次级和永久化人成纤维细胞中。计算G418r6-TGr集落的数并将这些数目与未用ExoIII处理的HindIII消化的pE3Neo进行的击靶相比较,从而定量分析各ExoIII处理的制剂提高的击靶程度。
也可使用类似系统定量3′突出末端的效果。在这种情况下,在供应商推荐的条件下,用噬菌体T7基因6核酸外切酶(Vuited Stat-es Biochemicals)以不同时间间隔处理HindIII消化的pE3Neo。消化程序(每个末端产生的3′突出部分的平均长度)的确定和电穿孔条件与上述ExoIII处理的DNA相同。计算G418r6-TGr集落的数目并与那些未经T7基因6核酸外切酶处理的HindIII消化的pE3Neo击靶的集落数目相比较,以定量由各T7基因6核酸外切酶处理的制剂提高的发生击靶的程度。
产生5′和3′突出末端的其它方法是可行的,例如,两个彼此部分交叠的线性分子变性并退火将产生分子的混合物,各分子在两末端有3′突出部分或在两末端有5′突出部分,以及不能与起始线性分子区分的再退火的片段。根据两DNA片段间非共用的DNA的长度确定突出部分的长度。
f.用于将处在小鼠金属硫因启动子控制下的人促红细胞生成素基因放入初级、次级和永久化人成纤维细胞中的击靶质粒的构建下述实施例用以说明本发明的一个实施方案,其中人促红细胞生成素(hEPO)基因上游的正常阳性和阴性调节序列被改变,以允许在原来不以显著量表达hEPO的初级、次级或永久化人成纤维细胞中表达人促红细胞生成素。
可用PCR方法扩增单独地位于人EPO编码区上游的区域。在分析已公开的人EPO序列[Genbank命名HUMERPA;Lin,F-K,et al.,Proc.Natl.Acad.Sci.,USA 827580-7584(1985)]后设计三组用于这一目的的引物。这些引物对能够扩增609、603或509 bp的片段。
表3HUMERPA引物位置序列 片段大小F1 2→20 5′AGCTTCTGGGCTTCCAGAC(SEQ ID NO 1)R2 610→595 5′GGGGTCCCTCAGCGAC 609 bp(SEQ ID NO 2)F2 8→24 5′TGGGCTTCCAGACCCAG(SEQ ID NO 3)R2 610→595 5′GGGGTCCCTCAGCGAC 603 bpF3 21→405′CCAGCTACTTTGCGGAACTC(SEQ ID NO 4)R2 610→595 5′GGGGTCCCTCAGCGAC 590 bp这三个片段基本上交叠并且为本目的可以相互改变。将从相对于转译起始位点的-623位延伸到-14位的609 bp片段(HUMERPA核苷酸位置2至610)在两末端用ClaI衔接物连接。用ClaI消化所得的ClaI连接的片段,并将其插入到pBluescriptII SK/+(Stratagene)的ClaI位点中,其方向是使HUMERPA核苷酸位置610与质粒多衔接物中的SalI位点相邻。可分别在人EPO上游片段中的特有FspI或SfiI位点(HUMERPA核苷酸位置分别是150和405)处切割该质粒p5′EPO,并将其连接到小鼠金属硫因启动子上。一般来自mMT-I基因的1.8kb EcoRI-BglII片段[不含mMT编码序列;Hamer,D.H.and WallingM.,J.Mol.Appl.Gen.1273-288(1982);也可使用由分析得自Genbank(即MUSMTI、MUSMTIP、MUSMTIPRM)的mMT序列所设计的PCR引物,按已知方法从小鼠基因组DNA中分离该片段]可用已知方法将其修成平头并与SfiI消化的(也修成平头)或FspI消化的p5′EPO相连接。分析所得克隆的方向并将其中前者mMT BglII位点靠近质粒多衔接物内SalI位点的那些用于击靶导入初级和次级人成纤维细胞中。该定向指导mMT向最终构建物中HUMERPA核苷酸位置610转录。所得到的用于将mMT插入FspI和SfiI位点的质粒分别称为p5′EPO-mMTF和p5′EPO-mMTS。
在希望修饰、删除和/或置换负调节元件或位于初始靶序列的上游的增强子的情况下,附加上游序列是有用的。在EPO的情况下,可以删除抑制EPO在肝外和肾外组织中表达的负调节元件(Semenza,G.L.et.al.,Mol.Cell.Biol.10930-938(1990))。制备6 kb片段内的一系列缺失序列。可用有宽的宿主细胞活性的增强子(如来自细胞巨大病毒(CMV)的增强子)置换缺失的区域。
因为HUMERPA序列是在其5′末端位于BamHI(远端)和HindIII(近端)位点的之后,从而可选择pBluescriptIISK/+载体中609bp 5′EPO片段的方向。因此,可用已知方法从基因组DNA中分离正常位于609 bp片段上游的6 bp BamHI-HindIII片段(Semenza,G.L.et.al.,Mol.Cell.Biol.10930-938(1990))。例如,可用609 bpPCR扩增的片段作为探针筛选噬菌体、柯氏质粒或酵母人工染色体文库。所需的克隆将具有一个6 kb BamHI-HindIII片段,并可通过将其限制性酶切图与用已知方法测定的人EPO基因周围的限制性酶切图比较可证实其同一性。另外,也可使用609 bp片段作为探针制作EPO基因的人基因组上游的限制性酶切图,以鉴定产生来源于HUMERPA等同物2和609之间并延伸过上游BamHI位点的片段的酶;可用凝胶电泳法从人基因组DNA的适当消化产物中分离该片段,并连接到细菌或酵母克隆载体中。正确的克隆将与609 bp 5′EPO探针杂交并含有一个6 kb BamHI-HindIII片段。将分离的6 kb片段在以适当方向插入p5′EPO、p5′EPO-mMTF或p5′EPO-mMTS中(这样HindIII位点相邻于HUMERPA核苷酸位置2)。可使用染色体行走技术等已知方法或分离与609 bp 5′EPO探针杂交的酵母人工染色体来分离附加的上游序列。
上述克隆方法将允许EPO的序列上游得以体外修饰,以进行继后对初级、次级或永久化人成纤维细胞的定靶转染。这些方法述及mMT启动子的简单插入,以及负调节区的缺失、以及负调节区的缺失和用具有广泛宿主细胞活性的增强子进行的置换。
g.激活人EPO基因和用筛选法分离靶初级、次级及永久化人成纤维细胞为了击靶,用从质粒主键中游离出插入段的限制性酶切割质粒。在切割p5′EPO-mMTS时,HindIII和SalI消化释放出2.4 kb的击靶片段,该片段包括通过将用于使该构建体靶向人EPO基因的调节区的DNA的405 bp和204碱基对分别连结到5′和3′侧的1.8 kb mMT启动子。用苯酚提取并用乙醇沉淀纯化该DNA或2.4 kb单一击靶片段并在实施例1c中所述条件下转染到初级或次级人成纤维细胞中。将转染的细胞铺敷在人成纤维细胞营养培养基的150mm平皿中。48小时后将细胞以10,000细胞/cm2的密度铺敷到24孔平皿中(每孔约20,000个细胞;如果击靶发生率为每106个可克隆细胞中有一个(实施例1c),则需要检测50个孔以分离出单一的表达集落)。其中转染DNA已击中人EPO基因的同源区域上游的细胞将在mMT启动子的控制下表达hEPO。10天后,使用市场上可得到的免疫试验药盒(Amgen)检测整个孔上清液中的EPO表达水平。使用已知方法分离出得自表现有hEPO合成的孔内的细胞克隆,一般通过检测分配到各孔或平皿中的异源细胞群体的各部分、检测这些阳性孔的各部分并在必要时重复进行,通过筛选以每孔1个细胞接种的96孔微滴定板而最后分离中靶集落。也可以使用结合位于HUMERPA核苷酸位置1上游的引物的mMT特异性引物通过PCR以扩增片段而分析得自整个平板溶胞产物的DNA。该引物对应能扩增基于该DNA序列精确预测了大小的DNA片段。用胰蛋白酶消化阳性平板并以相继减低的稀释度重新铺板,如需要分离中靶细胞重复进行DNA制备和PCR步骤。
也可使用本文所述的击靶方案激活永久化人细胞(如HT 1080细胞(ATCC CCL 121)、Hela细胞和HeLa细胞的衍生株(ATCC CCL 2、2.1和2.2)、MCF-7乳腺癌细胞(ATCC HBT 22)、K-562白血病细胞(ATCC CCL 232)、KB癌细胞(ATCC CCL 17)、2780 AD卵巢癌细胞(Van der Blick,A.M.etal.,Cancer Res.485927-5932(1988))、Raji细胞(ATCC CCL 86)、Jurkat细胞(ATCC TIB 152)、Namalwa细胞(ATCC CRL 1432)、HL-60细胞(ATCC CCL 240)、Daudi细胞(ATCCCCL 213)、RPMI 8226细胞(ATCC CCL 155)、U-937细胞(ATCC CRL1593)、Bowes黑素瘤细胞(ATCC CRL 9607)、MI-38VA13亚系2R4细胞(ATCC CLL 75.1)、MOLT-4细胞(ATCC CRL 1582)和各种异杂交瘤细胞)中的hGH表达以生产用于通常药物传送的hGH的目的。
h.激活人EPO基因并使用阳性或结合的阳性/阴性选择系统分离中靶的初级、次级和永久化人成纤维细胞构建p5′EPO-mMTF、p5′EPO-mMTS以及它们的带有附加上游6 kbBamHI-HindIII片段的衍生物的策略可接着进行在相邻mMT启动子处插入neo基因这一附加步骤。另外,可在pBluescriptIISK/+多接头中HUMERPA序列相邻处插入一个阴性选择标志如gpt(来自pMSG(Pharmacia)或其它适当来源)。在前一种情况下,经PCR扩增或限制性酶与Southern杂交分析从集落收集物中制得的DNA来分离并筛选G418r集落,以鉴定中靶集落。在后一种情况下,将G418r集落铺敷在含6-巯基黄嘌呤的培养基中以对照选择gpt基因的整合(Besna-rd,C.et al.,Mol.Cell.Biol.74139-4141(1987))。另外,可将HSV-TK基因放在插入段如gpt的相反侧面,以允许通过在含有400μg/ml G418、100μM 6-巯基黄嘌呤和25μg/ml gancyclovir的人成纤维细胞营养培养基中培养细胞来选择neo并阻止gpt和TK。双重阴性选择将对真实中靶后果提供几乎绝对地选择,并且Southern印迹分析将提供最后的证实。
为生产适于常规药物传送的hEPO,也可使用本文所述的击靶方案以激活在永久化人细胞(如HT 1080细胞(ATCC CCL 121)、Hela细胞和HeLa细胞的衍生株(ATCC CCL 2、2.1和2.2)、MCF-7乳腺癌细胞(ATCC HBT 22)、K-562白血病细胞(ATCC CCL 232)、KB癌细胞(ATCC CCL 17)、2780 AD卵巢癌细胞(Van der Blick,A.M.et al.,Cancer Res.485927-5932(1988))、Raji细胞(ATCC CCL 86)、Jurkat细胞(ATCC TIB 152)、Namalwa细胞(ATCC CRL 1432)、HL-60细胞(ATCC CCL 240)、Daudi细胞(ATCC CCL 213)、RPMI 8226细胞(ATCC CCL 155)、U-937细胞(ATCC CRL 1593)、Bowes黑素瘤细胞(ATCC CRL 9607)、WI-38VA13亚系2R4细胞(ATCC CLL 75.1)、MOLT-4细胞(ATCC CRL 1582)和各种异杂交瘤细胞)中的hGH表达。
i.用于将人生长激素放在初级、次级或永久化人成纤维细胞中在小鼠金属硫因启动子控制下的击靶质粒的构建下列实施例用于说明本发明的一个实施方案,其中人生长激素的正常序列上游被改变,以允许在初级、次级或永久化人成纤维细胞中表达人生长激素。
使用衍生于人生长激素N基因的5′末端的已克隆DNA片段产生用于击中EPO基因调节区的,与实施例1f中所述者相似的击靶分子。使用基于分析该区域中的HUMGHCSA序列而设计的PCR引物以扩增跨越HUMGHCSA(Genbank Entry)核昔酸位置3787-5432(两个产生方便地确定了大小的片段的EcoRI位点的位置,所说的片段可用于克隆或鉴定性消化包括该片段的亚克隆)的约1.8 kb片段。该区域从hGH基因N内含子1的中部延伸到转译起始位点5′端的约1.4 kb的上游位置。用EcoRI和BamHI消化pUC12,用KLenow处理以产生平头末端,并在稀释液条件下重新环化,得到已失去EcoRI和BamHI位点的质粒。该质粒被称为pUC12XEB。将HindIII接头连接到扩增的hGH片段上并用HindIII消化所得片段,再连接到HindIII消化的pUC12XEB上。用EcoRI和BamHI消化所得质粒pUC12XEB-5′hGH,以除去位于紧接hGH转录起始位点的上游的0.5 kb片段。将消化的DNA连接到来自mMT-I基因的1.8 kb EcoRI-BglI片段上[不含mMT编码序列;Hamer,D.H.and Walling,M.,J.Mol.Appl.Gen.1273-288(1982);也可使用根据分析得自Genbank的mMT序列即MUSMTI、MUSMTIP、MUSMTIPRM而设计的PCR引物,按已知方法从小鼠基因组DNA中分离该片段]。该质粒p5′hGH-mMT具有连接到靠近上游hGH序列两侧上的mMT启动子。
上述克隆策略可使hGH的序列上游在体外得以修饰,以便继后定靶转染初级、次级或永久化人成纤维细胞。该策略描述了mMT启动子的简单插入。也可予见到其它一些策略,例如将具有广泛宿主细胞特异性的增强子插入到已插入的mMT序列的上游。
j.激活人hGH基因并以筛选方法分离被击中的初级、次级和永久化人成纤维细胞为了击靶,使用从质粒主链中游离出插入段的限制性内切酶切割质粒。在切割p5′hGH-mMT时,HindIII消化释放出2.9 kb的靶片段,该片段由借助使该构建体击中hGH基因的调节区的DNA侧接在5′和3′侧上的1.8 kb mMT启动子组成。用苯酚提取和乙醇沉淀法纯化该DNA或单独的2.9 kb击靶片段,并在实施例11中所述的条件下转染到初级或次级人成纤维细胞中。将被转染的细胞铺敷在含人成纤维细胞营养培养基的150mm平皿中。48小时后,将细胞以10,000细胞/cm2的密度铺敷到24孔皿中(每孔约20,000个细胞;如果击靶发生的比例为每106个可隆细胞中有1个(实施例1c),则为分离单一的表达集落需要检测大约50个孔)。其中转染DNA已击中hGH的同源区上游的细胞将在mMT启动子控制下表达hGH。10天后,使用可从市场购得的免疫检测药盒(Nichols)检测整个孔的上清液以确定hGH表达水平。使用已知方法从孔中分离表现有hGH合成的克隆,通常是通过检测分配到单一孔或平板中细胞的异源群体的各部分,检测这些阳性孔的各部分,并在必要时重复进行上述步骤,最终通过筛选以每孔1个细胞接种的96孔微滴定板而分离中靶集落。也可以使用mMT特异性引物并结合使用位于HUMGHCSA核苷酸位置5,432的下游的引物,通过扩增DNA片段的PCR方法分析得自整个平板溶胞产物的DNA。该引物对应能扩增基于该DNA序列的精确预测了大小的DNA片段。用胰蛋白酶消化阳性平板并以依次降低的稀释度重新铺板,必要时重复DNA制备和PCR步骤以分离中靶细胞。
为生产常规药物传送的hGH的目的,本文所述的击靶方案也可用于激活hGH在永久化细胞(如HT 1080细胞(ATCC CCL 121)、HeLa细胞和HeLa细胞的衍生株(ATCC CCL 2、2.1和2.2)、MCF-7乳腺癌(ATCC HBT 22)、K-562白血病细胞(ATCC CCL 232)、KB癌细胞(ATCC CCL 17)、2780 AD卵巢癌细胞(Van dar Blick,A.M.et al.,Cancer Res.,485927-5932(1988)),Raji细胞(ATCC CCL 86)、Jurkat细胞(ATCC TIB 152)、Namalwa细胞(ATCC CRL 1432)、HL-60细胞(ATCC CCL 240)、Daudi细胞(ATCC CCL 213)、RPMI 8226细胞(ATCC CCL 155)、U-937细胞(ATCC CRL 1593)、Bowes黑素瘤细胞(ATCC CRL 9607)、WI-38VA13亚系2R4细胞(ATCC CLL 75.1)、MOLT-4细胞(ATCC CRL 1582)和各种异杂交瘤细胞)中的表达。
k.激活人hGH基因并使用阳性或结合的阳性/阴性选择系统分离击中的初级、次级和永久化人成纤维细胞构建p5′hGH-mMT的策略可在其后进行将neo基因插入相邻mMT启动子处的这一附加步骤。另外,可在pUC12多接头中相邻HUMGHCSA序列处插入一个阴性选择标志如gpt(得自pMSG(pharmacia)或另外适当来源)。在前一种情况下,通过PCR扩增或限制性酶与Sout-hern杂交分析从集落收集物制得的DNA来分离和筛选G418r集落,以鉴定中靶集落。在后一种情况下,将G418r集落放在含有巯基黄嘌呤的培养基中以对照选择gpr基因的整合(Besmard,C.et al.,Mol.Cell.Biol.,74139-4141(1987))。另外,可将HSV-TK基因放在插入段如gpt的相反例面,以允许通过在含有400μg/ml G418、100μm 6-巯基黄嘌呤和25μg/ml gancyclovir的人成纤维细胞营养培养基中培养细胞来选择neo并阻止gpt和TK。双重阴性选择将对真正的中靶后果提供几乎绝对地选择。Southern杂交分析则是证实性的。
为生产适于常规药物传送的hGH,也可使用本文所述的击靶方案激活永久化人细胞(如HT 1080细胞(ATCC CCL 121)、HeLa细胞和HeLa细胞的衍生株(ATCC CCL 2、2.1和2.2)、MCF-7乳腺癌(ATCCHBT 22)、K-562白血病细胞(ATCC CCL 232)、KB癌细胞(ATCC CCL17)、2780 AD卵巢癌细胞(Van dar Blick,A.M.et al.,CancerRes.,485927-5932(1988)),Raji细胞(ATCC CCL 86)、Jurkat细胞(ATCC TIB 152)、Namalwa细胞(ATCC CRL 1432)、HL-60细胞(ATCC CCL 240)、Daudi细胞(ATCC CCL 213)、RPMI 8226细胞(ATCC CCL 155)、U-937细胞(ATCC CRL 1593)、Bowes黑素瘤细胞(ATCC CRL 9607)、WI-38VA13亚系2R4细胞(ATCC CLL 75.1)、MOLT-4细胞(ATCC CRL 1582)及各种异杂交瘤细胞)中的hGH表达。
可以修饰实施例1f和1i中所描述的及实施例1g、1h、1j和1k中使用的击靶构建体,以使之包含用于选择其中被激活的内源基因和可扩增性可选择标志均被扩增的细胞的可扩增性可选择标志(如ada、dhfr或CAD)。可使用这些表达或能够表达编码治疗性产品的内源性基因的细胞以生产用于常规药物传送或基因治疗的蛋白质(如hGH和hEPO)。
1.以电穿孔法用外源DNA和可选择性标志基因转染初级和次级成纤维细胞用胰蛋白酶消化并用营养培养基从塑料表面上淋洗下指数生长或早期静止期的成纤维细胞。取出一等分的细胞悬浮液进行计数,对剩余细胞进行离心。吸出上清液并将细胞团块重新悬浮在5ml电穿孔缓冲液(20mM HEPES pH 7.3,137mM NaCL,5mM KCl,0.7mM Na2HPO4,6mM右旋糖)中。再次离心细胞,吸出上清液,将细胞重新悬浮在含有1mg/ml乙酰化牛血清白蛋白的电穿孔缓冲液中。最后的细胞悬液含有约3×106细胞/ml。重新悬浮后应立即进行电穿孔。
向带有0.4cm电极间距的无菌小池(Bio-Rad)内加入超螺旋质粒DNA。DNA终浓度一般为至少120μg/ml。然后向小池内加入0.5ml细胞悬液(约含有1.5×106个细胞),并轻轻混合细胞悬液和DNA溶液。用Gene-Pulser装置(Bio-Rad)进行电穿孔。电容和电压分别定在960μF和250~300V。随着电压增加,细胞存活数降低,但有导入的DNA稳定地掺入其基因组中的存活细胞的百分比则显著增加。在这些给定的参数下,应观察到大约14~20mSec的脉冲时间。
将受到电穿孔的细胞在室温下保持5分钟,然后用无菌移液吸管轻轻地吸出小池的内容物。将细胞直接加到在10cm平皿中的10ml预热的营养培养基(同上,但加有15%小牛血清)内并如上所述进行温育。第二天吸出原培养基,并换成10ml新鲜培养基并继续温育16~24小时。第二天再克隆细胞以确定克隆效率并选择G418抗性集落。用胰蛋白酶消化细胞,计数并铺板;一般为确定克隆效率以103细胞/10cm平皿铺敷成纤维细胞;为进行G418选择则以1~2×104细胞/10cm平皿铺敷成纤维细胞。
在含有300~400μg/ml G418(Geneticin,效力约50%的二硫酸盐;Gibco)的成纤维细胞营养培养基(含15%小牛血清)中选择G418抗性人成纤维细胞。在没有G418的条件下确定克隆效率。将铺板细胞温育12~14天,在此时间用福尔马林集落,用结晶紫染色并计数(确定铺板的克隆效率)或使用克隆圆柱分离(G418平板)。对兔成纤维细胞的电穿孔和选择基本上与人成纤维细胞相同,只是使用不同的选择条件,在含有1gm/ml G418的培养基中选择对G418抗性的兔成纤维细胞。
从新切下的人包皮中分离成纤维细胞。以50,000细胞/cm的密度在DMEM+10%小牛血清中接种培养物。当培养物汇合时,经胰蛋白酶处理收获成纤维细胞并用电穿孔法转染。经用质粒pcDNEO(图5)经转染估计电穿孔条件。使用接近最佳条件(60μg质粒pcDNEO,电穿孔电压250伏,电容定在960μF)进行有代表性的电穿孔实验,结果每588个被处理的细胞产生1个G418集落(所有被处理细胞的0.17%),或每71个可克隆细胞产生1个G418集落(1.4%)。
当在几乎最佳条件(60μg质粒pcDNEO,电穿孔电压300伏,电容定在960μF)下进九次单独的电穿孔实验时,平均每1,899个被处理细胞中观察到1个G418集落(0.05%),范围为1/882到1/7,500被处理细胞。这相当于每38个可克隆细胞平均有1个G418集落(2.6%)。
经用质粒pcDNEO和pXGH5共转染使低传代初级人成纤维细胞转变为hGH表达细胞。一般是在近最佳条件(电穿孔电压为300伏,电容定在960μF)下用60μg两质粒等摩尔混合物进行转染。实验结果是每14,705个被处理细胞产生1个G418集落。
在相同转染条件下分离的这些和其它细胞的hGH表达数据综述如下。最后,所有G418r集落的98%可被扩展以产生大量培养物。分析的G418r克隆数目 154G418r/hGH表达克隆的数目 65平均hGH表达水平 2.3μg hGH/106细胞/24hr最大hGH表达水平 23.0μg hGH/106细胞/24hr使用其中neo和hGH基因存在于同一质粒分子上的DNA构建体pXGH301通过电穿孔转染初级或次级人成纤维细胞也可产生稳定的转染体。用两步骤法构建pXGH301。从pBR322中分离SalI-ClaI片段(pBR 322中位置23~651)并插入到SalI-ClaI消化的pcDNEO中,导入pcDNEO的SV40早期启动子区域的BamHI位点上游。用BamHI消化该质粒pBNEO,分离含有处于SV40早期启动子控制下的neo基因的2.1kb片段并插入BamHI消化的pXGH5中。分离带有单一2.1 kb BamHI片段插入的质粒,其中neo和hGH以彼此相同的方向转录。该质粒被称为pXGH301。例如用60μg pXGH301在300伏和960μF条件下电穿孔1.5×106个细胞。以每1.5×106个处理细胞652个G418抗性集落(每2299个处理细胞1个集落)的频率,从被转染的次级成纤维细胞中分离G418抗性集落。这些集落中约有59%表达hGH。
实施例2 构建产生嵌合转录单位的击靶质粒,嵌合转录单位中融合有人生长激素和促红细胞生成素序列下述实施例用于说明本发明的另外两个实施方案,其中人EPO基因的正常调节序列上游被改变,以允许在其原未被转染状态下不以可检测量表达hEPO的初级或次级成纤维细胞细胞株中表达hEPO。在这些实施例方案中,击靶的产物是嵌合转录单位,其中人生长激素基因的第一个外显子位于hEPO外显子2~5的上游。转录、拼接和转译的产物是其中hEPO信号肽的氨基酸1~4被hGH的氨基酸残基1~3取代的蛋白质。就被插入的外来调节序列的相对位置和为产生最终的、被加工的转录本所需的特异性拼接方式来说,这两个实施方案是不同的。
设计质粒pXEPO-10,以通过对人染色体7的内源hEPO基因进行基因击靶而用hGH的外显子1置换hEPO的外显子1。按下述方法构建质粒pXEPO-10。首先,将位于hEPO编码区上游的6 kb HindIII-BamHI片段(参见实施例1f)插入HindIII-BamHI消化的pBluescri-ptIISK+(Stratagene,LaJolla,CA)中而构建中间体质粒PT163。用XhoI和HindIII消化该连接反应的产物并连接到来自pMClneoPolyA[Thomas,K.R.and Capecchi,M.R.Cell 51503-512(1987),可得自Stategene,LaJolla,CA]的1.1 kb HindIII-XhoI片段上,以产生pT163。在聚合酶链反应中利用寡核苷酸13.1~13.4以产生一融合片段,其中小鼠金属硫因I(mMT-I)启动子-hGH外显子1序列额外地融合到hEPO内含子1序列上。首先,用寡核苷酸13.1和13.3以扩增约0.73 kb来自pXGH5(图5)的mMT-I启动子-hGH外显子1片段。然后,用寡核苷酸13.2和13.4扩增主要由人基因组DNA中hEPO内含子1组成的约0.57 kb片段。最后,混合两个已扩增的片段并进一步用寡核苷酸13.1和13.4扩增以产生最后的融合片段(融合片段3),该融合片段在mMT-I部分的5′侧SalI位点侧接,并在hEPO内含子1序列的3′侧XhoI位点侧接。用XhoI和SalI消化融合片段3并连接到XhoI消化的pT163。将此连接混合物转化到大肠杆菌中,并鉴定含有融合片段3的单一插入段的克隆并定名为pXEPO-10,在所述融合片段3中在hEPO内含子1序列的3′侧重新产生了XhOI位点。13.15′TTTTGTCGAC GGTACCTTGG TTTTTAAAAC CSalI KpnI(SEQ ID NO 5)13.25′CCTAGCGGCA ATGGCTACAG GTGAGTACTC GCGGGCTGGG CG(SEQ ID NO 6)13.35′CGCCCAGCCC GCGAGTACTC ACCTGTAGCC ATTGCCGCTA GG(SEQ ID NO 7)13.45′TTTTCTCGAG CTAGAACAGA TAGCCAGGCT GXhoI(SEQ ID NO 8)寡聚物13.1的非黑体字区域与mMT-I启动子相同,带有作为其5′边界的天然KpnI位点。黑体字型代表将5′边界转变为为SalI位点的SalI位点尾部。寡聚物13.2和13.3的黑体字区域代表hGH序列,而非黑体字区域是来自hEPO基因的内含子1序列。寡聚物13.4的非黑体字区域与hEPO内含子1的最后25个碱基相同。黑体字区域包括将扩增片段的3′边界转变为XhoI位点的XhoI位点尾部。
设计质粒pXEPO-10,以借助基因击靶将hEPO结构基因和启动子区的hGH上游的mMT-I启动子和外显子1置于人染色体7上的内源性hEPO座位。按下述方法构建质粒pXEPO-11。在聚合酶链反应中利用寡核苷酸13.1和13.5~13.7以产生一融合片段,该片段中小鼠金属硫因I(mMT-I)启动子-hGH外显子1序列被额外地融合到相对于hEPO编码区从-1到-630的hEPO序列上。首先,用寡核苷酸13.1和13.6扩增来自pXGH5(图5)的约0.75 kb mMT-I启动子-hGH外显子1片段。然后,用寡核苷酸13.5和13.7扩增来自人基因组DNA的,相对于hEPO编码区的主要由从-1至-620的hEPO序列组成的约0.65 kb片段。寡核苷酸13.5和13.6均含有位于hGH内含子1-hEPO启动子区域的10bp接头序列,它相当于天然hEPO内含子1拼接供体位点。最后,混合两个已扩增的片段并进一步用寡核苷酸13.1和13.7扩增,以产生最后的融合片段(融合片段6),该片段侧接mMT-I部分的5′侧Sa1I位点,并侧接hEPO启动子区的3′侧XhoI位点。用XhoI和SalI消化融合片段6并连接到XhOI消化的PT163上。将连接混合物转化到大肠杆菌中,鉴定出含有融合片段6的单一插入段的克隆,并定名为pXEPO-11,所说的融合片段6中,在hEPO启动子序列的3′侧上重新产生了XhoI位点。13.55′GACAGCTCAC CTAGCGGCAA TGGCTACAGG TGAGTACTCAAGCTTCTGG GCTTCCAGAC CCAG (SEQ ID NO 9)HindIII13.65′CTGGGTCTGG AAGCCCAGAA GCTTGAGTAC TCACCTGTAGHindIIICCATTGCCGC TAGGTGAGCT GTC (SEQ ID NO 10)13.75′TTTTCTCGAG CTCCGCGCCT GGCCGGGGTC CCTCXhoI(SEQ ID NO 11)寡聚物13.5和13.6的黑体字区代表hGH序列。斜体字的区域相当于hEPO内含子的前10个碱基对。寡聚物其余部分相当于从-620到-597(相当于hEPO编码区而言)的hEPO序列。寡聚物13.7的非黑体字区域与相对于hEPO编码区的碱基-1至-24相同。黑体字区域包括将已扩增的片段的3′边界转变为XhoI位点的XhoI位点尾部。
可用BamHI和XhoI消化质粒pXEPO-10以释放出含有mMT-I/hGH融合体的7.3kb片段(其中所说融合体在其两侧侧接hEPO序列),而将该质粒用于基因击靶。该片段(击靶片段1)不含hEPO编码序列,只有位于hEPO编码区和hEPO内含子1序列的上游的-620和约-6620序列,以指导对人EPO座位击靶。使用实施例1c中所述的相似条件,将击靶片段1转染到初级和次级人皮肤成纤维细胞中。将G418抗性集落接种到96孔平板的各孔中并用ELISA方法(R&D系统,Minnea-polis,MN)筛选以表达EPO。其中转染DNA随机整合到人基因组中的细胞不能产生EPO。其中转染DNA已与内源hEPO内含子1和hEPO上游序列发生同源重组的细胞含有一嵌合基因,该基因中mMT-I启动子和未被转录的序列以及hGH 5′未转译序列和hGH外显子1取代了正常hEPO启动子和hEPO外显子1(见图1)。击靶片段1中的非hEPO序列被连接到hEPO内含子1下游的hEPO序列。用mMT-1启动子置换正常hEPO调节区将激活正常情况下不表达hEPO的成纤维细胞中的EPO基因。用hGH外显子1取代hEPO外显子1则产生其中hEPO信号肽的前4个氨基酸被hGH的氨基酸1~3取代的蛋白质,形成一个功能性嵌合信号肽,该信号肽在转译后加工时从成熟蛋白质中被除去并使之从表达细胞中分泌出来。
通过用BamHI和XhoI消化可以使质粒pXEPO-11用于基因击靶,以释放出含有在其两侧上侧接hEPO序列的mMT-I/hGH融合体的7.4kb片段。该片段(击靶片段2)不含有hEPO编码序列,而只具有位于hEPO编码区的上游-1和约-6620间的序列,以指导对人EPO座位击靶。使用与实施例19中所述相似的条件将击靶片段2转染到初极或次级人皮肤成纤维细胞中。将G418抗性集落收集到96孔平板的单个孔内,并用ELISA检测法(R&D系统,Minneapolis,MN)筛选有EPO表达的集落。其中转染DNA随机整合到人基因组中的细胞不能产生EPO。其中转染DNA已与内源性hEPO启动子和上游序列发生同源重组的细胞含有一嵌合基因,该基因中mMT-1启动子和未转录序列、hGH5′未转译序列和hGH外显子1,以及由hEPO内含子1的前10个碱基组成的10碱基对接头被插入在位于相对于hEPO编码区的位置-620的HindIII位点处(参见图2)。正常静止hEPO启动子的mMT-I启动子上游定位将在初级或次级皮肤成纤维细胞中指导信号读码(5′至3′)未转译金属硫因和hGH序列、hGH外显子1、与hEPO内含子1之前10个碱基对相同的10 DNA碱基,以及正常hEPO启动子和hEPO外显子1(相当于hEPO编码序列的-620到+13)的合成。来自hEPO内含子1的10碱基对接头序列用作拼接供体位点使hGH外显子1融合到位于紧接hEPO外显子2上游的下一个下游拼接受体位点。因此,对所得转录本的加工将拼接掉hEPO启动子、外显子1和内含子1序列。用hGH外显子1置换hEPO外显子1将产生一种其中hEPO信号肽的前4个氨基酸用hGH氨基酸1~3取代的蛋白质,这一取代形成一个通过转译后加工而从成熟蛋白质中被除去并从表达细胞中被分泌的功能性嵌合信号肽。
利用已知方法能构建一系列与pXEPO-10和pXEPO-11相关的构建体。在这些构建体中,mMT-1启动子和hGH序列的相对位置,以及mMT-1/hGH序列插入hEPO上游序列的位置是变化的,从而产生可选择的、便于基因击靶的嵌合型转录单位,导致融合转录本的更有效表达,或者具其它所需的特性。这类构建体将产生相似的结果,因此hGH-hEPO融合基因被置于由基因击靶至正常hEPO基因位置所产生的外源启动子的调控之下。例如,hEPO基因上游的6 kb HindIII-BanHI片段(参见实施例1f)具有许多能够用作插入neo基因和mMT-1启动子/hGH融合片段的位点的限制性酶识别序列。位于HindIII位点上游约1.3 kb的BglII位点即为所说的一个位点,它在该区域中是唯一的,并可用于插入一个或多个选择性标记和来自另一种将在初级、次级或永久化人细胞中用于激活hEPO表达的基因的调节区。
首先,通过将位于hEPO编码区上游的6 kb HindIII-BamHI片段(实施例1f)插入被HindIII-BamHI消化的pBluescriptIISK+(St-ratagene,LaJolla,CA)而构建中间质粒pT164。用BamHI和XhoI消化质粒pMClneoPloyA[Thomas,K.R.and Capecchi,M.R.Call 51503-512(1987);可得自Stratagene,LaJolla,CA],用大肠杆菌DNA聚合酶的KLenow片段进行处理使之成为平头末端,并纯化所得的1.1kb片段。pT164用BglI消化,并经E.coli DNA聚合酶的Klenow片段处理而成为平头末端。连接上述两个平头末端片段,并转化到感受态的E.coli中。分离具有1.1 kb neo片段的单一插入段的克隆,并用限制性酶分析法进行分析,以确定那些其中由平头Xhol和BgIII位点融合所重建的BglI位点是位于距质粒pT164中存在的唯一HindIII位点1.3 kb的克隆。至此即可在位于neo转录单位5′侧翼的唯一BglII位点处裂解所得的质粒pT165。
寡核苷酸13.8和13.9被用于聚合酶链反应中以产生一个其中有小鼠金属硫因I(mMT-I)启动子-hGH外显子1序列另外还与含有拼接-供体位点的10 bp片段融合的片段。尽管有大量的拼接-供体位点或共有拼接-供体位点可以被使用,但被选用的拼接-供体位点相当于天然hEPO内含子1拼接-供体位点。寡核苷酸(13.8和13.9)被用于扩增来自pXGH5的约0.73 kb mMT-1启动子-hGH外显子1片段(图5)。用BglII消化被扩增的片段(片段7),并与经BglII消化的pT165相连接。连接混合物转化入E.coli中,鉴定含有片段7的单一插入段的克隆,其中,mMT-1启动子中的KpnI位点邻接于neo基因的5′端,并且mMT-1启动子要以使得转录朝着唯一的HindIII位点的方向定位,该克隆被命名为pXEPO-12。13.8 5′AAAAAGATCT GGTACCTTGG TTTTTAAAAC CAGCCTGGAGBglII KpnI(SEQ ID NO 12)寡聚物13.8的非黑体区等同于mMT-1启动子,以天然KpnI位点为其5′边界。黑体型表示将5′边界转换为BglII位点的BglII位点尾。13.95′TTTTAGATCT GAGTACTCAC CTGTAGCCAT TGCCGCTAGGBglII(SEQ ID NO 13)寡聚物13.9的黑体区表示hGH序列。斜体字区相当于hEPO内含子1的前10个碱基对。加入划线的BglII位点以构建质粒之用。
质粒pXEPO-12被用于基因击靶是通过用BamHI和HindIII消化,以释放出含有由hEPO序列侧接于两侧的neo基因和mMT-1/hGH融合体的7.9 kb片段。该片段(击靶片段3)不含hEPO编码序列,仅仅含有位于hEPO编码区上游约-620至约-6620之间的序列以指导对人EPO基因座位上游进行击靶。使用类似于实施例1b和1c中所述的条件将击靶片段3转染到初级、次级或永久化的人皮肤成纤维细胞中,收集G418抗性集落于96孔平板的各孔中,并用ELISA测定法(R&DSystems,Min-neapolis MN)进行筛选EPO表达。具有转染DNA随机整合到人基因组的细胞不能产生hEPO,转染的DNA与内源性hEPO启动子和上游序列进行同源组的细胞,含有一个嵌合型基因,在该嵌合型基因中,mMT-1启动子和非转录序列、hGH 5′未转译序列、hGH外显子1和由hEPO内含子1的前10个碱基组成的10 bp接头在位于与hEPO编码区相关的大约-1920位置处的BglII位点被插入。正常静止的hEPO启动子上游的mMT-1启动子的定位将指导在初级、次级或永久化人成纤维细胞(或其它的人细胞)中合成下列信息内容(5′→3′)未转译的金属硫因和hGH序列、hGH外显子1、与hEPO内含子1的前10个碱基对相同的DNA 10个碱基和hEPO上游区及hEPO外显子1(与EPO编码序列相关的大约-1920~+13)。来自hEPO内含子1的10bp接头序列起拼接-供体位点作用,以使hGH外显子1与紧邻于hEPO外显子2上游的下游拼接-受体位点融合。因此,所得转录物的加工将拼接掉hEPO上游序列、启动子区、外显子1和内含子1序列。当应用pXEPO-10、-11和-12时,信息的转录后加工过程的改善,可以通过利用体外诱变法来进行,以去除位于mMT-I启动子和hEPO外显子1之间的hEPO上游序列中的拼接受体位点,这可降低产生所需信息所必要的生产性拼接现象的程度。以hGH外显子1替代hEPO外显子1产生蛋白质,其中hGH的氨基酸1~3代替了hEPO信号肽的前4个氨基酸,生成功能性的嵌合型信号肽,而该信号肽由于转译后的加工过程被从成熟的蛋白质中除去,并由表达细胞中分泌出。
实施例3 上游序列的中靶修饰和靶基因的扩增如果击靶质粒含有因基因扩增现象能赋予其对高水平细胞毒性因子抗性的标志基因,则就能诱导其中由前述方法激活的hEPO基因的人细胞以扩增neo/mMT-1/EPO转录单位。可筛选的标志基因如二氢叶酸还原酶(dhfr,筛选剂是氨甲喋呤)、多功能CAD基因[编码氨甲酰磷酸合成酶、天冬氨酸转氨甲酰基酶和二氢乳清酶(orotase);筛选剂是N-(膦酰基-乙酰基)-L-天冬氨酸(PALA)]、谷氨酰胺合成酶[筛选剂是甲硫酰氨sulphoximine(MSX)]和腺苷脱氨基酶(ada,筛选剂是腺嘌呤核苷)在永久化的人细胞系中可以扩增的在其它基因中已有文献记载(Wright,J.A.et al,Proc Natl.Acad.Sci.USA 871791-1795(1990);Cockett,M.I.et al.,Bio/Technology 8662-667(1990))。在这些研究中,记载基因扩增发生于许多永久化人细胞系中。在适宜的筛选条件下,其它细胞中的HT 1080、Hela、MCF-7乳腺癌细胞、K-562白血病细胞、KB癌细胞或2780 AD卵巢癌细胞表现出扩增反应。
质粒pXEPO-10和pXEPO-11通过在这些质粒的唯一HindIII位点插入一个正常的或突变的dhfr基因而能够被修饰。在用合适的DNA转染HT 1080细胞、筛选其G418抗性(由neo基因赋予)和鉴定其中的hEPO基因已被neo、dhfr和mMT-1序列向hEPO基因上游的正确位置进行基因击靶而激活的细胞后,这些细胞可被置于氨甲喋呤(MTX)中分步筛选以筛选dhfr的扩增和被连接的neo、mMT-1及hEPO序列的共同扩增(Kaufman,R.J.Technique 2221-236(1990))。在所采用的分步筛选方案中,细胞首先与低浓度MTX(0.01~0.08μM)接触,随后与浓度渐增直至250μM或更高的MTX连续接触。虽然MTX浓度的相对低的增量变化也是有效的,但0.04~0.08μM MTX的线性增量步骤和MTX浓度连续二倍的增加在筛选扩增的转染细胞系中将是有利的。由dhfr基因拷贝数的增加来监测扩增反应,并通过检测体外的hEPO表达来证实。借助于上述策略,通过对完全位于hEPO编码区之外的序列的中靶修饰作用能够获得hEPO实质上超水平的表达。
为了通过基因击靶非编码序列以及随后的扩增反应获得超表达hGH基因的细胞,类似于本文所述的(实施例1f、1h、1i、1k、2和7)以激活hGH在人细胞中表达的构建体也可以被进一步修饰使之包括dhfr基因。
实施例4在永久化人成纤维细胞系中击靶和激活人EPO基因座位制备击靶构建体pXEPO-13以试验内源性hEPO基因能在人成纤维细胞中被激活的假说。首先,构建质粒pT22.1,它含有与小鼠金属硫因-1启动子(mMT-I)融合的hEPO基因的第一个密码子上游的63 bp基因组hEPO序列。寡核苷酸22.1至22.4被用于PCR中以融合mMT-I和hEPO序列。这些引物的特性如下22.1是一个21碱基的寡核苷酸,与mMT-IKpnI位点上游的mMT-I启动子开始的28 bp片段同源;22.2和22.3是58个核苷酸的互补引物,它们确定hEPO和mMT-I序列的融合体,使得该融合体含有hEPO基因第一个密码子上游的hEPO序列开始的35个碱基的28 bp,和始于寡核苷酸22.2的碱基29的mMT-I序列,它包括mMT-I的天然BglII位点和延伸至mMT-I序列的30个碱基;22.4为长21个核苷酸,并与hEPO基因第一个密码子的下游的hEPO序列开始的725 bp同源。这些引物被用于扩增含有上述mMT-I和hEPO序列融合体的1.4 kb DNA片段。用KpnI消化所得的片段(该PCR片段含有两个KpnI位点mMT-T启动子区的单一天然KpnI位点和hEPO序列中的单一天然KpnI位点),并进行纯化。质粒pXEPOI也用KpnI消化,释放出一个1.4 kb片段和一个6.4 kb片段。纯化6.4 kb片段,并与1.4 kb KpnI PCR融合片段连接。所得的构建体称为pT22.1。第二个中间质粒pT22.2的构建是通过将位于hEPO结构基因上游的大约6 kb HindIII-BamHI片段(参见实施例1f)与BamHI和HindIII消化的pBSIISK+(Stratagene,LaJolla,CA)连接。构建第三个中间质粒pT22.3是首先从含有新霉素磷酸转移酶基因的pMCINEpolyA(Stratagene,LaJolla,CA)中切除一个1.1 kb的XhoI/BamHI片段。然后用DNA聚合酶I的Klenow片段(New England Biolabs)将上述片段制成平头未端。再将该片段连接至pBSIISK+的HincII位点(也类似地用DNA聚合酶I制成平头)而得到pT22.3。第四个中间质粒pT22.4的制备是通过纯化来自pT22.3的含有neo基因的1.1 kb XhoI/HindIII片段,并将该片段与经XhoI和HindIII消化的pT22.2相连。pT22.4因此而含有与hEPO片段上游BamHI-HindIII的HindIII侧相邻的neo基因。最后,通过首先从pT22.1中切除2.0 kb EcoRI/AccI片段而得到pXEPO-13。该片段的EcoRI位点确定了mMT-I启动子的5′边界,而该片段的AccI位点则位于hEPO外显子5中。因此,该AccI/EcoRI片段除了仅仅缺失外显子5的部分和天然多腺苷酸化作用位点外,含有几乎完整的hEPO表达单位。纯化上述2.0 kb EcoRT/AccI片段,用DNA聚合酶I的Klennow片段处理制成平头末端,然后与经XhoI消化且平头末端化的pT22.4连接。
用经PvuI-BamHI消化的pXEPO-13转染HT 1080细胞。以此方式消化的pXEPO-13产生三个片段包括amp基因部分的1 kb载体片段;留下的载体序列的1.7 kb片段和含有hEPO、neo及mMT-I序列的大约9 kb片段。所述的约9 kb BamHI/PvuI片段由BamHI位点开始依次含有下列序列hEPO基因组序列上游的约5.2 kb、1.1 kb noe转录单位、0.7 kb mMT-I启动子和含有在外显子5内截短的hEPO编码序列的2.0 kb片段。45μg经上述方法消化的pXEPO-13被用于1.2×107细胞的电穿孔中(电穿孔的条件描述于实施例1b中)。该电穿孔过程共重复8次,形成对总共9.6×107细胞的电穿孔。细胞与培养基混合以产生1×106细胞/ml的细胞密度,取1 ml的等份试样分配至总共96个150 mm组织培养板(Falcon)中,每个含有35 ml最低限度的DMEM/15%牛血清。第二天,将培养基吸出,并用含0.8 mg/ml G418(Gibco)的新鲜培养基更换旧培养基。培养10天后,用ELISA分析(R&D Systems)取样分析每一培养板的培养基中的hEPO。96个平板中有6个含有至少10 mU/ml hEPO。选择这些培养板中的一块,即第18号板以纯化hEPO表达集落。96个板的每个150mm培养板含有约600个G418抗性集落(在所有的96平板上,估计总共有57,600个G418抗性集落)。18号培养板上的大约600个集落用胰蛋白酶处理,并以50个细胞/ml的密度再铺板入364孔板(Steril-in)中。培养一周后,在364孔板的每个大孔中约有10个集落可单个地看见(这些培养板是由24个大孔的每个大孔中有16个小孔所组成的)。此时筛选各孔中hEPO的表达。两个大孔中包含有至少带有20mU/ml hEPO的培养基。在A2号孔中发现含有分布于16个小孔中的15个集落。将每个这些小孔中的内容物都用胰蛋白酶处理,并转移到96培养板的16个单独孔中。在培养7天后,从这些的每孔培养基中取样进行hEPO ELISA分析。只有一个孔(10号孔)含有HEPO。该细胞株被命名为HT165-18A2-10,使其在培养中繁殖以进行定量的hEPO分析、RNA分离和DNA分离。hEPO产率的定量检测结果为25亿单位/106细胞/24小时。
由hEPO外显子5中的AccI位点至3′非转译区的BglII位点的0.2kb DNA探针被用于探测从HT165-18A2-10细胞中分离出的RNA。在外显子5的AccI位点处被截短的击靶构建体pXEPO-13不含这些ACCI/BglII序列,因此,该构建体对于在hEPO基因座位的击靶具有判断性。只有以同源方式与天然hEPO序列进行重组的细胞株能够产生含有与AccI/BglII序列同源的序列的hEPO mRNA。已发现HT165-18A2-10表达在Northern印迹中与32P标记的AccI/BglII hEPO探针杂交的预定大小的mRNA。限制性酶和Southern印迹分析证实neo基因和mMT-I启动子已在HT165-18A2-10细胞中被击靶至两个hEPO等位基因之一的座位上。
上述结果表明,能用同源重组将一个调节区击靶至一个通常在人成纤维细胞中处于静止状态的基因上,从而引起该基因的功能性激活。22.1 5′CACCTAAAAT GATCTCTCTG G (SEQ ID NO 14)22.2 5′CGCGCCGGGT GACCACACCG GGGGCCCTAG ATCTGGTGAAGCTGGAGCTA CGGAGTAA (SEQID NO 15)22.3 5′TTACTCCGTA GCTCCAGCTT CACCAGATCT AGGGCCCCCGGTGTGGTCAC CCGGCGCG(SEQ ID NO 16)22.4 5′GTCTCACCGT GATATTCTCG G (SEQID NO 17)实施例5 制备无内含子的基因基因击靶也可以用于制备经加工后不含内含子的基因,以转移到酵母或细菌中进行基因表达和体外的蛋白质生产。例如,利用下述方法即可由酵母生产hGH。
制备两个分离的击靶构建体。击靶构建体1(TC1)包括一段逆转录病毒的LTR序列(例如来自Moloney Murine白血病病毒(MoMLV)的LTR)、一个用于在人细胞中进行筛选的标志基因(如来自Tn5的neo基因)、一个用于在酵母中进行筛选的标志基因(如酵母URA3基因)、一个能在酵母中指导基因表达的调节区(如GAL4启动子)以及可以任选地一段当与hGH基因融合时能使得酵母细胞分泌hGH的序列(前导序列)。该载体也能包括允许在人细胞中进行逆转录病毒包装的DNA序列。组建上述构建体使得上述序列由hGH基因组序列侧接于两侧,当与基因组hGH基因N序列进行同源重组时,该hGH基因组序列将在hGH基因N密码子1(相应于成熟的、被加工蛋白质的1位氨基酸)紧接上游的TCI中整合外源序列。整合中的DNA序列的顺序是hGH上游和调节序列、neo基因、LTR、URA3基因、GAL4启动子、酵母前导序列、包括成熟蛋白1位氨基酸的hGH序列和成熟蛋白质1位氨基酸的下游序列。击靶构建体2(TC2)包括足以使质粒在酵母中复制的序列(例如2-微米圈(2-micron circle)或ARS序列)酵母转录终止序列、病毒LTR和用于在人细胞中进行筛选的标志基因(例如,细菌gpt基因)。组建该构建体使得上述序列的两侧由hGH基因组序列侧接,当与基因组的hGH基因N序列进行同源重组时,该hGH基因组序列将在hGH基因N终止密码子的紧接下游的TC2中整合外源序列。整合时的DNA序列的顺序是hGH外显子5序列、酵母转录终止序列、酵母质粒复制序列、LTR、gpt基因和hGH3′非转译序列。
来自TC1和TC2的线性片段被相继击靶到其hGH基因侧翼的各自位置。在用辅助性逆转录病毒对些细胞进行超感染之后,通过该区指导转录的LTR将产生一个在两端具有LTR序列的RNA。拼接该RNA将产生的分子中正常的hGH内含子已被去除。被加工的转录物的逆转录将导致被加工的hGH融合基因的双链DNA拷贝的积累。从被双重击靶、逆转录病毒感染的细胞中分离DNA,并用在LTR中一次性裂解转录单位的酶进行消化。被消化的物质在能促进环化的条件下进行连接,并被导入酵母细胞中,所得的细胞随后进行筛选URA3基因。只有那些摄入了URA3基因(被连接在由TC1和TC2导入的序列及加工的hGH基因上)的细胞能够生长。这些细胞含有在半乳糖诱导时将表达hGH蛋白的质粒,并借助于被融合的酵母前导肽列从细胞中分泌hGH蛋白,所说的前导肽序列一旦在分泌产生成熟的、有生物活性的hGH分子时则被裂解掉。
在细菌细胞中的表达通过在TC1和TC2中进行的简单替换,如用来自pBR322的氨苄青霉素抗性基因代替酵母URA3基因、用tac启动子(deboer et al,Proc.Natl.Acad.Sci.8021-25(1983))代替酵母GAL4启动子、用细菌前导序列代替酵母前导序列、用pBR322的复制原点代替2-micron circle或ARS序列和用细菌转录终止(如trpA转录终止子;Christic,G.E.et al.,Proc.Natl.Acad.Sci.784180-4184(1981))序列代替酵母转录终止序列来完成。类似地,用hEPO击靶序列简单地代替hGH击靶序列也能在酵母和细菌中表达hEPO,这样,酵母或细菌前导序列定位于紧接hEPO密码子1(相相于成熟的加工蛋白质中1位氨基酸)的上游。
实施例6 在永久化人细胞系中激活和扩增EPO基因将dhfr表达单位掺入到pXEPO-13的唯一HindIII位点(参见实施例4)将产生一个能够双重选择和选择其中的dhfr基因被扩增的细胞的新击靶载体。pXEPO-13中的单一HindIII位点限定了neo基因与人EPO基因的天然位置上游的基因组序列间的连接。将dhfr基因安置在该位点上提供了一个具有由来自天然hEPO基因位置的DNA序列包绕的neo和dhfr基因的构建体。与pXEPO-13一样,插入dhfr基因的衍生物经同源重组被用于击靶hEPO基因座位。这一被命名为pREPO4的构建体示于图6中。该质粒包括人EPO基因外显子1~4和部分外显子5以及位于hEPO编码区上游的HindIII-BamHI片段。pSVe、pTK和pmMT-I相当于来自SV40早期区、单纯疮疹病毒(HSV)胸苷激酶(TK)基因和小鼠金属硫因-I基因的启动子。其产生过程如下纯化HindIII消化的pXEPO-13,用DNA聚合酶I的Klenow片段使之变为平头。为获得dhfr表达单位,用EcoRI和SalI消化质粒构建体pF8CIS9080(Eaton et al.,Biochemistry 258343-8347(1986))。由消化液中纯化含dhfr表达单位的2 kb片段,并用DNA聚合酶I的Klenow片段处理使之变为平头。然后将上述含dhfr的片段与pXEPO-13的平头化HindIII位点连接。取该连接混合物的等分部份转化入E.coli,并铺板于氨苄青霉素选择平板上。于37℃培养过夜后,观察、挑出并培养单个细菌集落。由这些培养物得到小质粒制备物,然后用BglI+HundIII和SfiI限制性酶消化所得的DNA,以确定被插入的dhfr片段的方向。发现得自上述制备物之一的质粒DNA含有这样的dhfr片段2 kb插入段。并发现该质粒中dhfr表达单位的转录方向与邻接的neo基因的方向相对。这是被命名为pREPO4的构建体。
在经同源重组激活内源性hEPO基因之后,质粒pREPO4被用于在细胞中扩增hEPO基因座位。用该构建体产生的基因激活使得可以通过利用药物氨甲蝶呤(MTX)选择增加的DHFR表达。一般情况下,DHFR表达的提高是通过DNA扩增增加拷贝数而实现的。最终的结果是被激活的hEPO基因与dhfr序列一起共扩增。激活的EPO基因座位的共扩增将导致EPO表达的提高。
用pREPO4在HT 1080细胞中进行击靶实验。分离hEPO表达系HTREPO-52。用Southern和Northern印迹定量分析上述细胞系产生的EPO。发现该菌株将被一个单拷贝的dhfr/neo/mMT-I序列击靶。在0.8mg/ml G418选择条件下得到的表达水平为大约1300mU/1×106细胞/天。因为靶EPO基因座位含有一个dhfr表达单位,有可能用抗叶酸药物MTX选择DHFR表达的提高。因此,该菌株在0.02、0.05、0.1、0.2和0.4μM MTX中进行分步选择。其起始选择结果列于表4和图7。
表4细胞系MTX(μM)mU/1×106细胞/24小时52C20-5-00136852C20-5-0.010.01 174452C20-5-0.020.02 1164352C20-5-0.050.05 2444952-3-5-0.10 0.1 3701952-3-5-0.20 0.2 6786752-3-5-0.4B 0.4 99919用增加的MTX浓度的选择成功地提高了细胞系HTREPO-52中hEPO的表达,观察到对于抗0.4μM MTX来说该细胞系中EPO产量增加了70倍。用Southern印迹在MTX抗性细胞系中进行分析证实hEPO基因座位扩增,它反映出激活的hEPO基因座位相对于其母体(未被击靶的)hEPO等位基因其拷贝数大约增加了10倍。
实施例7 通过插入基因组hEPO编码区上游1.8 kb的CMV启动子产生hEPO融合基因击靶质粒pREPO15的构建构建pREPO15首先是通过PCR扩增将CMV启动子与hGH外显子1融合。扩增来自hGH表达构建体pXGH308的1.6 kb片段,它具有的CMV启动子区始于基因库(Genbank)序列HS5MIEP的核苷酸546,终于核苷酸2105,利用寡核苷酸20和35已将所说的基因库序列HS5MIEP与始于基因库序列HUGHCSA的核苷酸5225并终于核苷酸7322的hGH序列融合。寡核苷酸20(35 bp,SEQ ID NO18)在相对于cap位点(基因库序列HEHCMVP1中)的-614处与CMV启动子杂交,并在其5′端包括一个SalI位点。寡核苷酸35(42 bp,SEQID NO19)与+966处的CMV启动子和邻接hGH外显子1退火,并在其5′端包括hEPO内含子1的前10个碱基对(含有拼接-供体位点部分)和一个HindIII位点。用HindIII和SalI消化所得的PCR片段,并用凝胶纯化。用XhoI和HindIII消化质粒pT163(实施例2),用凝胶纯化含有neo表达单位的大约1.1 kb片段。将1.6 kb CMV启动子/hGH外显子1/拼接-供体位点片段与1.2 kb neo片段连接起来,并插入到pBSIISK+(Str-agene,Inc)的HindIII位点。所得的中间质粒(命名为pBNCHS)含有一个在转录方向上与CMV启动子/hGH外显子1/拼接-供体位点片段的方向相对的neo表达单位。构建第二个中间质粒pREPO5.ΔHindIII,首先用HindIII消化pREPO5。该过程释放出1.9 kb和8.7kb两个片段,并且用凝胶纯化含有EPO击靶序列的8.7kb片段,通过自身连接而环化。所得的质粒pREPO5ΔHindIII仅含有通常存在于hEPO基因上游的非编码基因组DNA序列。它所包括的序列从相对于EPO外显子1的-5785~-1。用HindIII从pBNCHS中切除含neo、CMV启动子、hGH外显子1和拼接-供体位点的2.8 kb片段,并用凝胶纯化。该片段经DNA聚合酶I的Klenow片段(New εngland Biolabs,Inc.)处理而变成平头,并与经BglII消化且被平头的pREPO5ΔHindIII连接。用BglII在pREPO5ΔHindIII中hEPO外显子1上游的-1779 bp位置进行切割。所得的构建体pREPO15(图8)含有相对于hEPO编码区从-5786~-1779的EPO上游序列、neo表达单位、CMV启动子、hGH外显子1、拼接-供体位点和hEPO编码区上游从-1778~-1的序列,各元件以所列的顺序按照相对于hEPO上游区核苷酸序列的5′→3′方向组装。为了转染人细胞,用NotI和PvuI消化pREPO15以释放8.6 kb击靶片段。该击靶片段含有与hEPO基因上游DNA同源的分别4.0 kb和1.8 kb第一及第二击靶序列。
培养和转染细胞并鉴定表达EPO的被击靶克隆所有的细胞维持在37℃、5%CO2、98%湿度及含10%牛血清的DMEM(DMEM/10,HyClone Laboratories)的条件下。用100μg DNA在250V和960μF的条件下电穿孔在PBS(GIBCO)中的12×106细胞而完成对次级人包皮成纤维细胞的转染。将处理过的细胞以每150mm板1×106细胞的密度接种,第二天,将培养基更换为含0.8mg/mlG418(GIBCO)的DMEM/10。选择过程进行14天,此时再取样分析培养基中的EPO产量。用无菌的玻璃克隆柱(Bellco)分离培养板上经EPO ELISA(Genzyme Inc.)确定呈显有显著的hEPO含量(>5mU/ml)的所有集落,并转移到96孔培养板的各个孔中。培养1~2天后,在这些孔中取样用ELISA分析hEPO的产量。经培养繁殖所得的生产hEPO细胞株以备冻存、核酸分离及EPO产量定量之用。
HT 1080细胞(ATCC CCL 121)的转染,是通过用45μg DNA在450V和250μF的条件下处理PBS(GIBCO)中的12×106细胞来进行的。克隆的生长和鉴定如同上述对次级人包皮成纤维细胞一样处理。用有限稀释法分离产hEPO的克隆细胞系。首先将从初步选择平板上收集的集落以10~15集落/孔的密度铺于24孔板的各孔中。然后将产hEPO的汇集物以产生<1集落/孔的细胞密度在96孔板中铺板。增殖各个克隆以进行上述对人包皮成纤维细胞一样的进一步分析。
表达EPO克隆的特征pRE015不含有任何hEPO编码序列。在hEPO外显子1上游neo/CMV启动子/hGH外显子1/拼接-供体片段的击靶,通过从CMV启动子转录开始而产生hEPO表达,产生包括CMV序列、hGH外显子1和拼接-供体位点、hEPO序列上游的1.8 kb及正常的hEPO外显子、内含子和3′非转译序列的初级转录物。从邻接hGH外显子1的拼接-供体位点到下一个邻位于hEPO外显子2的下游拼接-受体位点进行拼接上述转录物。这将有效地产生一个由hEPO基因上游基因组序列、正常的hEPO启动子、hEPO外显子1和hEPO内含子1所组成的新内含子。在成熟的转录物中,hGH外显子1将替代hEPO外显子1。hEPO外显子1仅编码26氨基酸信号肽的前4 1/3氨基酸,它在被细胞分泌出之前从前体蛋白质上裂解掉。hGH外显子1编码hGH信号肽的前3 1/3氨基酸,它在被细胞分泌出之前出将从前体蛋白质中裂解掉。在hGH外显子1代替hEPO外显子1的信息转译过程中,将因此产生一种其中的信号肽为hGH和hEPO序列的嵌合体的蛋白质。通过正常的转译后裂解过程除去信号肽将产生一个成熟的hEPO分子,其初级序列难以与正常产物分开。
将pRPO015转染入人成纤维细胞引起这些细胞表达EPO。表5列出了用pREPO15在人成纤维细胞和HT 1080细胞中进行击靶实验的结果。发现在正常人成纤维细胞中的击靶频率是1/264 G418r集落,而用HT 1080细胞的击靶频率为1/450 G418r集落。定量分析得自每一上述细胞株的hEPO产量。在由转染人纤维细胞得到的一个hEPO产生株中所得的分泌量为7,679mU/106细胞/天(表5)。来自HT 1080细胞的激活hEPO细胞系的产量为12,582mU/106细胞/天(表5)。这些结果表明,对hEPO基因座位的激活是有效的,并导致hEPO以相对高的水平不断产生。用限制性酶和Southern杂交分析法证实了击靶过程发生于EPO基因座位。
对用pREPO15击靶的人成纤维细胞和HT 1080克隆进行Southern印迹分析。图9A表示母体和被击靶的hEPO基因座位的限制性图,而图9B表示对被击靶的人成纤维细胞克隆进行限制性酶和Southern杂交分析的结果。作为在hEPO基因座位击靶的结果,BglII/EcoRI和BamHI的消化物分别释放出5.8kb和6.6kb的片段(T1泳道)。这两个片段得自含有neo基因和CMV启动子序列的2.7 kb DNA的插入。因为两个hEPO等位基因中只有一个被击靶,所以在这些菌株和母体DNA中观察到反映未改变的hEPO基因座位的4.3 kb片段(BglII/EcoRI)或10.6 kb片段(BamHI)(泳道HF)。这些结果证明在hEPO基因座位发生的同源重组,导致指导产生人促红细胞生成素的新转录单位生产。寡核苷酸 序列205′ TTTTCTCGAG TCGACGACAT TGATTATTGA CTAGT(SEQ ID NO18)355′TTTTAAGCTT GAGTACTCAC CTGTAGCCAT GGTGGATCCC GT(SEQ ID NO19)表5 在人细胞中pREPO15的转染和hEPO表达的激活被转染的 被处理aG418rb含有EPO表细胞类型 的细胞 集落 达子的平板人成纤维细胞 3.3×107264 1HT 1080细胞 3.1×1072700 6hEPO表达子数 hEPO表达子数chEPO的表达/被处理的细胞/被处理的细胞(mU/106细胞/24小时)1/264 1/3.3×10776791/450 1/5.2×10612,582a通过计算2个平板上的集落数、平均其结果并外推至总的平板数而估算出。
b从含有G418r集落平板的培养基中取样进行EPO ELISA分析,那些显示出hEPO水平高于5mU/ml的被算作EPO激活现象。
c定量测定来自人成纤维细胞株、HF 342-15或HT 1080细胞系HTPREPO15-1-6-6的hEPO产量。
实施例8 通过插入基因组hEPO编码区的上游1.8kb CMV启动子而产生和扩增hEPO融合基因构建击靶质粒pREPO18通过在位于pREPO15的neo基因5′端ClaI位点处插入dhfr表达单位而构建pREPO18(图10)。为了获得dhfr表达单位,用EcoRI和SalI消化质粒构建体pF8CIS9080[Eaton et al.,Biochemistry258343-8347(1986)]。从该消化物中纯化含有dhfr表达单位的2kb片段,并通过用DNA聚合酶I的Klenow片段处理使之平头化。然后将ClaI接头(New England Biolabs,Inc.)连接至平头化的dhfr片段上。再用ClaI消化上述连接的产物,并与ClaI消化的pREPO15连接。将该连接物的等分转化入E.coli,并在氨苄青霉素选择平板上铺板。通过限制性酶的消化作用分析菌落以确定插入的dhfr片段的方向。有dhfr的其转录方向与neo基因的转录方向相对的一个质粒被命名为pREPO18(-)。有dhfr与neo基因具有相同转录方向的第二种质粒被命名为pREPO18(+)。
细胞培养,转染并鉴定表达EPO的被击靶克隆所有的细胞维持于37℃、5%CO2、98%湿度及含10%牛血清的DMEM(DMEM/10,HyClone Laboratories)的条件下。用45μg DNA在450V和250μF条件下经电穿孔处理PBS(GIBCO)中处理12×106细胞而进行对HT 1080细胞(ATCC CCL 121)的转染。以1×106细胞/150mm平板的密度接种经上述处理的细胞。第二天,将培养基更换为含0.8mg/ml G418(GIBCO)的DMEM/10。选择过程进行14天,在该时期取样分析培养基中hEPO的产量。用胰蛋白酶处理经hEPOELISA(Genzyme Inc.)分析确定为呈现有明显hEPO产量(>5mU/ml)的平板,并将细胞进行重新铺板以分离克隆。用有限稀释法分离生产hEPO克隆细胞系,首先是以10~15集落/孔的密度将克隆铺于24孔板的孔中,然后以<1集落/孔的细胞密度将来自产hEPO汇集物的细胞铺板于96孔板中。培养繁殖各个克隆以备冻存、核酸分离和hEPO产量定量分析之用。
通过氨甲蝶呤选择而分离含有扩增dhfr序列的细胞将在用pREPO18转染后产生hEPO的被击靶G418r细胞系以各种细胞密度铺板,以在氨甲蝶呤(MTX)中进行选择。在用某种MTX浓度进行选择后出现新克隆时,则对其测定hEPO产量,并在更高的MTX浓度(通常为原浓度的两倍)中以各种细胞密度重新铺板。重复上述过程直到达到所需的hEPO产量为止。在每一步的MTX抗性选择中,分离DNA和RNA,分别进行Southern和Northern印迹分析。
表达EPO的克隆的特征用具有两种不同dhfr方向的pREPO18转染HT 1080细胞。转染之前,用XbaI消化pREPO18(+)和pREPO18(-),释放出一个7.9 kb击靶片段,它依次含有hEPO外显子1上游基因组DNA的2.1 kb区(相对于hEPO ATG起始密码子从-3891~-1779)、含有dhfr基因的2 kb区、含neo基因的1.1 kb区、含有与hGH外显子1融合的CMV启动子的1.5kb区、10 bp的hEPO内含子1(含拼接-供体位点)和hEPO外显子1上游基因组DNA的1.1 kb区(相对于EPO ATG起始密码子从-1778~-678)。得自两个实验中的转染和击靶频率示于表6中。由这些实验中分离到5个初级G418r克隆。它们经培养基增殖以用于hEPO表达的定量分析(表7)。因为pREPO18含有dhfr基因,所以有可能如实施例6所述用MTX选择含有击靶构建体的扩增拷贝的细胞。用限制性酶和Southern杂交分析所证实的在hEPO基因座位被击入靶的G418r克隆按所述在MTX中进行分步选择。
表6 pREPO18在HT 1080细胞中击靶构建体消化DNA 受处理的细胞 G418r集落pREPO18XbaI 3.6×10616,980(-)pREPO18XbaI 3.6×10619,290(+)有hEPO表达 hEPO表达子被分析的子的平板/G418r集落初次克隆39 1/435 141 1/470 4
表7 用pREPO18击靶的HT 1080细胞系中的hEPO生产细胞系构建体 hEPO mU/106细胞/天18B3-147 pREPO18 (+)2475918B3-181 pREPO18 (+)2083118B3-145 pREPO18 (+)1758618B3-168 pREPO18 (+) 529318B3-119 pREPO18 (-) 2881实施例9 在永久化人细胞中激活和扩增内源性α-干扰素、GM-CSF、G-CSF和FSHβ基因利用本发明的方法和DNA构建体,能够激活并扩增许多种内源的细胞基因。下面描述了激活和扩增人α-干扰素(白细胞干扰素)、GM-CSF(粒细胞/巨噬细胞集落刺激因子)、G-CSF(粒细胞集落刺激因子)和FSHβ(卵泡刺激激素β亚单位)基因的一般性策略。
α-干扰素人α-干扰素基因(基因库序列HUMIFNAA)编码含有23个氨基酸信号肽的188氨基酸前体蛋白。该基因不含内含子。图11图示说明激活α-干扰素基因的一种策略。所设计的击靶构建体包括与该基因上游序列同源的第一击靶序列、一个可扩增的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个拼接-供体位点、一个内含子、一个拼接-受体位点和相当于第一击靶序列下游序列的第二击靶序列。为了避免不需要的ATG起始密码子,第二击靶序列将不应延伸到比相对于正常起始密码子的-107位更上游。
在所述的策略中,第一和第二击靶序列在正常的击靶基因中相互紧邻,但这并非是必需的(参见下文)。本文描述了可扩增的标志基因和适用于选择的可选择标志基因。可扩增的标志基因和可选择的标志基因可以是相同的基因,其位置可颠倒,并且其中一个或两者可以置于击靶构建体的内含子中。可选择的标志基因是可任选的,而可扩增标志基因仅在需要进行扩增反应时才是必需的。特异性CAP位点的掺入也是任选的。任选地,在击靶构建体中来自另一基因的外显子序列可以包括3′端至拼接-受体位点和5′端至第二击靶序列。调节区、CAP位点、拼接-供体位点、内含子和拼接受体位点可以作为完整的单位而从人伸长因子-1α(EF-1α;基因库序列HUMEF1A)基因或巨细胞病毒(CMV;基因库序列HEHCMVP1)紧靠着早期区分离出来,或者上述成分由从不同基因分离的合适成分组装起来。
利用本领域技术人员已知的重组DNA方法将相当于α-干扰素基因上游区的基因组DNA可用作击靶序列和击靶构建体的组装而进行。如本文所述,许多可选择的和可扩增的标志基因能用于击靶构建体中,并且激活及扩增反应在许多细胞类型中可有效地进行。利用实施例4所述方法,利用ELISA法测定人α-干扰素方法(BiosourceInternational,Camarillo,CA)可以完成对初级、次级或永久化人细胞的转染及对表达α-干扰素的同源重组体细胞的分离,另外,通过实施例1g和1j所述的PCR筛选法可以鉴定同源重组体细胞。如实施例6所述分离含有可扩增标志基因和被激活的α-干扰素基因位座的扩增拷贝的细胞。
在同源重组体细胞中产生了mRNA前体,它包括外源外显子、拼接-供体位点、内含子、拼接-受体位点、第二击靶序列和人α-干扰素编码区及3′非转译序列(图11)。对上述信息进行拼接,将产生能被转译以生产人α-干扰素的功能性mRNA。
内含子的大小及相对于基因编码区的调节区的位置是可变的,以使调节区发挥最优功能。在击靶构建体中可存在多个外显子。此外,第二击靶序列在正常基因中不须紧邻于第一击靶序列或在其附近,这样,在进行同源重组时会删去部分基因的正常上游区。
GM-CSF人GM-CSF基因(基因库序列HUMGMCSFG)编码含有17氨基酸信号肽的144氨基酸前体蛋白质。该基因含有4个外显子和3个内含子,且前体的N端50个氨基酸编码在第一个外显子中,图12图示说明激活GM-CSF基因的策略。在该策略中,击靶构建体被设计为包括与GM-CSF基因的上游序列同源的第一击靶序列、一个可扩增的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个编码等同于或在功能上等价于GM-CSF的前50个氨基酸的氨基酸序列的外显子、一个拼接-供体位点和对应于第一击靶序列下游序列的第二击靶序列。利用上述策略,同源重组体细胞产生的mRNA前体,相当于外源外显子和拼接-供体位点、第二击靶序列、第二击靶序列和GM-CSF基因的起始密码子之间的任何序列及GM-CSF基因的外显子、内含子和3′非转译区(图11)。对上述信息进行拼接导致内源GM-CSF基因的外显子2与外源外显子融合,它们在被转译时产生GM-CSF。
在上述策略中,第一和第二击靶序列在正常击靶基因中紧紧相邻,但这并非必需(参见下文)。本文描述了可扩增的标志基因和适用于选择的可选择标志基因。可扩增的标志基因和可选择的标志基因可以是相同的基因,或者其位置可以颠倒。可选择的标志基因是可任意选择的,而可扩增的标志基因只在需要进行扩增反应时才是必需的。可选择的标志基因和/或可扩增的标志基因可定位于击靶构建体中拼接-供体位点与第二击靶序列之间。特异性CAP位点的掺入是可任选的。调节区、CAP位点和拼接-供体位点可以作为完整的单位从人伸长因子1α(EF-1α;基因库序列HUMEF1A)基因或巨细胞病毒(CMV;基因库序列HEHCMVP1)紧靠早期区中分离出来,或者这些成份可以由从不同基因分离的合适成分(如mMT-1启动子和CAP位点及得自hGH或hEPO基因的外显子1和拼接供体位点)组装起来。
其它可利用方法例如,第一和第二击靶序列可以相当于GM-CSF基因第一内含子中的序列。另外,可以利用类似于对α-干扰素所述的击靶构建体,其中,击靶构建体被设计为包括与GM-CSF基因上游序列同源的第一击靶序列、一个可扩增的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个拼接-供体位点、一个内含子、一个拼接-受体位点和相当于第一击靶序列下游序列的第二击靶序列。
在任何情况下第二击靶序列都不必紧邻正常基因中的第一击靶序列或在其附近,这样的话,在进行同源重组时基因的正常上游区部分将被删掉。此外,在击靶构建体中可存在多个非编码或编码外显子。利用本领域技术人员已知的重组体DNA,对相当于人GM-CSF基因的上游区或内含子区的基因DNA用作击靶序列和组装击靶构建体。如本文所述,许多可选择的和可扩增的标志基因可被用于击靶构建体中,并且激活过程可以在许多细胞类型中有效地进行。借助实施例4所述方法,使用ELISA测定人GM-CSF方法(R&D Systems。Minneapolis,MN)可以实施初级、次级或永久化人细胞转染和分离表达GM-CSF的同源重组体细胞。另外,利用上述的PCR筛选法可以鉴定同源重组体细胞。分离含有可扩增标志基因和激活的GM-CSF基因位座的扩增拷贝的细胞可按前述方法进行。
G-CSF人G-CSF基因(基因库序列HUMGCSFG)编码含有30氨基酸信号肽的204~207氨基酸前体蛋白质。该基因含有5个外显子和4个内含子。第一个外显子编码信号肽的13个氨基酸。图13图示说明激活G-CSF基因的策略。击靶构建体被设计为包括与G-CSF基因上游序列同源的第一击靶序列、一个可扩增的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个编码与G-CSF信号肽的前13个氨基酸序列相同或在功能上等价的氨基酸序列的外显子、一个拼接-供体位点和与第一击靶序列的下游序列相应的第二击靶序列。借助于上述策略,同源重组体细胞产生一个mRNA前体,它相应于外源外显子和拼接-供体位点,第二击靶序列、G-CSF基因起始密码子与第二击靶序列间的任何序列,以及G-CSF基因的外显子、内含子和3′非转译区(图13)。对上述信息进行拼接导致外源性外显子与内源性G-CSF基因的外显子2融合,它们在被转译时将产生G-CSF。用存在于外源性外显子中的序列能够对正常G-CSF信号肽的前13个氨基酸进行功能性取代,这就使得任何人都能对信号肽进行修饰,并因此蛋白质的分泌特性产生。
在上述策略中,第一和第二击靶序列正常的击靶基因中是紧邻的,但这并非必要。第二击靶序列在正常基因中不必紧邻于第一击靶序列或在其附近,这样的话,在进行同源重组时删去基因的正常上游区部分。可扩增标志基因和可选择的标志基因可以是相同的基因,或者其位置可以被颠倒。可选择的标志基因是可任意选择的,而可扩增的标志基因只在需要进行扩增反应时才必需。可选择的标志基因和/或可扩增的标志基因可以定位在击靶构建体的拼接-供体位点与第二击靶序列之间。特异性CAP位点的掺入是可以随意选择的。调节区、CAP位点和拼接-供体位点可以作为完整的单位从人伸长因子-1α(EF-1α;基因库序列HUMEF1A)基因或巨细胞病毒(CMV;基因库序列HEHCMVP1)紧靠早期区中分离出来,或者这些成分可以由从不同基因分离的合适成分(如mMT-I启动子和CAP位点,得自hGH或EPO基因的外显子1和拼接-供体位点)组装起来。在击靶构建体中可以使用多个编码的或非编码的外源外显子,只要在进行拼接时,存在于有成熟蛋白质的码内的ATG起始密码子被包括在其中的一个外显子中即可。
其它可利用的方法,例如第一和第二击靶序列可以相当于G-CSF基因的第一内含子中的序列。另外,可以使用类似于所述α-干扰素的击靶构建体,其中,击靶构建体被设计为包括与G-CSF基因上游序列同源的第一击靶序列、一个可扩坟的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个拼接-供体位点、一个内含子、一个拼接-受体位点和对应于第一击靶序列下游序列的第二击靶序列。
用本领域技术人员已知的重组DNA方法,可将相应于人G-CSF基因的上游区或内含子区的基因组DNA用作击靶序列和对击靶构建体的组装可进行实施。如本文所述,在击靶构建体中可使用许多可选择和可扩增的标志基因,并且激活过程出可在许多细胞类型中有效地进行。利用实施例4所述方法,使用ELISA测定人G-CSF法(R&DSystems,Minneapolis,MN)可进行初级、次级或永久化人细胞的转染和表达G-CSF的同源重组体细胞的分离,此外,借助于前述的PCR筛选也可鉴定同源重组体细胞。用前述方法分离含有可扩增标志基因和被激活的α-干扰素基因位座的扩增拷贝的细胞。
FSHβ人FSHβ基因(基因库序列HUMFSH1)编码含有16氨基酸信号肽的129氨基酸前体蛋白质。该基因含有三个个显子和两个内含子,其中第一外显子是非编码的外显子。用多种策略可以达到对FSHβ的激活。图14图示了一种激活策略。在这一策略中,击靶构建体被设计为包括适与FSHβ基因上游序列同源的第一击靶序列、一个可扩增的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个外显子、一个拼接-供体位点和相应于第一击靶序列下游序列的第二击靶序列。借助于上述策略,同源重组体细胞产生一个mRNA前体,它相当于外源外显子和拼接-供体位点、第二击靶序列、第二靶序列和FSHβ基因起始密码子之间的任何序列,以及FSHβ基因的外显子、内含子和3′非转译区(图14)。对上述信息进行拼接将导致外源外显子与内源FSHβ基因的外显子2融合,它们在被转译时能产生FSHβ。在上述策略中,第一和第二击靶序列在正常击靶基因中是紧邻的,但这并非必需的(参见下文)。
其它可利用的方法,例如第一和第二击靶序列能够对应于FSHβ基因第一内含子中的序列。此外,可以使用类似于对α-干扰素所述的击靶构建体。在这一策略中,击靶构建体被设计为包括与FSHβ基因上游序列同源的第一击靶序列、一个可扩增的标志基因、一个可选择的标志基因、一个调节区、一个CAP位点、一个拼接-供体位点、一个内含子、一个拼接受体位点和对应于第一击靶序列下游序列的第二击靶序列。第二击靶序列不应延伸至比相对于正常FSHβ转录起始位点的-40位更上游区,以避免不需要的ATG起始密码子。在同源重组体细胞中,所产生的mRNA前体包括外源外显子、拼接-供体位点、内含子、拼接-受体位点、第二击靶序列和人FSHβ编码外显子、内含子及3′未转译序列、对这些信息进行拼接将产生能被转译为生产人FSHβ的功能性mRNA。内含子的大小和因此所产生的调节区相对于基因编码区的位置是可变的,以使调节区发挥最优功能。
在任何一个激活策略中,第二击靶序列不必位于紧邻正常基因中的第一击靶序列或在其附近,这样的话,在进行同源重组时,将删除基因的正常上游区部分。而且,一个击靶序列可以是基因的上游,而一个击靶序列可以存在于FSHβ基因的一个外显子或内含子内。
可扩增的标志基因和可选择的标志基因可以是相同的基因,其位置可以颠倒,并且其中之一或两者可存在于击靶构建体的内含子中。本文描述了可扩增的标志基因和适于选择的可选择的标志基因。可选择的标志基因是可任选的,而可扩增的标志基因只在需要进行扩增反应时才是必需的。特异性CAP位点的掺入是可随意选择的。任选地,来自另一基因的外显子序列可以包括在击靶构建体3′至拼接-受体位点和5′至第二击靶序列。调节区、CAP位点、外显子、拼接-供体位点、内含子和拼接-受体位点可以作为完整的单位从人伸长因子-1α(EF-1α;基因库序列HUMEF1A)基因或巨细胞病毒(CMV;基因库序列HEHCMVP1)紧靠早期区中分离出来,或者这些成分由从不同基因中分离的合适成分组装起来。在任何情况下,外源外显子可与正常FSHβ基因的第一外显子相同或不同,并且在击靶构建体中可存在多个外显子。
利用本领域技术人员已知的重组技术,可将相应于FSHβ基因上游区的基因组DNA用作击靶序列和击靶构建体可进行组装。如本文所述,许多可选择的和可扩增的标志基因可被用于击靶构建体中,并且激活过程可以在许多细胞类型中有效地进行。如果需要的话,可以在表达人糖蛋白α亚单位的细胞类型中生产被激活的FSHβ基因产物,糖蛋白α亚单位的产物与FSHβ基因产物形成杂二聚体。这可以是一个天然存在的细胞株或细胞系。此外,人糖蛋白α亚单位基因(基因库序列HUMGLYCA1)能与FSHβ基因产物共同表达。而上述共同表达由在适宜启动子调控下的人糖蛋白α亚单位基因或cDNA来完成,或者是通过本文所述方法由人糖蛋白α亚单位的激活来完成。利用前述方法使用ELISA测定人FSHβ(Accurate Chemicaland Scientific,Westbury,NY)可以进行对初级、次级或永久化人细胞的转染和对表达FSHβ的同源重组体细胞的分离。另外,利用前述PCR筛选法也可以鉴定同源重组体细胞。如前所述分离含有可扩增的标志基因和被激活的α-干扰素基因位座的扩增拷贝的细胞。
本领域的技术人员将认识到,或可利用不超出常规的实验而能够确定本文所述发明的具体实施方案的许多等价物。这类等价物将被所附权利要求所包括。
权利要求
1.一种DNA构建体,其在DNA构建体与细胞染色体DNA内的靶位点同源重组时改变细胞内的靶基因的表达,DNA构建体包括(a)与靶位点同源的导向序列;(b)外源调节序列;(c)外显子;(d)外显子未配对的3’末端的未配对的剪接供体位点;其中,导向序列与靶位点同源重组后,除了靶基因的所有内生外显子外,细胞的染色体DNA还包括构建体-衍生的外显子,其中靶基因编码从下列组中选取的蛋白质,包括γ-干扰素,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
2.依据权利要求1的DNA构建体,其中构建体衍生外显子包括与靶基因的第一内生外显子的DNA序列不同的DNA序列。
3.一种DNA构建体,其在DNA构建体与细胞染色体DNA内的靶位点同源重组时,改变细胞内的靶基因的表达,DNA构建体包括(a)与靶位点同源的导向序列;(b)外源调节序列;(c)外显子;(d)在外显子3’末端的未配对的剪接供体位点;其中,在导向序列与靶位点同源重组后,(b)-(d)位于靶基因的转录起始位点的上游,其中靶基因编码从下列组中选取的蛋白质,包括γ-干扰素,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
4.依据权利要求3的DNA构建体,其中外显子包括与靶基因的第一内生外显子的DNA序列不同的DNA序列。
5.依据权利要求3的DNA构建体,其中靶基因编码α-半乳糖苷酶。
6.依据权利要求3的DNA构建体,其中构建体衍生的外显子与FSHβ基因的第一外显子相同。
7.依据权利要求6的DNA构建体,其中所获得的细胞表达人类糖蛋白α-亚单位。
8.依据权利要求6的DNA构建体,其中细胞在外源启动子的控制下表达人类糖蛋白α-亚单位。
9.依据权利要求3的DNA构建体,其中靶基因表达GM-CSF。
10.依据权利要求9的DNA构建体,其中构建体衍生的外显子编码GM-CSF前体蛋白的首先的50个氨基酸。
11.依据权利要求9的DNA构建体,其中构建体衍生的外显子编码包括官能信号肽的序列。
12.依据权利要求3的DNA构建体,其中靶基因编码G-CSF。
13.依据权利要求12的DNA构建体,其中构建体衍生的外显子编码G-CSF信号肽的首先的13个氨基酸。
14.一种DNA构建体,其在DNA构建体与细胞染色体DNA内的靶位点同源重组时,改变细胞内的靶基因的表达,DNA构建体包括(a)与靶位点同源的导向序列;(b)外源调节序列;(c)外显子;(d)外显子3’末端的未配对剪接-供体位点;其中,在导向序列与靶位点同源重组后,(b)-(d)位于靶基因的转录起始位点的上游,其中外源调节序列是腺病毒基因的调节序列,胶原质基因的调节序列,肌动蛋白基因的调节序列,HMG-CoA还原酶基因的调节序列,或EF-1α基因的调节序列。
15.一种改变细胞内靶基因表达的方法,方法包括步骤(a)提供细胞,其基因组包括(i)含有内生调节区域的靶基因;(ii)靶位点;(b)提供DNA构建体包括(i)与靶位点同源的导向序列;(ii)外源调节序列;(iii)外显子;(iv)外显子3’末端的未配对的剪接供体位点;(c)用DNA构建体转染细胞,从而产生转染细胞;(d)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,除了靶基因的所有内生外显子外,其基因组包括外源调节序列,构建体衍生外显子和构建体衍生剪接供体位点;(e)将同源重组细胞保持在适于转录的条件下,在外源调节序列的控制下,产生构建体衍生外显子,靶基因和位于构建体衍生外显子和靶基因之间的任何序列的转录体,其中对应于构建体衍生剪接供体位点的转录体RNA与在靶基因内对应于一个位点的转录体的剪接受体位点定向剪接,其中靶基因编码从下列组中选取的蛋白质,包括γ-干扰素,神经生长因子,白细胞介素1,白细胞介素2,白细胞介素3,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
16.依据权利要求15的方法,进一步包括步骤(f)将同源重组细胞保持在适于转录体剪接和翻译的条件下;(g)证实产生了转录体的翻译产品。
17.一种改变细胞内靶基因表达的方法,方法包括步骤(a)提供细胞,其基因组包括(i)含有内生调节区域的靶基因;(ii)靶位点;(b)提供DNA构建体包括(i)与靶位点同源的导向序列;(ii)外源调节序列;(iii)外显子;(iv)外显子3’末端的未配对的剪接供体位点;(c)用DNA构建体转染细胞,从而产生转染细胞;(d)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,其基因组包括外源调节序列,构建体衍生外显子和构建体衍生剪接供体位点,所有都位于靶基因的内生转录起始位点的上游;(e)将同源重组细胞保持在适于转录的条件下,在外源调节序列的控制下,产生构建体衍生外显子,靶基因和位于构建体衍生外显子和靶基因之间的任何序列的转录体,其中对应于构建体衍生剪接供体位点的转录体RNA与在靶基因内对应于一个位点的转录体的剪接受体位点定向剪接,其中靶基因编码从下列组中选取的蛋白质,包括γ-干扰素,神经生长因子,白细胞介素1,白细胞介素2,白细胞介素3,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
18.依据权利要求17的方法,进一步包括步骤(f)将同源重组细胞保持在适于转录体剪接和翻译的条件下;(g)证实产生了转录体的翻译产品。
19.一种改变细胞内靶基因表达的方法,方法包括步骤(a)提供细胞,其基因组包括(i)含有内生调节区域的靶基因;(ii)靶位点;(b)提供DNA构建体包括(i)与靶位点同源的导向序列;(ii)外源调节序列;(iii)外显子;(iv)外显子3’末端的未配对的剪接供体位点;(c)用DNA构建体转染细胞,从而产生转染细胞;(d)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,其基因组包括外源调节序列,构建体衍生外显子和构建体衍生剪接供体位点,所有都位于靶基因的内生转录起始位点的上游;(e)将同源重组细胞保持在适于转录的条件下,在外源调节序列的控制下,产生构建体衍生外显子,靶基因和位于构建体衍生外显子和靶基因之间的任何序列的转录体,其中对应于构建体衍生剪接供体位点的转录体RNA与在靶基因内对应于一个位点的转录体的剪接受体位点定向剪接,其中外源调节序列是腺病毒基因的调节序列,胶原质基因的调节序列,肌动蛋白基因的调节序列,免疫球蛋白基因的调节序列,HMG-CoA还原酶基因的调节序列,或EF-1α基因的调节序列。
20.依据权利要求19的方法,进一步包括步骤(f)将同源重组细胞保持在适于转录体剪接和翻译的条件下;(g)证实产生了转录体的翻译产品。
21.一种培养的脊椎动物细胞,在其基因组中掺入转录单位,其中转录单位包括外源调节序列,外源外显子,和在外源外显子3’末端的剪接供体位点,所有都位于内生基因的内生转录起始位点的上游,剪接供体位点与内生基因的第二内生外显子的内生剪接受体位点可操作地结合,其中内生基因编码从下列组中选取的蛋白质,包括γ-干扰素,神经生长因子,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
22.一种培养的脊椎动物细胞,在其基因组中掺入转录单位,转录单位包括外源调节序列,外源外显子,和在外源外显子3’末端的剪接供体位点,剪接供体位点与内生基因的第二内生外显子的内生剪接受体位点可操作地结合,其中除了存在于内生基因中的所有内生外显子外,细胞还包括外源外显子,其中内生基因编码从下列组中选取的蛋白质,包括γ-干扰素,神经生长因子,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
23.依据权利要求22的培养的脊椎动物细胞,其中细胞是从下列组中选取的,包括HT1080细胞,HeLa细胞,HeLa细胞衍生物,MCF-7乳腺癌细胞,K-562白血病细胞,KB癌细胞,2780AD卵巢癌细胞,Raji细胞,Jurkat细胞,Namalwa细胞,HL-60细胞,Daudi细胞,RPMI 8226细胞,U-937细胞,Bows黑素瘤细胞,WI-38VA13亚种系细胞和MOLT-4细胞。
24.依据权利要求22的培养的脊椎动物细胞,其中外源调节序列是腺病毒基因的调节序列,胶原质基因的调节序列,肌动蛋白基因的调节序列,免疫球蛋白基因的调节序列,HMG-CoA还原酶基因的调节序列,或EF-1α基因的调节序列。
25.一种DNA构建体,其在DNA构建体与细胞染色体DNA内的靶位点同源重组时,改变细胞内的靶基因的表达,靶位点位于靶基因的内生转录起始位点的上游,DNA构建体包括(a)与靶位点同源的导向序列;(b)外源调节序列;(c)外显子;(d)剪接供体位点;(e)内含子;(f)剪接受体位点;其中,由于同源重组,外源调节序列定位控制包括(c)-(f)的序列和靶基因的全部编码序列的转录。
26.依据权利要求25的DNA构建体,其中在同源重组后,(b)-(f)位于靶基因的内生调节序列的上游。
27.依据权利要求25的DNA构建体,其中构建体进一步包括与靶基因的内生调节序列的上游序列同源的第二导向序列。
28.依据权利要求25的DNA构建体,其中靶基因编码治疗性蛋白质。
29.依据权利要求25的DNA构建体,其中靶基因编码激素,细胞因子,抗原,抗体,酶,凝血因子,运输蛋白质,受体,调节蛋白质,结构蛋白质,或转录因子。
30.依据权利要求25的DNA构建体,其中靶基因编码从下列组中选取的蛋白质,包括调钙素,生长激素,胰岛素,促胰岛素,类胰岛素生长因子,甲状旁腺激素,α-干扰素,β-干扰素,γ-干扰素,神经生长因子,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),免疫球蛋白,催化抗体,蛋白激酶C,葡糖脑苷脂酶,过氧化物歧化酶,组织血纤维蛋白溶酶激活剂,尿激酶,抗凝血酶III,DNA-se,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子VIII,血液凝血因子IX,血液凝血因子X,血液凝血因子XIII,脱脂蛋白E,脱脂蛋白A-I,珠蛋白,低密度脂蛋白受体,IL-2受体,IL-2拮抗剂,α-1抗胰蛋白酶,免疫反应修饰剂和可溶CD4。
31.依据权利要求25的DNA构建体,其中靶基因编码α-半乳糖苷酶。
32.依据权利要求25的DNA构建体,其中靶基因编码α-干扰素。
33.依据权利要求25的DNA构建体,其中靶基因编码葡糖脑苷脂酶。
34.依据权利要求25的DNA构建体,其中外源调节序列是启动子,增强子,骨架-连接区域,或转录因子结合位点。
35.依据权利要求34的DNA构建体,进一步包括第二调节序列。
36.依据权利要求34的DNA构建体,其中外源调节序列是腺病毒基因的调节序列,SV-40基因的调节序列,或细胞巨化病毒基因的调节序列。
37.依据权利要求34的DNA构建体,其中调节序列是鼠金属硫因-I基因的调节序列,胶原质基因的调节序列,肌动蛋白基因的调节序列,免疫球蛋白基因的调节序列,HMG-CoA还原酶基因的调节序列,或EF-1α基因的调节序列。
38.依据权利要求25的DNA构建体,进一步包括一个基因。
39.依据权利要求25的DNA构建体,进一步包括一个或多个可选取的标记基因。
40.依据权利要求39的DNA构建体,进一步包括一个可扩增的标记基因。
41.一种改变细胞基因组中靶基因表达的方法,包括步骤(a)用DNA构建体将细胞转染,DNA构建体包括(i)导向序列;(ii)外源调节序列;(iii)外显子;(iv)剪接供体位点;(v)内含子;(vi)剪接受体位点,从而产生转染细胞;(b)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,细胞中外源调节序列定位控制包括(iii)-(vi)的序列和靶基因编码序列的转录。(c)将同源重组细胞保持在适于转录的条件下,在外源调节序列的控制下,从而产生转录体。
42.依据权利要求41的方法,其中外显子包括CAP位点。
43.依据权利要求42的方法,其中外显子包括核苷酸序列ATG。
44.一种融合蛋白质,依据权利要求43制备并含有由DNA构建体的外显子编码的第一氨基酸序列和由靶基因编码的第二氨基酸序列。
45.依据权利要求41的方法,其中导向序列与靶基因的内生调节序列的上游序列同源。
46.依据权利要求41的方法,其中构建体进一步包括与靶基因的内生调节序列的上游序列同源的第二导向序列。
47.依据权利要求41的方法,其中细胞是人类细胞。
48.依据权利要求41的方法,其中靶基因编码治疗性蛋白质。
49.依据权利要求41的方法,其中靶基因编码激素,细胞因子,抗原,抗体,酶,凝血因子,运输蛋白质,受体,调节蛋白质,结构蛋白质,或转录因子。
50.依据权利要求41的方法,其中靶基因编码从下列组中选取的蛋白质,包括调钙素,生长激素,胰岛素,促胰岛素,类胰岛素生长因子,甲状旁腺激素,α-干扰素,β-干扰素,γ-干扰素,神经生长因子,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),免疫球蛋白,催化抗体,蛋白激酶C,葡糖脑苷脂酶,过氧化物歧化酶,组织血纤维蛋白溶酶激活剂,尿激酶,抗凝血酶III,DNA-se,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子VIII,血液凝血因子IX,血液凝血因子X,血液凝血因子XIII,脱脂蛋白E,脱脂蛋白A-I,珠蛋白,低密度脂蛋白受体,IL-2受体,IL-2拮抗剂,α-1抗胰蛋白酶,免疫反应修饰剂和可溶CD4。
51.依据权利要求41的方法,其中靶基因编码α-半乳糖苷酶。
52.依据权利要求41的方法,其中靶基因编码α-干扰素。
53.依据权利要求41的方法,其中靶基因编码葡糖脑苷脂酶。
54.依据权利要求41的方法,其中外源调节序列是启动子,增强子,骨架-连接区域,或转录因子结合位点。
55.依据权利要求54的方法,进一步包括第二调节序列。
56.依据权利要求54的方法,其中外源调节序列是腺病毒基因的调节序列,SV-40基因的调节序列,或细胞巨化病毒基因的调节序列。
57.依据权利要求54的方法,其中调节序列是鼠金属硫因-I基因的调节序列,胶原质基因的调节序列,肌动蛋白基因的调节序列,免疫球蛋白基因的调节序列,HMG-CoA还原酶基因的调节序列,或EF-1α基因的调节序列。
58.依据权利要求41的方法,进一步包括步骤(f)将同源重组细胞保持在适于转录体剪接和翻译的条件下;(g)证实产生了转录体的翻译产品。
59.依据权利要求58制备的葡糖脑苷脂酶。
60.一种培养的脊椎动物细胞,在其基因组中掺入转录单位,其中转录单位包括外源调节序列,外源外显子,剪接供体位点,内含子,和剪接受体位点,所有都位于内生基因的内生转录起始位点的上游,这样外源调节序列定位控制包括外源外显子,剪接供体位点,内含子,剪接受体位点的序列和靶基因编码序列的转录,从而产生转录体。
61.依据权利要求60的培养的脊椎动物细胞,其中外源外显子包括CAP位点。
62.依据权利要求60的培养的脊椎动物细胞,其中外源调节序列,外源外显子,和剪接供体位点在内生基因的编码序列的上游。
63.依据权利要求60的培养的脊椎动物细胞,其中内生基因的内生调节序列是缺失的。
64.依据权利要求60的培养的脊椎动物细胞,其中内生基因的第一内生外显子是缺失的。
65.依据权利要求60的培养的脊椎动物细胞,其中内生基因编码激素,细胞因子,抗原,抗体,酶,凝血因子,运输蛋白质,受体,调节蛋白质,结构蛋白质,或转录因子。
66.依据权利要求60的培养的脊椎动物细胞,其中内生基因编码从下列组中选取的蛋白质,包括调钙素,生长激素,胰岛素,促胰岛素,类胰岛素生长因子,甲状旁腺激素,α-干扰素,β-干扰素,γ-干扰素,神经生长因子,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),免疫球蛋白,催化抗体,蛋白激酶C,葡糖脑苷脂酶,过氧化物歧化酶,组织血纤维蛋白溶酶激活剂,尿激酶,抗凝血酶III,DNA-se,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子VIII,血液凝血因子IX,血液凝血因子X,血液凝血因子XIII,脱脂蛋白E,脱脂蛋白A-I,珠蛋白,低密度脂蛋白受体,IL-2受体,IL-2拮抗剂,α-1抗胰蛋白酶,免疫反应修饰剂和可溶CD4。
67.依据权利要求60的培养的脊椎动物细胞,其中内生基因编码α-干扰素。
68.依据权利要求60的培养的脊椎动物细胞,其中内生基因编码α-半乳糖苷酶。
69.依据权利要求60的培养的脊椎动物细胞,其中内生基因编码葡糖脑苷脂酶。
70.一种植物或真菌源培养细胞,在其基因组中掺入转录单位,其中转录单位包括外源调节序列,外源外显子,剪接供体位点,内含子,和剪接受体位点,所有都位于内生基因的内生转录起始位点的上游,这样外源调节序列定位控制包括外源外显子,剪接供体位点,内含子,剪接受体位点的序列和靶基因编码序列的转录,从而产生转录体。
71.依据权利要求60的培养的脊椎动物细胞,其中细胞是哺乳动物细胞。
72.依据权利要求71的培养的脊椎动物细胞,其中细胞是原生或次生哺乳动物细胞。
73.依据权利要求71的培养的脊椎动物细胞,其中细胞是原生或次生人类细胞。
74.依据权利要求60的培养的脊椎动物细胞,其中细胞是无限增殖化哺乳动物细胞。
75.依据权利要求74的培养的脊椎动物细胞,其中细胞是无限增殖化人类细胞。
76.依据权利要求60的培养的脊椎动物细胞,其中细胞是从下列组中选取的,包括HeLa细胞,HeLa细胞衍生物,MCF-7乳腺癌细胞,K-562白血病细胞,KB癌细胞,2780AD卵巢癌细胞,Raji细胞,Jurkat细胞,Namalwa细胞,HL-60细胞,Daudi细胞,RPMI 8226细胞,U-937细胞,Bows黑素瘤细胞,WI-38VA13亚种系细胞和MOLT-4细胞。
77.依据权利要求60的培养的脊椎动物细胞,其中细胞是HT1080细胞。
78.依据权利要求60的培养的脊椎动物细胞,其中细胞表达治疗性蛋白质,蛋白质通过转录体翻译制备。
79.依据权利要求60的培养的脊椎动物细胞,其中外源调节序列是启动子,增强子,骨架-连接区域,或转录因子结合位点。
80.依据权利要求79的培养的脊椎动物细胞,其中外源调节序列是腺病毒基因的调节序列,SV-40基因的调节序列,或细胞巨化病毒基因的调节序列。
81.依据权利要求79的培养的脊椎动物细胞,其中外源调节序列是鼠金属硫因-I基因的调节序列,胶原质基因的调节序列,肌动蛋白基因的调节序列,免疫球蛋白基因的调节序列,HMG-CoA还原酶基因的调节序列,或EF-1α基因的调节序列。
82.一种制备同源重组细胞的方法,包括步骤(a)提供细胞,其基因组包括(i)含有内生调节区域的靶基因;(ii)在靶基因内或上游的靶位点;(b)提供DNA构建体,包括(i)与靶位点同源的导向序列;(ii)外源调节序列;(iii)外显子;(iv)剪接供体位点;(v)内含子;(vi)剪接受体位点,(c)用DNA构建体转染细胞,从而产生转染细胞;(d)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,除了靶基因的所有内生外显子外,细胞基因组包括(ii)-(vi)。
83.依据权利要求82的方法制备的同源重组细胞。
84.一种改变细胞内靶基因表达的方法,包括步骤(a)用DNA构建体转染细胞,构建体包括(i)导向序列;(ii)调节序列;(iii)外显子;(iv)剪接供体位点;(v)内含子;(vi)剪接受体位点,从而产生转染细胞;(b)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,在其中外源调节序列定位控制包括(iii)-(vi)的序列和靶基因全部编码序列的转录;(c)将同源重组细胞保持在适于外源调节序列表达的条件下。
85.一种改变细胞内靶基因表达的方法,包括步骤(a)提供细胞,其基因组包括(i)靶基因;(ii)在靶基因内或上游的靶位点;(b)提供DNA构建体,包括(i)与靶位点同源的导向序列;(ii)从哺乳动物肌动蛋白或胶原质基因获得的启动子;(c)用DNA构建体转染细胞,从而产生转染细胞;(d)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,细胞的基因组含有定位启动子控制靶基因的转录;(e)将同源重组细胞保持在在启动子控制下适于靶基因转录的条件下。
86.一种培养的脊椎动物细胞,其基因组中掺入含有外源或胶原质启动子的定位控制内生基因转录的新型转录单位,其中内生基因既不编码肌动蛋白也不编码胶原质。
87.一种改变细胞染色体内靶基因表达的方法,包括步骤(a)用DNA构建体转染细胞,包括(i)与靶基因的编码区域内或上游的基因组DNA同源的导向序列;(ii)肌动蛋白或胶原质启动子;(iii)外显子;(iv)外显子3’末端的未配对的剪接供体位点;从而产生转染细胞;(b)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞;(c)将同源重组细胞保持在启动子控制下的适于靶基因表达的条件下。
88.一种通过改变细胞内编码蛋白质的靶基因的表达制备蛋白质的方法,包括步骤(a)用DNA构建体转染细胞,DNA构建体包括(i)与靶基因的编码区域内或上游的基因组DNA同源的导向序列;(ii)肌动蛋白或胶原质启动子;从而产生转染细胞;(b)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞;(c)将同源重组细胞保持在启动子控制下的适于蛋白质表达的条件下,其中靶基因既不编码肌动蛋白也不编码胶原质。
89.一种给哺乳动物提供蛋白质的方法,包括给哺乳动物细胞引入权利要求22-24的任何一个的细胞,其中内生基因编码蛋白质。
90.依据权利要求89的方法,其中细胞在引入到哺乳动物前封存在允许蛋白质从屏障装置内部向屏障装置外部通过的屏障装置内。
91.依据权利要求90的方法,其中屏障装置可防止细胞从屏障装置中溢出。
92.依据权利要求89的方法,其中DNA构建体进一步包括编码可扩增标记的,可选取含有多拷贝编码可扩增标记序列的细胞的序列;在引入到哺乳动物前,将细胞在选取含有多拷贝编码可扩增标记序列的细胞的条件下培养。
93.依据权利要求92的方法,其中可扩增标记是从下列组中选取的,包括二氢叶酸还原酶,腺苷脱氨酶,三官能酶-氨甲酰磷酸合成酶-天冬氨酸转氨甲酰酶和二氢乳清酸酶(CAD)。
94.依据权利要求89的方法,其中细胞是人类细胞。
95.依据权利要求89的方法,其中细胞是原生或次生细胞。
96.依据权利要求89的方法,其中细胞是无限增殖化细胞。
97.依据权利要求89的方法,其中细胞是哺乳动物成纤维细胞。
98.依据权利要求89的方法,其中细胞是人类成纤维细胞的原生或次生细胞。
99.一种制备蛋白质的方法,包括(a)提供HT1080细胞,含有包括与编码蛋白质的序列可操作地结合的外源调节区域的DNA,(b)在适于制备蛋白质的条件下培养细胞,从而产生蛋白质,(c)证实产生了蛋白质,其中,蛋白质是从下列组中选取的,包括α-干扰素,β-干扰素,γ-干扰素,神经生长因子,FSHβ,TGF-β,肿瘤坏死因子,胰高血糖素,骨生长因子-2,骨生长因子-7,TSH-β,白细胞介素1,白细胞介素2,白细胞介素3,白细胞介素6,白细胞介素11,白细胞介素12,GSF-粒细胞(G-CSF),CSF-巨噬细胞(M-CSF),CSF-粒细胞/巨噬细胞(GM-CSF),蛋白激酶C,尿激酶,抗凝血酶III,DNA-se,α-半乳糖苷酶,酪氨酸羟化酶,血液凝血因子V,血液凝血因子VII,血液凝血因子X,血液凝血因子XIII,IL-2拮抗剂和可溶CD4。
100.依据权利要求99的方法,其中包括(i)外源调节区域;(ii)编码蛋白质的序列,的DNA通过转染引入到HT1080细胞的前体中。
101.依据权利要求99的方法,其中蛋白质是血液凝血因子VIII。
102.依据权利要求99的方法,其中蛋白质是血液凝血因子IX。
103.DNA质粒pREPO18。
104.依据权利要求25的DNA构建体,其中靶基因编码促血红细胞生成素。
105.依据权利要求41的方法,其中靶基因编码促血红细胞生成素。
106.依据权利要求60的培养的脊椎动物细胞,其中内生基因编码促血红细胞生成素。
107.一种培养的植物或真菌源细胞,其基因组中掺入转录单位,其中转录单位包括外源调节序列,外源外显子,和外源外显子的3’末端的剪接供体位点,所有都位于内生基因的内生转录起始位点的上游,剪接供体位点与内生基因的第二内生外显子的内生剪接受体位点可操作地结合。
108.一种给哺乳动物提供蛋白质的方法,包括给哺乳动物引入权利要求60-81,83,86,和107的任何一个的细胞,其中内生基因编码蛋白质。
109.依据权利要求108的方法,其中细胞在引入到哺乳动物前封存在允许蛋白质从屏障装置内部向屏障装置外部通过的屏障装置内。
110.依据权利要求109的方法,其中屏障装置可防止细胞从屏障装置中溢出。
111.依据权利要求108的方法,其中DNA构建体进一步包括编码可扩增标记的,可选取含有多拷贝编码可扩增标记序列的细胞的序列;在引入到哺乳动物前,将细胞在选取含有多拷贝编码可扩增标记序列的细胞的条件下培养。
112.依据权利要求111的方法,其中可扩增标记是从下列组中选取的,包括二氢叶酸还原酶,腺苷脱氨酶,三官能酶-氨甲酰磷酸合成酶-天冬氨酸转氨甲酰酶和二氢乳清酸酶(CAD)。
113.依据权利要求108的方法,其中细胞是人类细胞。
114.依据权利要求108的方法,其中细胞是原生或次生细胞。
115.依据权利要求108的方法,其中细胞是无限增殖化细胞。
116.依据权利要求108的方法,其中细胞是哺乳动物成纤维细胞。
117.依据权利要求108的方法,其中细胞是人类成纤维细胞的原生或次生细胞。权利要求118-132对应取消的权利要求57-71。
118.一种融合蛋白,通过改变细胞内靶基因表达的方法制备,方法包括步骤(a)提供细胞,其基因组包括(i)含有内生调节区域的靶基因;(ii)靶位点;(b)提供DNA构建体,包括(i)与靶位点同源的导向序列;(ii)外源调节序列;(iii)外显子;(iv)编码可扩增标记的,可选取含有多拷贝编码可扩增标记的序列的细胞的序列;(v)在外显子3’末端未配对的剪接供体位点,(c)用DNA构建体转染细胞,从而产生转染细胞;(d)将转染细胞保持在适于同源重组的条件下,从而产生同源重组细胞,除了靶基因的所有外显子外,细胞的基因组还包括外源调节序列,构建体衍生外显子,和构建体衍生剪接供体位点;(e)将同源重组细胞在选取含有多拷贝编码可扩增标记的序列的细胞的条件下培养;(f)将同源重组细胞保持在外源调节序列控制下适于转录的条件下,产生构建体衍生外显子,靶基因,和存在于构建体衍生外显子和靶基因之间的任何序列的转录体,其中对应构建体衍生剪接供体位点的转录体RNA与对应于靶基因内一个位点的转录体中剪接受体位点定向剪接;(g)将同源重组细胞保持在适于转录体剪接和翻译的条件下;(h)证实产生了转录体的翻译产品,其中融合蛋白含有由构建体衍生外显子编码的第一氨基酸序列和由部分或全部靶基因编码的第二氨基酸序列,第一氨基酸序列不同于由靶基因的第一内生外显子编码的氨基酸序列。
119.依据权利要求118的融合蛋白,其中靶基因是促血红细胞生成素。
120.依据权利要求118的融合蛋白,其序列包括人类生长激素信号肽的氨基酸1-3。
121.一种培养的脊椎动物细胞,其基因组中掺入转录单位,其中转录单位包括外源调节序列,外源外显子,和外源外显子的3’末端的剪接供体位点,剪接供体位点与内生基因的第二内生外显子的内生剪接受体位点可操作地结合,其中细胞包括构建体衍生的可扩增标记基因。
122.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码从下列组中选取的蛋白质,包括调钙素,胰岛素,促胰岛素,类胰岛素生长因子,甲状旁腺激素,神经生长因子,白细胞介素,免疫球蛋白,催化抗体,过氧化物歧化酶,组织血纤维蛋白溶酶激活剂,血液凝血因子VIII,脱脂蛋白E,脱脂蛋白A-I,珠蛋白,低密度脂蛋白受体,IL-2受体,IL-2受体拮抗剂,α-1抗胰蛋白酶,免疫反应修饰剂。
123.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码生长激素。
124.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码干扰素。
125.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码血液凝血因子IX。
126.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码葡糖脑苷脂酶,
127.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码集落刺激因子。
128.依据权利要求121的培养的脊椎动物细胞,其中内生基因编码促血红细胞生成素。
129.一种培养的脊椎动物细胞,其基因组中掺入转录单位,其中转录单位包括外源调节序列,外源外显子,和外源外显子的3’末端的剪接供体位点,所有都位于内生基因的内生转录起始的上游,剪接供体位点与内生基因的第二内生外显子的内生剪接受体位点可操作地结合,其中细胞是从下列组中选取的,包括Raji细胞,Jurkat细胞,Namalwa细胞,HL-60细胞,Daudi细胞,RPMI 8226细胞,U-937细胞,Bows黑素瘤细胞,WI-38VA13亚种系细胞和MOLT-4细胞。
130.一种给哺乳动物提供蛋白质的方法,包括给哺乳动物引入权利要求121-129的任何一个的培养的脊椎动物细胞,其中内生基因编码蛋白质。
131.依据权利要求130的方法,其中培养的脊椎动物细胞在引入到哺乳动物前封存在允许蛋白质从屏障装置内部向屏障装置外部通过的屏障装置内。
132.依据权利要求131的方法,其中屏障装置可防止细胞从屏障装置中溢出。
全文摘要
本发明涉及含有下述成分的构建体:a)击靶序列;b)调节序列;c)外显子和d)未配对的拼接-供体位点。本发明还涉及体外或体内生产蛋白质的方法,该方法包括在细胞中同源重组上述构建体。然后在允许转录、转译的条件下维持该同源重组体细胞,而导致蛋白质的表达。本发明还涉及同源重组体细胞,包括初级、次级或永久化脊椎动物细胞,制备这些细胞的方法、同源重组以产生融合基因的方法,改变细胞中基因表达的方法,以及采用本发明的构建体于细胞中制造蛋白质的方法。
文档编号C12N15/63GK1346887SQ01136069
公开日2002年5月1日 申请日期2001年9月29日 优先权日1994年5月13日
发明者道格拉斯·A·特科, 迈克尔·W·哈特林, 理查德·F·塞尔登 申请人:转移染色体治疗公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1