具有遍在染色质开放表达元件(ucoe)的聚核苷酸的制作方法

文档序号:454463阅读:5950来源:国知局

专利名称::具有遍在染色质开放表达元件(ucoe)的聚核苷酸的制作方法
技术领域
:本发明涉及具有非衍生于LCR的遍在染色质开放表达元件(UCOE)的聚核苷酸。本发明还涉及具有该聚核苷酸序列的载体、具有该载体的宿主细胞、在治疗和试验中使用该聚核苷酸、载体和宿主细胞的方法以及鉴定UCOEs的方法。较高等真核染色质结构的现行模型要求在“区域”内组构基因(DillonandGrosveld,1994)。染色质区域可以由几组基因构成,一组基因以严格的组织特异性的方式表达,如人类β珠蛋白族(Grosveldetal.,1993),另一组基因是普遍表达的如人类TBP/C5基因座位(Trachtulec,Z.etal.,1997)。或者,染色质区域可由组织特异性的基因和普遍表达的基因的混合体构成,如鼠源γ/δTCR/dad-1基因座位(Hongetal.,1997;Ortizetal.,1997)和人类α珠蛋白基因座位(Vyasetal.,1992)。两种不同组织特异性的基因也可以是紧密连琐的。例如,人类生长素基因和绒毛膜生长催乳素基因(Jonesetal.,1995)。染色质区可以以封闭、“凝聚”、转录沉默态存在,或者以“解凝聚”、开放的能转录的结构存在。其特征在于DNA酶I的敏感性、DNA亚甲基化以及组蛋白的超酰基化的开放染色质结构被看作是基因表达开始的先决条件。被称为基因座位控制区(LCR)的组织特异性转录调节元件的发现使人们对如下机理有了新的认识,即能转录的开放的染色质区是在一定条件下被建立和保持的。LCR的定义是基于其具有使在顺式限定型宿主细胞中的连琐基因获得不依赖于基因整合位点的、依赖于拷贝数表达的能力(Grosveldetal.,1987;Langetal.,1988;Greavesetal.,1989;Diazetal..,1994;CarsonandWiles,1993;Boniferetal.,1990;Montoliuetal.,1996;Raguzetal.,1998;EP-A-0332667),尤其是单拷贝的转基因(Ellisetal.,1996;Raguzetal.,1998)。LCR能阻止异源染色质的扩散,防止位置效应转变(Festensteinetal.,1996;Milotetal.,1996)。LCR所决定的这种表达方式说明这些元件具有强大的染色质重构能力并能建立和保持有转录活性的开放染色质区。此外,还发现LCR具有内在的转录激活能力,这种能力可以使它们不依赖于其相关启动子而发生组织特异性基因表达(BlomvanAssendelftetal.,1989;Collisetal.,1990;AntoniouandGrosveld,1990;Greavesetal.,1989)。所有的LCR都与具有一个组织特异性的显著成分或组织限定性成分的基因区有关,并且与一系列DNA酶I超敏感位点有关,该位点可以位于其所调节基因的5′端(Grosveldetal.,1987;CarsonandWiles,1993;Boniferetal.,1994;Jonesetal.,1995;Montoliuetal.,1996)或3′端(Greavesetal.,1989)。另外,最近还发现LCR元件存在于紧密相邻的间隔基因之间(Hongetal.,1997;Ortizetal.,1997)。已有报道类似LCR的元件在基因内有内含位置(Aronowetal.,1995)。在仅有的几个已被研究的案例中,这些元件相当于组织特异性和遍在转录因子结合位点的大簇(Talbotetal.,1990;Philipsenetal.,1990;Pruzinaetal.,1991;Lakeetal.,1990;Jarmanetal.,1991;Aronowetal.,1995)。LCR的发现揭示出控制组织特异性基因从给定的染色质区表达的调节元件是以级系方式组织的。该LCR看来是起主开关的作用,其中它的活化会导致优先于任何基因表达的开放染色质结构的建立。生理所需水平的转录可通过染色质单个基因的LCR和当地启动子和增强子元件间的直接相互作用来获得,所述相互作用是通过间插DNA的环出来实现。(Hanscombeetal.,1991;Wijgerdeetal.,1995;Dillonetal.,1997)。如上所示,LCR的主要特点是其组织特异性。Ortiz等人(1997)研究了LCR的组织特异性,他删除了T-细胞报告α(TCRα)LCR的许多DNA酶I的超敏感位点,并鉴定了在许多组织中开放染色质的LCR衍生元件。Talbot等人(1994,NAR,22,756-766)描述了被认为可以在许多组织中使连琐基因表达的类似LCR元件。不过并没有得到该连琐基因的可再现表达。以被表达基因的每拷贝为基础,表达水平的平均值标准差在74%左右,而转基因拷贝数为3或更大。当拷贝数为1或2时,该基因表达水平降低10倍,并且以被表达基因的每个基因拷贝为基础的平均值标准差为49%。Talbot等人所公开的元件并没有给出连琐基因的可再现表达。很明显,这些及该体系的高度变异性限制了这种体系的利用。利用基因治疗来长期校正遗传紊乱要求转录单位能维持和持续足够高水平的表达以达到治疗效果。这可以采用两种措施来实现。一种方法是把转录单位稳定地整合进宿主细胞基因组中,例如,使用逆转录病毒载体(Miller.1992;Milleretal.,1993)或腺伴随病毒(AAV)载体(Muzyczka,1992;Kotin,1994;FlotteandCarter,1995)。另一种方法是把治疗基因结合到自主复制的游离型载体上,该载体包括病毒的复制起点,如EBV(Yatesetal.,1985)、人类乳多空病毒BK(DeBenedettiandRhoads,1991;CooperandMiron,1993)及BPV-1(Piirsooetal.,1996)。不幸的是,在大多数情况下,整合进基因组中的基因的正常的能观察到的表达水平太低或达到治疗效果的基因表达水平持续的时间太短。这主要是由众所周知的“位置效应”引起的。被导入的基因的转录依赖于其整合的位点,该位点或者受到竞争活化元件(启动子/增强子)的影响,或者更多地受到抑制(染色质沉默)元件的影响。位置效应不断地对整合有逆转录病毒及腺伴随病毒(AAV)源的病毒基载体的治疗作用产生实质性的限制作用。整合位点附近的染色质元件很容易使病毒转录调控元件沉默。高水平表达基因中典型的启动子和增强子元件的内含物作为病毒构建体的一部分并没有解决这一主要问题(Daietal.,1992;Leeetal.,1993)。作为转录单位的一部分的全功能LCR的内含物克服了这种缺陷,因为这种元件能在特定细胞类型中用于启动所需基因可预测的生理水平的持续表达(参见YeomanandMellor,1992;BrinesandKlaus,1993;Needhametal.1992and1993;Tewarietal.,1998;Zhumabekovetal.,1995)。这种表达可预测性的程度是安全、成功基因治疗策略的关键。使用可复制的游离型载体(REV)是整合基因病毒以便实现基因的长期表达的另一诱人的方法。首先,与病毒载体不同,REV对治疗用转录单位没有大小限制,可以插入超过300kb的片段(Sunetal.,1994)。其次,由于是游离型的,REV不会产生与插入诱变突变有关的潜在危险,这种诱变突变发生是整合病毒载体所固有的问题。最后,可以使用非病毒递送系统把REV导入靶细胞,非病毒递送系统可比病毒递送系统更便宜地制得。已经证实了非复制瞬时转染质粒(Reevesetal.,1985;Archeretal.,1992)和REV(Reevesetal.,1985;Smithetal.,1993)组配成的核小体。在REV上的组配更能很好地被组织,这种装配类似于天然的染色质,而在瞬时质粒上的核小体虽然可以抑制基因表达(Archeretal.,1992)但不能很好地排列且会允许某些转录因子接近靶序列。最近已证明了LCR在REV中使组织特异性基因进行长期表达(国际专利申请WO98/07876)。产生高水平治疗蛋白产品的培养哺乳动物细胞的制备是一个处于发展中的工业。染色质位置效应使其实施难度大、费时且成本高。产生这种哺乳动物“细胞工厂”最常用的手段依赖于由抗药基因诱导的基因扩增(如DHFR,谷氨酰胺合成酶(Kaufman,1990))以及在所有时间内必须保持的高毒药物浓度。使用具有来自高表达基因区的LCR的载体大大简化了这类细胞系的制备(Needhametal.,1992;Needhametal.,1995)。使用LCR的问题是它们是组织特异性的,可再现表达只能在特定细胞类型中得到。所以,在没有LCR的一种组织类型中或在多种组织类型中不能得到可再现的表达。因此,需要非衍生于LCR的UCOE。如上所述,Ortiz等人(1997)公开了一种LCR衍生的元件,它能开放许多组织中的染色质。Ortiz等人(1997)的LCR衍生的元件存在许多问题。特别是为了使这种元件具有LCR的必要区域必须使用重组DNA技术小心地组建,而且该元件在不同组织类型细胞中不能产生连琐基因的可再现的表达水平,特别是当该元件是一个拷贝或较少拷贝数的转基因(少于3个)时。虽然已经公开了有包含双向启动子和无甲基化CpG岛的元件,但没有公开或提示该元件能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达。人的Surfeit基因座位跨度约为60kb,并且位于染色体9q34.2处。该基因座位在SURF5和SURF3基因之间以及在SURF1和SURF2基因之间具有双向启动子(Huxleyetal.,分子细胞生物学(Mol.Cell.Biol.),10,605-614,1990;Duhigetal.,基因组学(Genomics).52.72-78.1998;Williamsetal.,分子细胞生物学(Mol.Cell.Biol.),6,4558-4569,1986)。但没有指出这些区能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达。Brayton等人(生物化学杂志(J.Biol.Chem.),269,5313-5321,1994)也公开了在禽源GPAT和AIRC基因之间的一种双向启动子。但仍没有指出该区能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达。Ryan等人(基因(Gene),196,9-17,1997)公开了在线粒体陪伴蛋白(chaeronin)60基因和陪伴蛋白10基因之间的一种双向启动子,但仍没有指出该区能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达。还公开了与鼠源HTF9基因有关的一种双向启动子,但仍没有指出该区能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达。Palmiter等人(PNASUSA,95,8428-8430,1998)以及国际专利申请WO94/13273公开了与金属硫蛋白基因有关的一种元件。这种元件具有与启动子无关的DNA酶I超敏感位点。进一步来说,没有证据表明这种元件不能开放染色质或使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达。众所周知,使用非复制性瞬时转染质粒通过转染细胞能得到基因表达,但使用非复制性瞬时转染质粒得到的只是短期表达(一般不超过72小时)。一般认为,这种短期表达是由质粒的断裂或细胞内质粒的丢失造成的。这种缺陷限制了这种质粒的使用。本发明提供一种含有UCOE的聚核苷酸,它能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达,其中该聚核苷酸非衍生于基因座位控制区。把“基因座位控制区”(LCR)定义为从一种真核宿主细胞的组织特异性基因座位得到一种基因元件,当其与目的基因连琐并整合进宿主细胞的染色体中时能使目的基因产生组织特异性的不依赖于整合位点的但依赖于拷贝数的表达。衍生于LCR的聚核苷酸可以是LCR的任何一部分或是几部分。衍生于LCR的聚核苷酸最好是能开放染色质的LCR的任何部分。LCR是与和启动子无关的一种或多种DNA酶I超敏感(HS)位点相关的,并且UCOE最好不包含与启动子无关的HS位点。HS是本领域普通技术人员所周知的,并且可以根据这里所述的标准技术来鉴定。术语“促进可再现表达”是指UCOE能促进被操纵连琐基因的转录可再现活化的能力。我们认为这个过程涉及UCOE使包含该基因的染色质区域(或至少是转录因子结合位点)接近转录因子区域的能力。可再现表达主要是指当所述聚核苷酸被操纵连琐到一个可表达基因上时不论染色质的环境和不管细胞组织类型如何,该聚核苷酸都能使所述被操纵连琐基因产生实质上相同水平的表达。优选地,实质上相同水平的表达可以是指以每基因拷贝计表达水平平均值的标准差小于48%,小于40%更好,最好是小于25%。实质上相同水平的表达也可以是指以单基因拷贝计,表达水平的变化小于10倍,小于5倍更好,最好是小于3倍。该表达水平优选是在转基因动物中测定的表达水平。特别优选的是当被操纵连琐基因以单一或低拷贝数(小于3)存在时UCOE促进被操纵连琐基因的可再现表达。这里所用的术语“连琐”是指顺式连琐,其中UCOE与基因在相同核酸分子上表现为顺式关系。术语“被操纵连琐”是指顺式连琐,其中要表达的基因的表达受到UCOE的促进。开放染色质或处于开放状态的染色质是指染色处于非凝聚态,并且也指常染色质。凝聚染色质也被称作异染色质,如上所述,封闭(凝聚)态染色质处于转录沉默态。开放(非凝聚)染色质是能转录的染色质。开放染色质结构的确立是以DNA酶I敏感性、DNA亚甲基化和组蛋白的超乙酰化为特征的。鉴定开放染色质的标准方法是本领域普通技术人员的公知常识,并在Wu,1989,酶分子学方法,170269-289;Crane-Robinson等,方法(Methods),1248-56;Rein等,1998,N.A.R.,262255-2264中有述。术语“两种或多种组织类型细胞”是指至少两种下列不同组织类型的细胞,至少4种较好,最好是更多种,这些组织类型是心、肾、肺、肝、肠子、骨骼肌、生殖腺、脾、脑和胸腺组织。优选本发明的聚核苷酸可以非组织特异性地促进可再现表达,即无组织的特异性。更优选本发明的聚核苷酸以能在至少50%的并且最好是全部的有活性基因表达发生的组织类型中促进可再现表达。本发明的聚核苷酸可以在生理水平上促进被操纵连琐基因的可再现表达。生理水平则意味着在一个细胞中、一群细胞中或者病人中的基因表达水平表现一种生理效应。生理水平优选是取决于想要结果的最适生理水平。优选地,生理水理与等价内源基因的表达水平是等同的。本发明的UCOE可以是任何元件,该元件能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达,条件是该UCOE不是衍生于LCR。在一个实施例中,UCOE包含延长的无甲基化的CpG岛。与总DNA中GC水平平均为40%相比,CpG岛平均GC含量约为60%。本领域的普通技术人员很容易使用标准技术鉴定CpG岛,如使用特异于C和G序列的限制酶。Larsen等人1992年和Kolsto等人1986年描述了这种技术。延长的无甲基化的CpG岛是延伸穿过包含着多个转录起始位点的区域和/或延伸大于300bp优选大于500bp的一种无甲基化的CpG岛。UCOE衍生于一个序列,该序列在其天然内源位置时与遍在表达基因相关,相邻更好。UCOE还优选含有至少一个转录因子结合位点。转录因子结合位点包括启动子序列和增强子序列。优选UCOE中含有能背弛转录的双重或双向启动子。这里的双重启动子被定义为彼此独立的一个或多个启动子,其中一个启动子的激活或失活不影响另一个启动子。双向启动子是在两个方向上发挥启动子作用的区域,但不能只在一个方向上激活或失活。UCOE优选包含能背弛转录的双重启动子或双向启动子(即能在相对方向引导转录),并且它们的天然内源位置与遍在表达基因关联。UCOE优选包含背驰转录的双重启动子。该UCOE可以包含异源启动子,即不是天然与UCOE的其它序列相关的启动子。例如,可以使用带有与hnRNPA2相关的UCOE的CMV启动子和HP1H-γ启动子。下文将对此作进一步的讨论。本发明还提供包含一个或多个异源启动子的UCOE。该异源启动子可以代替UCOE的一个或多个内源启动子,或者附加在UCOE的一个或多个内源启动子上使用。异源启动子可以是任何启动子,包括组织特异性启动子,如肿瘤特异性启动子和遍在启动子。异源启动子优选是遍在启动子,最好是CMV启动子。如Lavia等人在EMBO杂志,62773-2779(1987)所述,UCOE优选不是含有HpaII微小片段(HTF)岛HTF9的双向启动子的3725bpEcoRI1片段。UCOE优选不是位于Surfeit基因座位的鼠源SURF1和SURF2基因之间的800bpBamHI基因组片段中的149bpMES-1元件(Williamsetal.,Mol.Cell.Biol,134784-4792,1993)。优选UCOE也不是位于Surfeit基因座位的SURF5和SURF3基因之间的双向启动子(Williamsetal.,Mol.Cell.Biol,134784-4792,1993)。还优选UCOE不是衍生于如Duhig等人在Genomics,5272-78(1998)中所限定的跨度为60kb且位于染色体9q34.2上的人类Surfeit基因座位或者相应的鼠源基因座位(Huxleyetal.,Mol.Cell.Biol.10605-614,1990)。优选UCOE不是位于基因资料库保存的1350bpSmaI片段(序列号L12533)所含的禽源GPAT和AIRC基因之间的双向启动子区(Gavalasetal.,Mol.Cell.Biol.,134784-4792,1993)或相应的人类的等同区(Braytonetal.,J.Biol.Chem.,2695313-5321,1994)。优选UCOE不是包括大鼠源线粒体陪伴蛋白60和陪伴蛋白10基因的3894bp基因组DNA片段(基因库序列号U68562)。还优选UCOE也不是含有位于大鼠源线粒体陪伴蛋白60和陪伴蛋白10基因之间的基因间区域中双向启动子的581bp片段(Ryanetal.,Gene,1969-17,1997)。在本发明的一个优选实施例中,UCOE是跨越人类TATA结合蛋白(TBP)基因的44kbDNA片段,其5′和3′侧翼序列均为12kb,或者是其功能同源体或功能片段。在本发明的另一个优选实施例中,UCOE是一个跨越人类hnRNPA2基因的60kbDNA片段,其5′侧翼序列为30kb,3′侧翼序列为20kb,或者是其功能同源体或功能片段。在又一优选实施例中,UCOE包含图21中在核苷酸1至6264之间的序列,或者是其功能同源体或功能片段。这种序列包含着人类hnRNPA2启动子(核苷酸5636-6264),并且5.5kb的5′侧翼序列包含HP1H-γ启动子。在本发明的又一个优选实施例中,UCOE是一个跨越人类TBP基因的25kbDNA片段,其5′侧翼序列为1kb,3′侧翼序列为5kb,或者是其功能同源体或功能片段。在本发明的又一个优选实施例中,UCOE是一个跨越人类hnRNPA2基因的16kbDNA片段,其5′侧翼序列为5kb,3′侧翼序列为1.5kb,或者是其功能同源体或功能片段。在又一个优选实施例中,UCOE包含图21中核苷酸1至5636(人类hnRNPA2启动子的5.5kb的5′侧翼序列)之间的序列和CMV启动子,或者是其功能同源体或功能片段。在又一个优选实施例中,UCOE包含图21中在核苷酸4102至8286之间的序列,或者是其功能同源体或功能片段。这种序列包含hnRNPA2和HP1H-γ启动子。在又一个优选实施例中,UCOE包含在图21中在核苷酸1和7627之间的序列,或者是其功能同源体或功能片段。这种序列包含hnRNPA2和HP1H-γ启动子以及hnRNPA2基因的外显子1。在又一个优选实施例中,UCOE包含在图21中在核苷酸1和9127之间的序列,或者是其功能同源体或功能片段。这种序列包含hnRNPA2和HP1H-γ启动子且hnRNPA2启动子的3′侧翼序列靠近(upto)但不包括hnRNPA2基因的外显子2。还优选本发明的UCOE具有图20或图21的核苷酸序列,或者其功能片段或功能同源体。这里所用术语“功能同源体或片段”是指能开放染色质或能使染色质保持开放状态以及在至少两种不同组织类型的细胞中促进被操纵连琐基因的可再现表达的同源体或片段。所述同源体可以是相应于已被鉴定的UCOE的种同源体或者是与遍在表达基因相关的同源体。为了识别能鉴定和合成其它UCOE的保守序列基元,可进行UCOE间的序列比较。进行这种序列比较的适当软件包是本领域普通技术人员周知的。较好的进行这种序列比较的软件包是PCGENE(Intelligenetics,Inc.,USA)。采用产生已知UCOE片段及测验功能的方法很容易鉴定功能片段。鉴定保守序列基元也将有助于鉴定功能片段,因为包含保守序列基元的片段也可能是功能性的。功能性同源体也包含被修饰的UCOE,其中UCOE的元件已被类似元件所代替,如用不同的异源启动子替换了UCOE的一个或多个启动子。如上所述,异源启动子可以是任何启动子,包括类似肿瘤特异性启动子的组织特异性启动子和遍在启动子。异源启动子优选是一个强的和/或主要的遍在启动子,最好是CMV启动子。在本发明的另一个优选实施例中,提供了对能在至少两种不同组织细胞中促进被操纵连琐基因可再现表达的UCOE进行鉴定的方法,包括(1)用具有候选UCOE的载体通过转染至少两种不同组织细胞对候选UCOE进行测验,该候选UCOE是被操纵连琐到标记基因上的;(2)确定是否在两种或更多种不同的组织细胞中能得到该标记基因的可再现表达。本发明鉴定UCOE的方法还优选包括选择候选UCOE的另一步骤,该候选UCOE与下列部分中的一个或多个关联遍在表达基因、双重或双向启动子以及延长的无甲基化的CpG岛。优选在含有与标记基因连琐的单一拷贝的UCOE的细胞中确定该标记基因的可再现表达。在本发明提供的这种方法中,候选UCOE的测验是如下完成的制备其细胞内含有其中候选UCOE被操纵连琐到标记基因上的载体的非人类转基因动物,并确定在两种或多种不同组织类型细胞中是否获得该标记基因的可再现表达。该非人类转基因动物优选是F1或非人类转基因动物的较高世代。非人类转基因动物优选是啮齿动物,更优选小鼠。本发明提供了一种可衍生于与遍在表达基因相关或相邻的核酸序列的UCOE。所述核酸序列优选包含无甲基化的延长的CpG岛。进一步优选该核酸序列包含至少一个转录因子结合位点。优选所述核酸序列包含背弛转录的双重或双向启动子。优选该核酸序列包含能背弛转录的双重启动子。优选该核酸序列包含能背弛转录的双重或双向启动子并且该启动子是与遍在表达基因相关的。优选该核酸序列包含能背弛转录的双重启动子并且该启动子是与遍在表达基因相关的。本发明还提供了在鉴定其它UCOE的试验中使用本发明的聚核苷酸或其片段。优选使用包含保守序列或结构基元的所述聚核苷酸片段。进行这种试验的方法是本领域普通技术人员周知的。本发明提供了含有本发明聚核苷酸的载体,优选这种载体包含有被操纵连琐到该聚核苷酸上的表达基因。所述可表达基因具有能使基因表达的必要元件,如适当的启动子、增强子、剪切受体序列、内部核糖体进入位点序列(IRES)和转录终止位点。使基因表达的适当元件是本领域普通技术人员所共知的。使基因表达的适当元件可以是与该基因关联的天然内源元件,也可以是为了得到不同于内源基因的基因表达水平或组织分布而使用的异源元件。优选载体具有可与可表达基因操纵相关的启动子和聚核苷酸。该启动子可以是可表达基因的天然内源启动子,也可以是异源启动子。异源启动子可以任何启动子,包括组织特异性启动子,如肿瘤特异性启动子和遍在启动子。异源启动子优选是一个强的和/或主要的遍在启动子,最好是CMV启动子。载体可以是能把DNA转染进细胞的任何载体。即可以是整合型载体也可以是游离型载体。优选的整合型载体包括重组的逆转录病毒载体。重组的逆转录病毒载体包括逆转录病毒基因组的至少一部分DNA,这部分能感染靶细胞。所用术语“感染”是指病毒把遗传材料转移进其宿主细胞或靶细胞的过程。在构建本发明载体中所用的逆转录病毒也可以赋予复制缺陷,以除去靶细胞中病毒复制效应。在这种情况下,根据传统技术可利用辅助病毒包装有复制缺陷的病毒基因组。总之,在本发明的实施中可以使用功能基因转移能力和转染性能与上述标准相符的任何逆转录病毒。适当的逆转录病毒载体包括本领域普通技术人员所公知的pLJ、pZip、pWe和pEM,但不限定于此。对用于包装复制缺陷性的逆转录病毒的病毒品系来说,包括ψCrip、ψCre、ψ2和ψAm。本发明有用的其它病毒载体包括腺病毒、腺伴随病毒、SV40病毒、痘苗病毒、HSV和痘病毒载体。优选使用的载体是腺病毒。腺病毒载体是本领域普通技术人员公知的且已用于向许多类型细胞递送基因,包括向气管上皮、骨骼肌、肝、脑和皮肤细胞中递送基因(Hitt,MM,AddisonCLandGraham,FL(1997)用于向哺乳动物细胞中转移基因的人类腺病毒载体(Humanadenovirusvectorsforgenetransferintomammaliancells).药物学进展(AdvancesinPharmacology)40137-206;以及AndersonWF(1998)人类基因疗法(Humangenetherapy).自然(Nature)392(6679Suppl)25-30)。也优选使用腺伴随载体(AAV)。AAV载体是本领域普通技术人员公知的,并且在基因治疗应用中已用于稳定转导人类T-淋巴细胞、成纤维细胞、嗅觉聚合细胞、骨骼肌、脑、红细胞和heamopoietic干细胞(Philipetal.,1994,细胞分子生物学(Mol.Cell.Biol.),142411-2418;Russelletal.,1994,PNASUSA,91,8915-8919;Flotteetal.,1993,PNASUSA,9010613-10617;Walshetal.,1994,PNASUSA,897257-7261;Milleretal.,1994,PNASUSA,9110183-10187;Emerson,1996,Blood,87,3082-3088),国际专利申请WO91/18088描述了具体的AAV基载体。较好的游离型载体包括瞬时转染非复制性游离型载体和具有来自如EBV、人类乳多空病毒(BK)及BPV-1的病毒复制起点的功能的自我复制性游离型载体。这类整合型和游离型载体均是本领域普通技术人员公知的,并均在本领域普通技术人员公知的文献中被充分描述过。特别是WO98/07876中描述了适当的游离型载体。本发明所用的载体也优选是哺乳动物的人造染色体。Colos(1996,TIG,12463-466)描述了哺乳动物的人造染色体的使用。在一个优选实施例中,本发明的载体是质粒。还优选质粒是非复制性的非整合型质粒。这里所用术语“质粒”是指编码可表达基因的任何核酸,包括线型或环状核酸以及双链或单链核酸。核酸可以是DNA或RNA,可以包括被修饰的核苷酸或核糖核苷酸,可以是经化学方式修饰过的,如甲基化或含有保护基或具有帽或尾结构。非复制性的非整合型质粒是当转染进宿主细胞时不复制也不特异性地整合进该宿主细胞基因组中(即没有高频率地整合也不在特异性位点整合)的一种核酸。采用标准测量法可以鉴定复制性质粒,包括Ustav等人在EMBOJ.,10449-457,1991中所述的标准复制测验法。优选的非复制性非整合型质粒是不能被稳定保持在细胞中的质粒,它不依赖于基因组DNA的复制,在三次或多次细胞分裂后的子代细胞中质粒拷贝数有显著的减少,即在给定的细胞分裂代数期间子代细胞中的质粒分子平均减少大约50%以上。总之,在自我复制性载体中,使用病毒复制起点以及提供由该特定的病毒复制起点所介导的复制所需要的一个或多个病毒复制因子来提供自我复制功能。WO98/07876中描述了自我复制载体。这里所用术语“瞬时转染的非整合型质粒”与上述定义的术语“非复制性非整合型质粒”是相同的。上述质粒优选是裸核酸。如这里所用的术语“裸核酸”,是指核酸分子既没有通过共价键也没有通过氢键与蛋白质、磷质、碳水化合物或糖蛋白有直接的物理关联。该术语并不指核酸中有无被修饰的核苷酸或核糖核苷酸,或者所有或部分核酸分子是否采用了甲基化或附加上保护基或帽或尾结构而进行了化学修饰。本发明的载体优选含有图20中位于核苷酸1和7627之间的序列(包含hnRNPA2和HP1H-γ启动子)、CMV启动子、多克隆位点、聚乙酰化序列和在适当控制元件作用下的编码可选择标记的基因。本发明的载体优选是图49所示的CET200或CET210载体。本发明也提供了用本发明载体转染的宿主细胞。宿主细胞可以是任何细胞,如酵母细胞、昆虫细胞、细菌细胞和哺乳动物细胞。宿主细胞优选为哺乳动物细胞,并可以从哺乳动物细胞系,如CHO细胞系、293细胞系和NS0细胞产生。被操纵连琐基因优选是一种治疗用核酸序列。可以用于本发明的治疗用核酸序列包括编码受体、酶、配体、调节因子、激素、抗体或抗体片段以及结构蛋白的序列。治疗用核酸序列也包括编码核蛋白、细胞质蛋白、线粒体蛋白、分泌蛋白、与膜关联蛋白、血清蛋白、病毒抗原、细菌抗原、原生动物抗原和寄生虫抗原等的序列。本发明所用的核酸序列也包括编码蛋白质、肽、脂蛋白、糖蛋白、磷蛋白和核酸(如RNA和反义核酸)的序列。可以由该治疗用核酸序列编码的蛋白质或多肽包括激素、生长因子、酶、凝固因子、脱辅基脂蛋白、受体、促红细胞生成素、治疗用抗体或其片段、药物、致癌基因、肿瘤抗原、抑瘤物、病毒抗原、寄生虫抗原和细菌抗原。这些化合物的具体例子包括胰岛素原、生长激素、雄性激素受体、胰岛素样生长因子I、胰岛素样生长因子II、胰岛素样生长因子结合蛋白、表皮生长因子、蜕变生长因子α、蜕变生长因子β、血小板衍生的生长因子、血管原因子(酸性的成纤维细胞生长因子、碱性的成纤维细胞生长因子、血管内皮生长因子和血管生成素)、基质蛋白(IV型胶原、VII型胶原、昆布氨素)、苯丙氨酸羟化酶、酪氨酸羟化酶、致癌蛋白(如由byras、fos、myc、erb、src、neu、sis、jun所编码的那些)、HPVE6或E7致癌蛋白、p53蛋白、Rb蛋白、细胞分裂素受体、IL-1、IL-6、IL-8以及来自病毒、细菌和寄生生物的能被用于在体内产生免疫应答的蛋白质和其它在体内作用显著的蛋白质。对要被掺入的基因的选择只受编码它的核酸序列的用效性限定。本领域的普通技术人员会认识到由于越来越多的蛋白质和多肽已被鉴定出来,它们可被整合进本发明的多核苷酸中并被表达。当本发明的多核苷酸被包括在质粒中时,优选在单基因治疗中使用该质粒,如在杜光氏肌营养不良的治疗中以及在DNA免疫和免疫方法中使用。例如,为了增加基因产物的量,本发明的多核苷酸也可以用于表达已在宿主细胞中表达的基因(即天然基因或同源基因)。不过应当指出,当同源基因的表达有可能会产生脱调节表达时,该表达由于是在细胞中过度表达,因而可能会不受UCOE的控制。本发明的多核苷酸可以在与内源(天生)基因可操纵关联的位置上插入细胞的基因组,从而导致这种内源基因的表达增加。在特定位点把元件插进基因组的方法是本领域普通技术人员公知的,并在US-A-5578461和US-A-5641670中有描述。另外,本发明的多核苷酸可以在其于基因组上的内源(天然)位置处有被插入的基因,该基因的位置与多核苷酸是可操纵相关的,以便使被插入的基因产生基因表达。再次说明的是,把基因插入基因组特定位点的方法是本领域普通技术人员公知的,并在US-A-5578461和US-A-5641670中有描述。本发明提供了本发明多核苷酸用于增加内源基因表达的用途,包括在与内源基因可操纵关联的位置处把该多核苷酸插进细胞基因组,从而增加该基因的表达。把这里所述的载体递送到细胞中的许多技术是公知的并且可为本发明所用,包括使用核酸凝聚剂、电穿孔法、使用石棉、1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物、DEAE纤维素、葡聚糖、脂质体、阳离子脂质体、脂质聚酰胺、聚鸟氨酸络合法、粒子轰击法、直接微注射法(参见KucherlapatiandSkoultchi,Crit.Rev.Biochem.16349-379(1984);Keownetal.,MethodsEnzymol.185527(1990))本发明的载体可以采用病毒或非病毒递送法非特异性或特异性地(即到宿主细胞的指定部位)递送到宿主细胞中。病毒源的优选递送方法包括把生产病毒颗粒的包装细胞系作为本发明载体的转染受体,在该受体中病毒包装信号已被遗传改造过,如那些腺病毒、疱疹病毒、乳多空病毒。在本发明也可以使用非病毒基基因递送措施和方法,包括裸基因的直接注射、核酸凝聚肽或非肽、阳离子脂质体和脂质体包封。将载体直接递送进组织已有描述,并且已经获得了基因短期表达。现有技术中已清楚地描述了把载体直接递送进肌肉(Wolffetal.,Science,2471465-1468,1990)、甲状腺(Sykesetal.,HumanGeneTher.,5,837-844,1994)、黑素瘤(Vileetal.,CancerRes.,53,962-967,1993)、皮肤(Henggeetal.,NatureGenet,10,161-166,1995)、肝(Hickmanetal.,HumanGeneTherapy,5,1477-1483,1994)以及暴露后的呼吸道上皮(Meyeretal.,GeneTherapy,2,450-460,1995)。在与聚赖氨酸DNA复合物共同施给时在基因转移中已使用了由病毒包膜蛋白的氨基酸序列衍生的各种肽(Planketal.,J.,Biol.Chem.26912918-12924(1994))。Trubetskoy等在BioconjugateChem.3323-327(1992)、WO91/17773、WO92/19278中以及Mack等在Am.J.Med.Sci.307138-143(1994)中提议,用阳离子脂质与聚赖氨酸缀合的共聚物可以改善基因转移效率。国际专利申请WO95/02698公开了使用病毒成分试图增加阳离子脂质基因转移的效率。可在本发明中使用的核酸凝聚剂包括精酰胺、精酰胺衍生物、组蛋白、阳离子肽、阳离子非肽,如聚乙烯亚胺(PEI)和聚赖氨酸。精酰胺衍生物是指精酰胺的同系物及精酰胺衍生物,包括国际专利申请WO93/18759(1993年9月30日出版)所述的化合物。另外,参见Trubetskoy等(上述),肽组份和递送载体的连结使用了双硫键(Cottonetal.,Meth.Enzymol.217618-644(1992)。例如WuandWu在J.Biol.Chem.,26314621(1988)中和Wilson等在J.Biol.Chem.267963-967(1992)中以及美国专利NO.5166320中所述,把DNA构建体递送进细胞的递送载体是本领域普通技术人员公知的,并且包括对细胞表面受体特异的DNA/多阳离子复合物。根据本发明,载体的递送可用核酸凝聚肽来完成。WO96/41606描述了核酸凝聚肽,该肽特别是适用于凝聚载体并把载体递送进细胞。如WO96/41606所述,可以把功能基结合到用于递送本发明载体的肽上。这些功能基可以包括靶标为特异性细胞类的配体,如单克隆抗体、胰岛素、转铁蛋白、脱唾液糖蛋白或糖。这种配体可以以非特异性的方式或以受细胞类型限制的特异性方式靶向细胞。功能基也可以包括类似棕榈酰、油酰、硬脂酰类的脂类;类似聚乙二醇(PEG)或聚乙烯吡咯烷酮(PVP)的中性亲水聚合物;类似流感病毒HA肽的融合肽;或者重组酶或整合酶。功能基还可以包括胞内运输蛋白,如核定位序列(NLS)和核内体逃避信号或把蛋白质直接指向细胞质的信号。本发明也提供了在治疗中使用的本发明的聚核苷酸、载体或宿主细胞。在基因治疗中优选使用上述聚核苷酸、载体或宿主。本发明也提供了本发明的聚核苷酸、载体或宿主细胞在制备用于基因治疗的组合物中的用途。本发明还提供了一种治疗方法,包括给需要这种治疗的患者给药有效剂量的本发明的聚核苷酸、载体或宿主细胞。优选患者所患的疾病是可用基因治疗法治疗的。本发明也提供一种药物组合物,其含有与可药用赋形剂结合的本发明的聚核苷酸、载体或宿主细胞。本发明也提供了在细胞培养体系中使用本发明的聚核苷酸、载体或宿主细胞,以便获得基因产品的方法。适用的细胞培养体系是本领域普通技术人员公知的,并且在本领域普通技术人所知文献中有详细的描述。本发明也提供了本发明的聚核苷酸、载体或宿主细胞在生产转基因植物中的应用。能增加产量、有抗性等转基因植物的制备是本领域普通技术人员公知的。本发明也提供了含有本发明多核苷酸的细胞的转基因植物。本发明也提供了具有包含本发明多核苷酸的细胞的转基因非人类动物。本发明的药物组合物可含有本发明的聚核苷酸、载体或宿主细胞,如果必要,可以是与药物可接受载体或释稀剂混合的,用于治疗疾病或给特定组织的细胞提供有利的蛋白或功能。本发明的聚核苷酸、载体或宿主细胞或药物组合物可以通过各种方式给药,包括全身肌肉内、静脉内、气溶胶、口服(固体或液体形式)、局部、眼部、栓剂,以及腹膜内和/或鞘内和局部直接注射给药等方式。当然确切的给药量需要由医师对各个患者进行测定,而该量又取决于由目的基因表达的蛋白的确切性质以及被治疗的靶标组织的类型。这种剂量也依赖于疾病的症状以及给药途径。最好治疗期是连续的或直到细胞死亡。用剂次数须根据疾病及临床试验所得的功效资料。根据本发明进行有效基因治疗所递送的聚核苷酸或载体DNA的量的范围优选为约50ng-1000μg载体DNA/kg体重,1-100μg载体DNA/kg体重更好。尽管本发明优选是给哺乳动物施用聚核苷酸、载体或宿主细胞以便让细胞进行活体内吸收,但也可以采用离体方式,即把细胞从动物体取下,用聚核苷酸或载体转导后再移植进动物。例如,采用离体方式可以进入肝,即从动物体中取下肝细胞,在体外转导该肝细胞,再把被转导的肝细胞移植进动物体(如Chowdhury等在Science2541802-1805,1991中针对免子的所述,或Wilson在Hum.GeneTher.3179-222,1992中针对人类的所述)。这种方法也可以有效地向循环系统或淋巴系统中的各种细胞群体如红细胞、T细胞、B细胞和生血干细胞中递送。在本发明的另个实施例中,提供了使用本发明聚核苷酸、载体或宿主细胞测定组织特异性和/或基因治疗效果的哺乳动物模型。该哺乳动物模型包括其细胞中具有本发明载体的转基因动物。制备转基因鼠(Gordonetal.,美国科学院院报(Proc.Natl.Acad.Sci.USA)777380(1980);Harbersetal.,Nature293540(1981);Wagneretal.,美国科学院院报(Proc.Natl.Acad.Sci.USA)785016(1981);Wagneretal.,美国科学院院报(Proc.Natl.Acad.Sci.USA)786376(1981)、羊、猪、鸡(参见Hammeretal.,Nature315680(1985)等的方法是现有技术中公知的,并可在本发明中使用。在对人体进行临床试验前可以在这些动物上进行试验。具有本发明聚核苷酸的转基因动物可以用于目的蛋白质的长期生产。本发明也涉及到在功能基因组学应用中使用本发明的聚核苷酸。功能基因组学主要涉及到在特殊细胞或疾病状态中特异性表达的基因的测序,现在它们提供了用于药物开发或基因治疗目的的数千个新的具有潜在益处的基因序列。使用这些信息用于新的治疗研究的主要问题是如何确定这些基因的功能。为了确定基因序列的功能,可以把UCOE用于许多功能基因组学的应用中。本发明的功能组基因应用包括以下步骤,但并不限定于此(1)使用本发明的聚核苷酸以获得基因序列或核酶易拆开文库的反义版本的持续表达,从而确定细胞表型上非活化基因的作用。(2)使用本发明的聚核苷酸制备基因序列的表达文库,以便递送进细胞的基因序列产生可靠的可再现的持续表达。表达该基因序列的所得的细胞可以用于确定功能或药物开发的各种方法中。例如,制备基因产物的抗体以用于其活性的中和;在结构、功能或药物筛选研究中所用的该基因蛋白产品的快速纯化;或者在细胞基药物筛选中使用。(3)在涉及鼠胚胎干细胞(ES)或转基因鼠的研究中使用本发明的聚核苷酸。最有用的功能基因组学的一个措施是对所构建的鼠ES细胞的基因进行随机插入,所述构建体只允许在插进被表达的基因后进行药物选择,并在测序中很容易被拯救(G.Hicksetal.,NaureGenetics16,338-334)。随后,很容易制备基因中带有新序列的具有剔除突变的转基因鼠以探测其功能。目前,这种技术对在鼠ES细胞很好表达的10%的鼠基因很适用。把UCOE掺入进整合性构建体中会使这种技术扩展到鉴定在鼠中被表达的所有基因。参照下面的实施例,但并不以任何方式限定本发明。下面详细描述本发明的几个有代表性的聚核苷酸的制备、试验和分析。本领域的技术人员可以适当改变这些步骤以用于制备和试验本发明其它的聚核苷酸。附图如下图1表示人类TBP基因座位。A含有用于本研究的人类TBP基因的pCYPAC-2克隆的示意图。可以指示未鉴定基因位置的NotI和SacII限制性位点的位置被标记出来了。B表示横跨5′TBP/C5区的CpG岛。CpG双核苷酸残基的密度提示无甲基化岛的长度为3.4kb且在C5的内含子I内的FspI位点和TBP的第一内含子中的HindIII位点间延伸。C是来自TBP/C5区的克隆的又一代表图。该基因的排列与在图1A中给出的相反。请注意,C5基因也被称为PSMB1基因。表示带有3个密连琐的基因位置的从端粒到染色体6q的257kb连续区以及有关的限制性位点被标示出来(B,BssHII;N,NotIS,SacII)。还标示出了具有其名称的PAC克隆。还显示了亚克隆pBL3-TPO-puro。在第一外显子PDCD2内的NotI位点到端粒重复区开端间的距离为150kb。图2表示TLN3和TLN8转基因鼠末端片段的分析。转基因鼠尾活检DNA样品的Southern印迹分析是分别用下列位点的小DNA片段进行探测的(a)转基因3′末端,(b)5′末端。(c)启动子,(d)来自TBPmRNACAP位点的-7.7kb片段,(e)来自TBPmRNACAP位点的-12kb片段。TLN3结果(a,b)表示使用两个末端探针的只有一个杂交带,这与任何头对头、头对尾、或尾对尾多联体的预测尺寸都不相符。可能在这一品系中只有一个转基因拷贝。然而,(c)图显示在这一品系中还应该有被缺失的转基因的第二个拷贝,因为从用启动子探针的印迹分析中可看见两条带。(a)中的TLN8分析显示了在6kb处的一条转基因多联体带和在7.8kb处的一个末端片段带。该多联体的强度是末端片段强度的两倍,这表示这个品系中的拷贝数为3。在(b)中缺少杂交说明在所有这三个拷贝的5′末端均产生了缺失,正在进行这方面的做图工作。图(d)和(e)表示转基因在TBP基因的5′端有约12kb是完整的。图3A表示TLN28鼠的分析。把TLB28的DNA的Southern印迹杂交到位于转基因座位的3′末端的一个探针上。可见到多条带可与该探针杂交,这说明有多个整合事件。不过在应该是头对尾的整合事件的位置上可以看到一个很强的多联体带。把这一结果与末端片段的信号强度进行比较可以看出这种品系中的拷贝数约为4。图3B表示在TLN鼠品系中转基因组织结构的总结。TLN3含有以头对尾的方式排布的两个拷贝的转基因。这种排列中在5′和3′末端均发生了缺失。5′缺失延伸进TBP的5′侧翼区,使得这个拷贝中的C5基因完全缺失。在3′末端,缺失延伸进TBP的3′UTR,使剩下的C5基因保持完整。因此这种动物具有单一拷贝的C5基因和一个有功能的TBP基因拷贝。TLN8含有以头对尾排列的三个拷贝。每个拷贝好象只在5′末端发生缺失,不过目前还不知道这种缺失的程度,如同人的C5mRNA在这一品系被缺失一样,其缺失并没有延伸到C5基因。TLN28含有头对尾排列的5个拷贝,不过可以看出还有许多附加片段,表示这种排列可能更复杂。图3C表示在TLN鼠系中转基因组织的最新总结。该图表示了在每种鼠系中TLN转基因排列的预测组织结构。只显示出功能基因,并只表示了TLN3鼠3种可能性排列中的一种。图4表示在TLN3鼠中缺失的分析。把一系列探针杂交进TLN3DNA的Southern印迹中。只有最远的5′探针给出了单一带,表明被缺失的拷贝不含这种序列。缺失图谱一直到主TBPmRNACAP位点、Ets因子结合位点和DNA酶超敏感位点的上游区。目前还不知道在这种拷贝中是否缺失了整个5′区,或者产生一个小型的内部缺失。图5表示对来自人类和鼠类TBP和C5mRNA序列的比较。(a)显示来自nt.358-708(基因库序列号D00761)的人类C5mRNA序列与来自nt.355-705(基因序列号X80686)的鼠类C5mRNA序列显著同源。人类与鼠类mRNAs的RT-PCR扩增产生这两种序列的350kbDNA分子的混合物。引物位置(图中显示加了底纹的5′引物C5RTF,3′引物C5R)被定位以便横跨多个外显子,消除进行PCR扩增因污染基因组DNA而引起的误差。尽管人类或鼠类内显子/外显子结构是有限的,但引物间的距离是固定的,因引物被固定在不同的外显子中。使用PstI进行温育就能区分开鼠和人的PCR产物,因PstI只切割鼠类序列。当在变性聚丙烯酰胺胶上分离时,C5RTF引物的放射性标记给出173nt产物。(b)表示对从外显子5中nt.901至外显子7中nt.1185的人类TBPmRNA序列(基因库序列号No.M55654)和来自核苷酸位置655至939的鼠类TBPmRNA序列(基因库序列号No.D01034)的类似分析。外显子最后的核苷酸和下一个邻近外显子的第一个核苷酸用红色表示。所用引物(图中显示加了底纹的)是5′TB-22和3′TB-14。上述两个序列带有引物的被扩增产物大小(图框的)为284bp。明显可以看出,距PCR产物的5′末端63nt的的Bsp1407I位点使得人和鼠的转录物可以区分。在聚丙烯酰胺胶上用放射性标记的TB-14人类特异性产物的大小为221nt。图6表示人类TBP在TLN转基因鼠中表达的分析。在用禽成髓细胞瘤病毒逆转录酶的逆转录反应中使用各种小鼠组织的总RNA(1μg)。作为对照,也使用了来自K562细胞的人类RNA和非转基因小鼠RNA。(a)表示的是在TB22/14RT-PCR产物内人类特异性限制内切核酸酶的识别位点的位置。(b)表示的是在各种组织中TLN3表达的分析。可以看出,人的表达水平在所有组织中都是生理水平的。(c)表示的是对LTN8的类似分析。(d)表示的是对LTN28的分析,再次表示人类TBPmRNA表达的水平与内源基因的表达水平是类似的。图7表示的是人类C5在TLN转基因鼠中表达的分析。进行了与图6相同的分析。上图(a)表示的是在C5RTF/C5RRT-PCR产物内小鼠特异性限制内切核酸酶的识别位点的位置。(b)可以看出C5在TLN转基因鼠的各种组织中表达,人的表达水平在所有被测组织中都是生理的。图8表示在TLN转基因鼠中(a)人类TBP基因表达和(b)人类C5基因表达的数量总结。图9表示pWE-TSN粘粒的示意图。图10表示pWE-TSNL细胞克隆的转基因拷贝数测定。用pWE-TSN粘粒转染小鼠L细胞,分离DNA并用于产生Southern印迹。该印迹用来自鼠源的vav基因座位的2个拷贝的DNA片段和来自TBP基因的-7kb处的一个探针来探测。拷贝数是根据与3个拷贝的TLN8对照的比率来确定的并且在每个泳道下部标示出来。拷贝数范围为1-60。图11表示小鼠L细胞中pWE-TSN粘粒克隆表达的总结。图12表示人类TBP基因座位DNA酶I超敏感位点的分析。使用位于距TBP基因40kb处的探针,来探测由增加DNA酶I浓度消化的K562核的Southern印迹。只发现了位于PSMB1和TBP基因的启动子处的两个超敏感位点。在所有情况下DNA酶I的浓度从左至右增加。图13A表示显示pCYAC衍生的160kb的大克隆MA160的人类hnRNPA2基因座位的示意图。反向箭头表示HPIH-γ基因。方框表示的两个SacII位点无甲基化岛。图13B表示衍生于MA160的60kbAatII亚片段,二者均被用于转基因鼠的制备。图13C表示横跨hnRNPA2基因5′末端的CpG岛(红线)的伸展。用垂直线表示CpG残基。数字是相对于与hnRNPA2基因(实线箭头)的转录起始位点(+1)而言的。虚线箭头表示背拖转录的HP1H-γ基因的位置。还显示出了含有完整hnRNPA2基因的16kb亚片段。图14表示人和鼠hnRNPA2基因表达的数量。用hnRNPA2基因的外显子12的引物将人(K562)和小鼠RNA反转录。随后用横跨外显子10至12的引物Hn9和Hn11采用PCR扩增样品。然后把所产生的产物用随机酶消化,以找出每个产物的独特切点。可以看出小鼠产物含有人类产物中没有出现的HindIII。图15表示在用Aa60片段(图13B)微注射的转基因鼠中人类hnRNPA2基因表达的分析。如图15所示,分析了来自所有组织的总RNA。在进行了RT-PCR后,把样品用HindIII(+)消化或不用HindIII进行处理(-),然后在聚丙烯酰胺胶上分离,产生人源(H)和鼠源(M)产物。用磷光图形分析仪测定带的强度。图16表示在用160kbNruI片段(图13A)微注射的转基因鼠中人类hnRNPA2基因表达的分析。把转基因鼠解剖并从组织中提取总RNA。把RNA用Hn11反转录,然后采用引物Hn9和Hn11进行PCR扩增,其中Hn9是用32P进行了放射性末端标记的。把样品用HindIII(+)消化或不用HindIII进行处理(-),然后,在含有8M尿素做为变性剂的5%聚丙烯酰胺胶上分离,产生人源(H)和鼠源(M)产物。用磷光图形分析仪测定带的强度。图17表示hnRNPA2转基因表达的数量。用磷光图形分析仪定量各种小鼠组织中人源hnRNPA2基因表达的RT-PCR分析。以转基因拷贝数为基础用鼠源hnRNPA2表达的百分率来表示水平。A带有MA160的小鼠(见图15)。B带有Aa60的小鼠(见图16)。图18表示人类hnRNPA2基因座位DNA酶I超敏感位点图谱。用渐增的DNA酶I浓度消化来自K562细胞的核。随后把些核酸的DNA用AatII和NcoI限制性内切酶来进行消化,并进行Southern印迹分析。然后用来自hnRNPA2基因的外显子II的766bpEcoRI/NcoI片段对该印迹进行探测。在相应于hnRNPA2转录开始位点5′端的-1.1、-0.7和-0.1kb处鉴定出三个超敏感位点。图19表示hnRNPA2和TBP基因座位间生物信息分析和序列比较。图20表示从5′HindIII位点(核苷酸1-9098)处开始的TBP基因座位的基因组克隆核苷酸序列。图21表示从图22(核苷酸1-15071)中所示的5′HindIII位点处开始的hnRNPA2基因座位的基因组克隆核苷酸序列。图22表示含有位于处于RNP和HP1H-γ间的双启动子区内的亚片段的表达载体,所述RNP和HP1H-γ是用GFP和NeoR报告基因指定的。这些载体是一个带有启动GFP/Neo表达的RNP启动子(RNP)的对照载体;一个含有RNP启动子区上游5.5kb片段和RNP启动子的载体(5.5RNP);使用剪切受体策略构建的载体,其特征在于剪切受体/分枝共有序列(衍生于RNP基因的外显子2)被克隆在GFP基因的前头,产生外显子1/GFP上游的部分内显子1(7.5RNP,在GFP之前携带约7.5kb的RNP基因);和一个含有RNP启动子区上游1.5kb片段和RNP启动子的载体(1.5RNP)。图23表示含有位于处于RNP和HP1H-γ间的双启动子区的亚片段的表达载体,所述RNP和HP1H-γ是用GFP和NeoR报告基因指定的。这类载体含有异源CMV启动子。这些载体是具有启动GFP/Neo表达的CMV启动子和位于ReoR报告基因上游的SV40启动子的对照载体(CMV-EGFP),该CMV启动子带有(a)内核糖体进入位点序列(CMV-EGFP-IRES)和(b)不具有内核糖体进入位点序列;一个含有位于RNP启动子区上游5.5kb片段和具有内核糖体进入位点并驱动GFP/Neo表达的CMV启动子的载体(5.5CMV);一个含有包含着RNP和HP1H-γ启动子的4.0kb序列的及启动GFP/Neo表达的CMV启动子的载体(4.0CMV),该载体在NeoR报告基因的上游有SV40启动子;以及一个含有7.5kbRNP基因序列和启动GFP/Neo表达的CMV启动子以及位于报告基因NeoR上的SV40启动子的载体(7.5CMV),该RNP基因包括外显子1和部分内显子1。图24表示把RNP-和CMV-构建体转染进CHO细胞中产生的数个G418R克隆。图25表示在用带有和不带有上游元件的RNP-及CMV-构建体转染的被G418选择的CHO克隆中GFP表达的比较。图26表示用带有和不带有上游元件的RNP-构建体转染的被G418选择的CHO克隆在40天的时间内平均中位GFP荧光水平。图27表示在没有G418的情况下培养的CMV-GFP库中GFP表达在103天的期间内的FACS分布图。图28表示在没有G418的情况下培养的5.5CMV-GFP库中GFP表达在103天的期间内的FACS分布图。图29表示在68天后的时间内表达GFP的转染细胞减少的百分率。图30表示在66天的时间内用CMV-构建体转染的被G418选择的细胞的中位荧光。图31表示在66天的时间内用CMV-构建体转染的被G418选择的阳性细胞的百分率。图32表示在转染后第13天用CMV-构建体转染的被G418选择的细胞的中位荧光。图33表示在27天的时间内用CMV-构建体转染的被G418选择的阳性细胞的百分率。图34表示用各种CMV-构建体的CHO细胞在转染后的克隆数。图35表示对人源PSMB1、PDCD2和TBPmRNA的斑点印迹分析。使用多个人源组织来分析TBP簇内基因的mRNA的组织分布每个片段都负载上一定量的聚(A)+RNA(A的量标在每种组织下,以ng表示)。用(B)PSMB1cDNA、(C)含有部分PDCD2基因的4.7kb基因组片段(MA445)及(D)TBPcDNA进行斑点印迹杂交。遍在蛋白对照探针(E)显示这种标准的方法是成功的,并且RNA是完整的。图36表示pWE-TSN克隆长期培养的效果。把许多pWE-TSN小鼠L细胞克隆连续培养60代。对于冷冻/解冻,在液氮中至少把克隆贮存2天,在收获RNA之前进行解冻并培养1周,然后将细胞冷冻进行下一个循环。在培养基中用和不用G418进行试验。如这里所述,用TB14寡核苷酸和人源特异性限制内切酶(用+表示)测定TBP的表达。所有样品均在没有酶的情况下进行了分析,并且结果是一致的。还示出了代表(-)的样品。图37表示在pBL3-TPO-puro克隆中TBP基因表达的分析。如这里所述,使用总RNA和TB14引物对TBP基因表达进行了分析,该总RNA是从用pBL3-TPO-puro构建体转染的小鼠L细胞中分离出的。泳道顶上的(+)表示PCR产物已用人源特异性酶消化,(-)表示未消化(对照)。还示出了人源(K562)和鼠源(非转基因肺)RNA对照及无RNA对照(dH2O)。箭头表示未切(人和鼠或鼠)位置以及人源特异性产物。将拷贝数校正成表达值,100%表达是指转基因的单个拷贝以两个内源鼠基因之一的同样水平表达。所有的拷贝数在1-2内变化,并被表示在每个柱图的上方。图38表示(B)人源HP1γmRNA表达和(C)人源hnRNPA2mRNA的斑点印迹分析。使用多个人源组织mRNA斑点印迹来分析hnRNPA2簇内的HP1γmRNA和hnRNPA2mRNA的组织分布给每个片段负载一定量的聚(A)+RNA(A的量表示在每种组织的下方,单位是ng)。用(B)来自HP1γcDNA序列的一个717ntPCR片段和(C)使用表达hnRNPA2的PCR引物5′GCTGAAGCGACTGAGTCCATG3′和5′CCAATCCATTGACAAAATGGGC3′产生的1237ntPCR探针进行斑点杂交。图39表示被整合进小鼠Ltk细胞的TBP转基因FISH分析结果,证明转基因整合到着丝粒异源染色质上。(A)表示没发生着丝粒整合,(B)和(C)表示两个独立的着丝粒整合。图40表示在用CET300和CET301构建体稳定转染的CHO细胞库中红细胞生成素(EPO)的表达,CET300和CET301构建体包含有位于RNP和HP1H-γ间的双重启动子区内的7.5kb亚片段、CMV启动子和编码EPO的基因。图41表示用16RNP-EGFP转染的小鼠Ltk细胞克隆的荧光EGFP表达以及其与拷贝数的关系。克隆F1、G6和I3具有位于鼠源着丝粒异源染色质上的16RNP-EGFP。图42表示用16RNP-EGFP转染的小鼠Ltk细胞的FISH分析。(A)表示没有着丝粒整合的克隆H4,(B、C、&D)分别表示具有着丝粒整合的克隆G6、F1和I3,t是16RNP-EGFP,c是鼠源着丝粒。图43表示在具有潮霉素B的条件培养41天的用EBV转染的Hela细胞中EGFP表达的FACS分布图,所述EBV包含16RNP。图44表示在整个培养过程中有潮霉素B存在和在第27天时去掉潮霉素B时的用EBV转染的Hela细胞中EGFP表达的FACS分布图,EBV包含有16RNP。图45表示在用CET300、CET301和CMV-EPO瞬时转染的细胞中EPO产量。图46表示在HepG2(AFP+ve)和KLN205(AFP-ve)细胞中检测各种AFP构建体的NTR表达的ELISA结果。图47表示在用CTL102/CTL208进行肿瘤内注射后NTR在HepG2肿瘤中和在宿主鼠肝中的表达。图48表示用CTL102/CTL208和CB1954进行肿瘤内注射给药后HepG2肿瘤的生长抑制。图49表示载体CET200和CET210的结构。图50表示所产生的构建体和所用片段与hnRNPA2内源基因组基因座位的比较。图51表示用非复制性质粒瞬时转染的HeLa细胞群体的中位荧光FAC分析图。图52表示用非复制性质粒瞬时转染的HeLa细胞群体低放大视野的示意图。实施例材料和方法文库筛选从P1衍生的人造染色体(pCYPAC-2)文库(CING-1;Ioannouetal.,1994)分离出横跨人源TBP和hnRNPA2基因座位的基因组克隆。用细菌溶解产物的聚合酶链反应(PCR)进行筛选。用于TBP的引物用Chalut等(1995)所述的部分基因组序列设计引物,该引物如下把TB3[5′ATGTGACAACAGTGCATGAACTGGGAGTGG3′](-605)和TB4[5′CACTTCCTGTGTTTCCATAGGTAAGGAGGG3′](-119)杂交到TBP基因的5′未翻译区(5′UTR)并且只产生源自人源基因的486bpPCR产物(见结果)。圆括号中的数字与Peterson等(1990)所限定的mRNACAP位点相对应。用TB5[5′GGTGGTGTTGAGAAGATGGATGTTGAGG3′](1343)和TB6[5′GCAATACTGGAGAGGTGGAATGTGTCTGGC3′](1785)扩增来自3′UTR的区域,并由于人和鼠DNA在这个区域中具有显著序列同源性,而产生来自此二者的415bp产物。圆括号中的数字与Peterson等(1990)所限定的cDNA序列相对应。用于HnRNPA2的引物由Biamonti等(1994)所述的基因组序列来设计用于HnRNPA2的引物。用5′UTR中的Hn1[5′ATTTCAAACTGCGCGACGTTTCTCACCGC3′](-309)和Hn2[5′CATTGATTTCAAACCCGTTACCTCC3′](199)给出508bp的PCR产物。用Hn3[5′GGAAACTTTGGTGGTAGCAGGAACATGG3′](7568)和Hn4[5′ATCCATCCAGTCTTTTAAACAAGCAG′](8176)扩增倒数第二外显子(数字10)中的一个区域,给出607bp的PCR产物。圆括号中的数字与Biamonti等(1994)所限定的转录起始点相对应。PCR流程在一个反应中使用1μl被合并的克隆材料进行PCR,其中在25μl总反应液中含有dATP、dGTP、dCTP、dTTP各25mM,1×反应缓冲液(50mMTris-HCl[pH9.1],16mM(NH4)2SO4,3.5mMMgCl2,,150μg/ml牛血清白蛋白),2.5单位的TaqSupreme聚合酶(Fermentas)和每种引物1μM。循环条件为前4个循环条件是94℃1分种、62℃1分钟、72℃1分钟,随后的30个循环条件是94℃1分钟、58℃1分钟、72℃1分钟。在含有30μg/ml卡那霉素的T-Broth(12g胰蛋白胨、24g酵母提取物(二者均为Difco的产品)、23.1gKH2PO4、125.4gK2HPO4、每升蒸馏水0.4%甘油;Tartof和Hobbs,1987)中培养识别为阳性的克隆。细菌的永久贮存液的制备为把1×贮存缓冲液(3.6mMK2HPO4、1.3mMKH2PO4、2.0mM柠檬酸钠、1mMMgSO4、4.4%甘油)中个体悬浮液在-80℃冷冻。CYPAC-2DNA分离如下所述,使用改良的碱溶菌方法(BirnboimandDolly,1979)分离质粒DNA。把单个细菌菌落移入含有1升T-Broth的2升隔板式玻璃烧瓶中,在37℃不断振荡温育16小时。用BeckmanJ6离心机在4200rpm(5020×g,随后的所有步骤与之类似)下离心10分钟得到细菌。搅动沉淀物,使沉淀物在15mMTris-HCl[pH8.0]、10mMEDTA、10μg/mlRNaseA(200ml)中再次悬浮,并在室温下温育15分钟。用2分钟边轻轻搅拌边加入溶菌液(0.2MNaOH、1%SDS;200ml),随后再用5分钟边轻轻搅拌边加入200ml中和溶液(3M乙酸钾[pH5.5])。使细菌破碎物在4℃下沉淀1小时,然后离心15分钟并用无菌纱布过滤上清液。在1小时内将异丙醇(400ml;最终浓度为40%)在室温下加入沉淀的质粒DNA。离心15分钟并用70%乙醇冲洗颗粒后,把DNA再次悬浮在由1×TNE(50mMTris-HCl[pH7.5]、5mMEDTA、100mMNaCl)、0.1%SDS和0.5mg/ml蛋白酶K(Cambio)构成的4ml溶液中,以便除去残存的蛋白质。在55℃温育1小时,接着用苯酚∶氯仿(1∶1v/v)提取,随后用1个体积的100%乙醇或异丙醇使DNA沉淀,并把该DNA放入2mlTE缓冲液(10mMTris-HCl[pH8.0]、1mMEDTA)。按常规可得到50μg/ml产物。限制性酶作图通过把衍生于pCYPAC-2和TBP基因序列的寡核苷酸杂交到上述的被限制性酶消化的克隆化DNA的Southern印迹上(Southern,1975),来进行限制性酶作图。使用杂交到刚好接近BamHI位点的pCYPAC-2序列的寡核苷酸,所述BamHI位点是基因组片段被克隆于此的位点。该寡核苷酸的序列是EY2[5′-TGCGGCCGCTAATACGACTCACTATAGG-3′]189[5′-GGCCAGGCGGCCGCCAGGCCTACCCACTAGTCAATTCGGGA-3′]用NotI从pCYPAC-2切除任一基因组插入片段意味着被递送的片段的每一段仍将保留少量的质粒序列。在EY2侧将有30bp,且在切除片段中有EY2序列的大部分。因此,将此寡核苷酸杂交至被NotI消化的pCYPAC-2序列,被传递的基因组带应当在Southern印迹分析中突出地显现。在pCYPAC-2中,在189侧被切下的片段将会含有质粒序列中的39bp,且189寡核苷酸序列的主要部分是NotI位点的3′。所以,这种寡核苷酸会在pCYPAC-2克隆的NotI消化处杂交到载体上。使用生产者推荐的条件(Fermentas),用限制性内切酶消化大约100ng质粒DNA,随后用0.5×TAE缓冲液(20mMTris-[pH8.0]、1mMEDTA、0.5μg/ml溴化乙锭)使其在0.7%琼脂糖凝胶或脉冲场凝胶上进行电泳。进行脉冲场凝胶电泳(PFGE)的条件是在CHEF-DRII体系(Biorad)中,1%PFGE琼脂糖(FMC)/0.5×TAE凝胶,6V/cm14小时,转换时间为1秒至30秒。在本研究过程中对所有PFGE分析使用了统一的条件。在紫外光照相前,把凝胶置1μg/ml溴化乙锭溶液中着色。在Southern印迹分析的准备中,首先把琼脂糖凝胶暴露于254nm紫外光(180000μJ/cm2在UVP交联剂中,UVP),随后浸入0.5MNaOH、1.5MNaCl中40分钟并在20分钟后更换一次溶液时使DNA变性,从而使DNA发生脱嘌呤。在大量刚变性溶液中通过16小时的毛管作用把DNA转移到HYBOND-N尼龙膜(Amersham)。通过以120000μJ/cm2暴露在254nm紫外灯下,可使核酸与尼龙交联。在0.5MTris-HCl[pH7.5]、1.5MNaCl中20分钟使膜中和,并在使用前用2×SSC冲洗。(1×SSC是150mMNaCl、15mM柠檬酸钠,[pH7.0])用T4聚核苷酸激酶和32P-γATP标记寡核苷酸探针5′末端,从而能检测Southern印迹上的特定片段。每个实验使用100ng标记的寡核苷酸且在生产商特定缓冲液中进行标记反应,其中使用2μl32P-γATP(>4000Ci/mmol;10mCi/ml,Amersham)和10个单位T4聚核苷酸激酶(Fermentas)。在37℃温育2小时后,在用水平衡的SephadexG50柱(Pharmacia)上层析除掉未结合的核苷酸。把末端标记的探针典型地标记至比活性>1×108dpm/μg。用夹在玻璃瓶内部尼龙筛片之间的膜进行杂交,瓶中有25ml预热的杂交混合物(1mMEDTA[pH8.0]、0.25MNa2HPO4[pH7.2],7%SDS;ChurchandGilbert,1984)和100μg/ml变性的经过剪切的鲑精DNA。在65℃预杂交1小时后,慢慢倒出溶液,替换为含有被标记探针的相同溶液。最适杂交温度根据实验确定,发现其为低于TE缓冲液中核苷酸的Tm20℃,计算公式为Tm=59.9+41[%GC]-[675/引物长度]。16小时后,除去杂交膜并冲洗3次,用6×SSC、0.1%SDS冲洗2分钟,随后,用X-射线底片(BioMAXKodak)拍照。DNA构建体从作为NotI片段的pCP2-TNNpCYPAC-2克隆(见图9)衍生出跨越TBP基因并带有12kb5′和3′侧翼序列的44kb基因组DNA区。把其克隆进装配型质粒载体pWE15(Clontech)产生pWE-TSN(图9)。由于pCYPAC-2质粒不含有真核细胞转染研究用的可选择标记,因此必须要对载体进行交换。NotI对pCP-TNN的消化使一个44kb片段得以释放出来,该片段从基因组插入片段的5′端延伸到NotI位点,该位点位于TBP(参见图9)最后的外显子下游12kb处的基因组序列中。此外,还产生了含有在克隆中保持着20kb3′侧翼序列的片段和pCYPAC-2载体。在10μl反应液中用约1μgNotI消化的pCP2-TNN和200ng类似剪切pWE15在上述条件下进行连接反应。把T4DNA连接酶热失活后,用GigapackGoldIII把完全连接混合物装进感染的λ噬菌体粒子(Stratagene)中。重组的细菌噬菌体贮存在SM缓冲液(500μl50mMTris-HCl、100mMNaCl、8mMMgSO4、0.01%(w/v)明胶、2%氯仿)。进行的感染如下把5ml过液培养的E.coliDH5α离心(3000×g,5分钟),并把细菌重新悬浮在2.5ml10mMMgCl2中。把相同体积的被包装材料和E.coli混合,在25℃温育15分钟,随后加入200μlL-液体培养基,把该混合物在37℃再温育45分钟。把该悬浮液放置在LB氨苄氰霉素琼脂板上,把被分析的单菌落作为以后数天用的小制品。从1升培养物中制备大量的pWE-TSN,用于pCYPAC-2克隆。pCYPAC-2DNA亚克隆方法下列程序用于亚克隆从pCYPAC-2克隆中衍生出的小型(小于10kb)限制酶片段。把DNA用限制酶消化,并且,在0.6%低熔点琼脂糖凝胶(FMC)电泳并在波长为365nm的紫外线下照相,以使溴化乙锭染色的DNA(Hartman,1991)切口减小。从凝胶上把含有所需尺寸的片段的凝胶区切下,在68℃熔化10分钟,再用5分钟平衡至37℃。把质粒载体pBluescriptKS(+)(Stratagene)用限制性酶进行类似消化,得到与pCYPAC-2衍生的DNA可相容的末端,用10单位的小牛肠磷酸酶(Fermentas)处理1小时以使自身连接最小化。通过用苯酚∶氯仿(1∶1v/v)提取并随后用乙醇沉淀,可对其进行纯化。把熔化的凝胶片与50ng的这种载体制品混合,达到片段对载体分子摩尔比4∶1。将T4DNA连接酶(10单位,Fermentas)与特定缓冲液一起加入,并把该混合物在16℃温育16小时,随后使酶热失活(65℃,20分钟),以提高转化效率(Michelsen,1995)。应用已有程序(Sambrooketal,1989)制备氯化钙感受态的DH5αE.Coli,并进行随后的转化。熔化和中和该连接混合物至37℃后,加入100μl感受态细胞保持最终琼脂糖浓度不超过0.02%,从而可完成转化。在冰上温育细菌2小时后,在37℃热激5分钟,随后加入1mlSOC介质(20g胰蛋白胨、5g酵母提取物、0.5gNaCl、每1升蒸馏水中20mM葡萄糖,[pH7.0];Sambrooketal.,1989)。再在37℃放置1小时后,把细胞与50μl选择溶液(36mg/mlXgal,0.1MIPTG)混合,并放置在含有20μg/ml氨苄氰霉素的适当LB抗生物素平板(10gNaCl[pH7.0]、10g胰蛋白胨、5g酵母提取物、每升蒸馏水20g琼脂)上。在37℃温育16小时后,因β半乳糖苷酶基因活性受到破坏,所以其本身的白色(相对色为兰色)可用于鉴定含有重组质粒的细菌菌落。通过对从单菌落小型制备样中分离的DNA进行限制性消化,对被选择的菌落进行分析。使用这种程序能把最大为20kb的片段亚克隆进pBluescriptKS(+)载体中。用下述程序对PCR扩增的产物进行克隆。在50μl体积中使用1ngpCYPAC-2衍生的克隆DNA作为模板进行标准PCR反应,之后,把10个单位T4DNA聚合酶(Fermentas)加到该反应中,并在37℃温育30分钟。使聚合酶失活(96℃,20分钟)后,把7μlPCR产物连接到50ngEcoRV消化的pBluescriptKS(+)载体中,最终体积为10μl。通过使用T4DNA聚合酶补平PCR产物末端产生高比例重组克隆(资料未显出)。PBL3-TPO-puro的产生PBL3-TPO-puro含有整个19kbTBP基因(约1.2kb5′和4.5kb3′侧翼序列)和嘌呤霉素抗性基因盒,其被亚克隆进pBL3载体。这是通过3个连续的克隆步骤获得的。首先,把4.5kb序列从pCP2-TLN亚克隆成为NotI-SacII片段,其中4.5kb序列在pCP2-TLN质粒中人源TBP基因的3′末端侧。该片段从TBP基因的3′UTR中的SacII位点延伸到pCYPAC-2载体内最接近OL189的NotI位点。把该片段克隆进SacII和NotI消化的pBL3并命名为MA426。余下的TBP基因序列留在19kbpSacII片段上,该片段从mRNA加帽位点的上游的约1.2kb处延伸到3′UTR中的SacII位点。把这种片段连接进用SacII线性化的MA426,并正确定向进行克隆筛选。DNA测序和计算机序列分析使用Flexi-Prep体系(Pharmacia)制备DNA,用BaseClear(Netherland)提供DNA的自动荧光测序。使用前述搜索工具(Altschuletal.,1997)对dBEST和非冗余Genbank资料库进行查询。用在该研究中的所有被表达序列标记克隆是通过I.M.A.G.E.聚生体(Lennonetal.,1996)得到的。使用程序PCGENE(IntelligeneticsInc.,USA)进行多个序列的排列对比并对已知DNA序列的限制酶消化方式进行预测。使用VectorNTI软件(InformaxInc.,USA)对CpG双核苷酸频率进行绘图。转基因动物的产生用于微量注射的TBP片段的制备通过pCP2-TLN克隆的NotI消化,把包含TBP/PSMB1基因区的90kb基因组片段(TLN)分离,并准备用于改良的氯化钠梯度方法(Dillon和Grosveld,1993)进行微量注射。首先,根据生产商提供的指导,使用LPS删除盒(Quiagen)从标准pCP2-TLN大量制备物中除去细菌脂多糖(LPS)。用70个单位的NotI(Fermentas)把50μgDNA消化1小时,通过PFGE进行小等分分析,以检查完全消化。使用商用梯度形成仪(LifeTechnologies)在超明亮型离心管(Beckman)中制备14ml含3mMEDTA的5-30%氯化钠梯度液。用宽口移液管尖把该被消化的DNA放置在该梯度液的顶部来进行极小剪切,在SW41Ti甩平式转头中(Beckmaan)以37000rpm把该梯度液离心5.5小时(25℃)。从梯度液底部(最高密度处)将约300μl的组分转移进含有1ml80%乙醇的各个微型离心管中,随后在-20℃培育1小时。离心(14900×g,15分钟)收集DNA沉淀物。把沉淀物用70%的乙醇冲洗,溶解在20μl转基因微量注射缓冲液中(10mMTris-HCl[pH7.4],0.1mMEDTA)并用凝胶电泳对不同组分中的5μl小份进行分析,以评价载体和染色体DNA的污染。收集无污染的组分,用260nm的吸收度来测定DNA浓度。通过NotI消化和用前述的电洗脱(Sambrooketal.,1989)进行纯化,可从pWE-TSN分离出40kb基因组片段(TSN)。电洗脱后,顺次用TE缓冲液饱和的苯酚∶氯仿(1∶1,v/v)、用水饱和的正丁醇两次进行提取以除去残留的溴化乙锭,从而使DNA纯化。用2个体积的100%乙醇使DNA沉淀,并再次悬浮在微量注射缓冲液中。通过PFGE及用260nm的吸收测定浓度,测定片段完整性。除了通过SalI消化从载体上释放出插入子以外,用统一的程序从pBL3-TPO中分离出25kb基因组片段(TPO)。用于微量注射的hnRNPA2片段的制备如上所述,用NruI消化pCP2-HLN和用氯化钠浓度梯度超离心的方法(见图13A),分离到了用于显微注射的包含hnRNPA2基因的160kb基因组片段(MA160)。用上述AatII消化和PFGE纯化的方法从MA160中分离到了60kb基因组片段(HSN;见图13B)。从凝胶中切出60kb条带,再切成小薄片。每片在65℃熔化,取30μl用PFGE分析。回收那些显示具有最纯60kb片段的样品的部分。熔化的凝胶度量体积后,加入琼脂酶缓冲液(终浓度为1X),42℃平衡10分钟,每500μl加入1个单位的琼脂酶(EpicentreTechnologies)。样品在42℃温育过夜后,4℃离心30分钟。上清液用宽枪头轻轻吸出,在10cm培养皿中在0.25μm滤器上对15ml转基因显微注射缓冲液液滴-透析4小时。透析完的溶液转入微量离心管,4℃离心30分钟。片段的完整性通过PFGE来检验,浓度用260nm吸光度来确定。转基因小鼠的构建通过核注射C57/B16小鼠的受精卵得到转基因小鼠。在转基因缓冲液中每个DNA片段的注射浓度为1ng/μl。这由UMDSTransgenicUnit(StThomas′sHospital,London)使用标准技术进行鉴定。用下面提到的分离的小鼠尾巴活检DNA做PCR筛选来鉴定转基因小鼠。从10-15日龄小鼠的身上取0.5cm尾巴活体,加入500μl尾缓冲液(50mMTris-HCl[pH8.0],0.1MEDTA,0.1MNaCl,1%SDS,0.5mg/ml蛋白酶K)在37℃温育16个小时。水相用等体积的苯酚∶氯仿(1∶1v/v)轻轻地翻转抽提,随后14900g离心15分钟。接着用两倍体积100%乙醇从水相中沉淀DNA,用70%乙醇洗涤。最后收集DNA,用100μlTE溶解。通常这样可以得到50-200μgDNA(通过260nm吸光度来确定)。PCR反应的条件和pCYPAC-2库的筛选条件一样,模板用100ng小鼠尾巴活体DNA,引物用TB3/TB4。得到的阳性小鼠与野生型C57/B16小鼠回交,从而得到完全转基因的F1子一代。转入基因的完整性和拷贝数转入基因的拷贝数和完整性通过用BamHI、BglII、EcoRI和HindIII消化的小鼠尾巴活体DNA作Southern印迹分析来评价。大约10μgDNA用20-30单位的特定限制性内切酶消化,走0.7%的琼脂糖凝胶电泳,缓冲液为0.5XTBE(45mMTris-硼酸,[pH8.0],1mMEDTA),1V/cm电泳16个小时。除了使用带正电荷的基质(HYBONDN+,Amersham)之外,和质粒Southern印迹的条件一样,DNA被染色,然后转移到了尼龙膜上。通过用限制性内切酶消化以除去任何克隆的载体序列来制备DNA探针,并用Gene-Clean系统(Bio101,USA),从低熔点琼脂糖中纯化。用商品化试剂盒(Amersham)和dCTP、dGTP、dTTP分别200pmol和3μlα-32P-dATP(比活性大于3000Ci/mmol,10mCi/ml,Amersham)经过缺口翻译对100ng探针样品进行放射性标记。加入由每10pgDNaseI含有0.5个单位的DNA聚合酶I的标准缓冲液形成的酶溶液,15℃温育2.5小时。探针用SephadexG-50层析纯化,临用前煮沸5分钟。通常可以得到比活性大于1×108cpm/μg的探针。杂交的方法和上述质粒Southern印迹方法一致。膜在100μg/ml含有变性鲑精DNA的15ml预杂交溶液(3XSSC,0.1%SDS,5XDenhardt′s溶液[100XDenhardt′s溶液为2%Ficoll(Type400,Pharmacia),2%聚乙烯基吡咯烷酮,每升蒸馏水2%牛血清白蛋白(FractionV,Sigma)])中65℃温育1小时。接着溶液换成含有100μg/ml变性鲑精DNA和热变性的放射性标记探针的15ml杂交溶液(向预杂交溶液中加入硫酸葡聚糖至10%)。65℃杂交16个小时后,用含0.1%SDS的2XSSC洗膜三次,每次30分钟,在-80℃用PhosphorImager(MolecularDynamics)成像或者拍X光片。在0.2MNaOH中浸泡20分钟除去结合的探针,用上述方法中和,对印迹进行再次分析。实验中用到的大部分探针都来自基因组克隆中序列并不清楚的区域(比如pCP2-TLN末端探针和其他来自TBP内含子区域的探针)。许多探针并非特异性地与人基因组DNA杂交,这暗示可能存在竞争性序列元件。为了回避这个问题,将探针DNA等份一个一个单独用多种限制性内切酶消化、并进行电泳和Southern印迹。用识别位点短的酶把探针消化成一些更小的片段。放射性标记的人C0t-1DNA被用来作为探针以显示这些片段是否含有竞争性序列。由于所用探针含有竞争性序列,所以用这个方法有可能得到不和C0t-1DNA探针杂交的大于500bp的片段。制备装配型质粒DNA和单拷贝L-细胞克隆的创建用从碱法溶菌1升培养物至异丙醇沉淀步骤的上述方法制备pWE-TSNDNA。沉淀在25℃温育1个小时后,用300μlTE悬浮,随后加入10mlSephaglasFPDNA结合基质(Pharmacia)。溶液持续上下颠倒10分钟,结合在基质上的DNA用280×g离心1分钟收集。沉淀先用WS缓冲液(20mMTris-HCl[pH7.5],2mMEDTA,60%乙醇)洗涤,离心收集,再用70%乙醇洗,再次离心。沉淀用2mlTE缓冲液悬浮,70℃温育10分钟并不时混合,从而把DNA从基质上洗脱下来。用1100×g离心溶液2分钟,并将含有DNA的上清液平均转入两个微量离心管。残留的Sephaglas用14950×g离心15分钟除去,合并上清液,用两倍体积乙醇沉淀DNA。用70%乙醇洗涤缠绕的DNA一次,并用无菌水悬浮使之浓度为1μg/μl。用这个方法通常可以得到75-100μg纯的装配型质粒DNA,这大致是未经Sephaglas纯化得到的DNA的60-80%。转染粘附的小鼠L-细胞(Earle等,1943)用如下方法。大约1×107细胞在含有10%热灭活胎牛血清(PAA实验室)、2mML-谷氨酰胺的DMEM中生长。将细胞与1μgSalI线性化的pWE-TSNDNA混匀,置冰上培育10分钟。用电穿孔法(Chu等,1987)把DNA导入细胞,条件为960μF,250V,仪器是BioradGenePulser。用含有400μg/mlG418(LifeTechnologiesInc.)的同样的培养基筛选和培养转染细胞。单个克隆用克隆环(Freshney,1994)分离得到。厚壁不锈钢克隆环(LifeTechnologiesInc.)在硅油中高压灭菌并转移至组织培养板上,以此分离细胞群落。加入胰蛋白酶溶液(300μl0.25%胰蛋白酶[pH7.6](Difco),0.25MTris-HCl[pH8.0],0.4%EDTA[pH7.6],0.12MNaCl,5mM葡萄糖,2.4mMKH2PO4,0.84mMNa2HPO4·12H2O,1%酚红),37℃温育板5分钟。把细胞转入24孔板并建立克隆细胞系。用下面的方法保存克隆。离心收获大约1×107细胞,用0.75ml冷冻混和液(70%标准培养液,含20%胎牛血清和10%的DMSO)悬浮,用干冰速冻1小时,然后转入液氮中保存。用标准的方法(Sambrook等,1989)可以从这些L-细胞克隆中得到基因组DNA。T75培养瓶的细胞培养到长成单层(大约为4×107),去掉培养液,用PBS(2.68mMKCl,1.47mMKH2PO4,0.51mMMgCl2,136.89mMNaCl,8.1mMNa2HPO4[pH7.3])洗培养瓶,然后加入2ml溶解缓冲液(10mMTris-HCl[pH7.5],10mMEDTA,10mMNaCl,0.5%SDS,1mg/ml蛋白酶-K)。把细胞从培养瓶上刮下,用大孔吸液管转入15ml离心管。68℃溶解16个小时后,用苯酚∶氯仿(1∶1v/v)提取一次,并用等体积异丙醇沉淀DNA。70%乙醇洗之后,用1mlTE再次悬浮DNA并用260nm吸光度来确定浓度。转染基因拷贝数用BglII消化的基因组DNA的Southern印迹分析来确定。用一个定位在C5基因(TBP转录起始区域5′端4kb且其测定一个4.2kb片段(见图10))内的特定探针(1.4HX)检测人TBP。同时印迹用来自内源性小鼠vav基因座位(Ogilvy等,1998)的1kbNcol片段进行探测,其产生一个5.2kb的条带并作为单拷贝参照标准。通过在PhosphorImager分析印迹后参照3拷贝的转基因小鼠系TLN8,对比TBP和vav信号的比例,来确定人TBP转基因拷贝数。用1ml3MLiCl、6M尿素处理大约4×107细胞,采用选择沉淀的方法制备得到全RNA(Auffrey和Rougeon,1980;参考Antoniou,1991)。DNaseI超敏感位点分析本实验采用前面提到过的方法(Forrester等,1987;Reitmann等,1993)。从大约1×109K562细胞中制备细胞核(Lozzio和Lozzio,1975)。收获的细胞用PBS洗,用4ml冰预冷的RSB(10mMTris-HCl[pH7.5],10mMNaCl,3mMMgCl2)悬浮,加入装有活动杵的玻璃匀浆器中。加入1ml0.5%NP40/RSB后,经过10-20个行程使细胞均化并加入50mlRSB,4℃640xg离心5分钟,以此来收获核。去除上清液,用含1mMCaCl2的1mlRSB悬浮细胞核。马上取100μl(约1×108核),按下面的方法纯化DNA,分离中要注意控制核酸内切酶活性。按下面的方法进行DNaseI的消化。取0.2mg/mlDNaseI(Worthington)不同体积(0,0.5,1,2,3,4,5,6,8,10μl),加入含有100μl细胞核的各个小管,37℃温育4分钟。加入100μl2X停止液(20mMTris-HCl[pH8.0],10mMEDTA,600mMNaCl,1%SDS)和10μl蛋白酶-K(浓度为10mg/ml),55℃温育60分钟,以停止酶切反应。用苯酚∶氯仿(1∶1v/v)抽提及乙醇沉淀进行DNA纯化。样品通过0.7%琼脂糖(0.5XTBE)凝胶电泳,用32P放射性标记的探针Southern印迹分析。制备RNA10-40周龄成年小鼠断颈处死,分离全部组织,在液氮中速冻,-80℃保存备用。用3MLiCl,6M尿素处理,采用选择沉淀的方法得到全RNA(Auffrey和Rougeon,1980)。把组织转入含有1mlLiCl-尿素溶液的14ml小管中,并用一台Ultra-TurraxT25(Janke和Kunkel)匀浆30秒。样品再经3次30秒超声波脉冲(Cole-ParmerInstrumentCo.USA)破碎,匀浆转入灭菌微量离心管,4℃沉淀RNA16小时。通过离心(4℃,14900xg,20分钟)收集RNA,用500μlLiCl-尿素溶液洗涤,500μlTES(10mMTris-HCl[pH7.5],1mMEDTA,0.5%SDS)悬浮。样品经过苯酚∶氯仿提取后,加入醋酸钠至0.3M,加入1ml100%乙醇及-20℃沉淀至少1个小时。通过离心收获RNA,用20μl无菌水悬浮,并用260nm吸光度确定浓度。基于竞争RT-PCR的分析分析人TBP基因的表达采用一种改进的竞争RT-PCR方法(Gilliland等,1990)来准确定量人TBP和PSMB1基因在小鼠中的表达。从转基因小鼠组织或细胞系中提取的全RNA(1μg)在25μl反应体系(10单位鸟成髓细胞血症病毒[AMV]逆转录酶[Promega],10mMDTT,2.5mM各dNTP,25个单位核糖核酸酶抑制物[Fermentas],1μM反向引物[TB14或C5R],1X反转录缓冲液[25mMpH8.3Tris-HCl,25mMKCl,5mMMgCl2,5mMDTT,0.25mM亚精胺])中进行反转录。在42℃1小时,52℃1小时,95℃热灭活酶5分钟进行cDNA的合成。PCR反应用1μlcDNA进行扩增,其中使用的反应混和物述于上文中小鼠尾巴活体筛选一节并含有特异于正被探讨的序列的引物。引物通过两轮SephadexG25色谱(Pharmacia)纯化,收率将近80%。PCR反应条件是94℃1分钟、58℃1分钟、72℃1分钟,且有5到30个循环。为了区别人和小鼠PCR产物,各取2-10μl样品,加入5个单位相应的限制性内切酶,37℃温育2小时。反应体系体积较大(250μl),从而可以稀释PCR缓冲液中的盐分和去垢剂,以防止它们抑制限制性内切酶活性(从对照结果来看,这是必须的)。酶切和没有酶切的样品通过与25μg酵母tRNA(Sigma)和乙醇共沉淀,离心收集,用5μl凝胶电泳上样缓冲液(5mMTris-硼酸[pH8.3],1mMEDTA,7mM尿素,0.1%二甲苯蓝,0.1%溴酚蓝)悬浮。样品经过预电泳分析,其中使用以7M尿素(NationalDiagnositics为变性剂的5%聚丙烯酰胺凝胶),缓冲液为0.5XTBE。40V/cm电泳1个小时后,切割凝胶以除去残留的未掺入的核苷酸,这些核苷酸跑在二甲苯蓝染料的前面,进行干燥,拍X光片或者用PhosphorImager成像分析。分析人hnRNPA2基因的表达采用一个相似的竞争RT-PCR方法(Gilliland等,1990)准确定量人hnRNPA2基因在小鼠中的表达。反转录之后,cDNA样品通过PCR进行扩增,使用引物组Hn9和Hn12[5′-CTCCACCATATGGTCCCC-3′],其中的一个引物用上述方法进行末端标记。为了鉴定人和小鼠hnRNPA2基因PCR产物,各取2-10μl样品,加入5个单位的HindIII,37℃消化2小时,纯化,5%变性聚丙烯酰胺凝胶电泳,结果按上述方法进行定量分析。克隆的测序和生物信息学分析TBP(1-9098核苷酸,见图20)和hnRNPA2(1-15071核苷酸,见图21)基因座位的HindIII基因组克隆由Baseclear,Leiden,NL进行测序。用由已知序列制得的引物开始的引物步查方法,测得未知序列区域(TBP核苷酸1-5642,hnRNPA2核苷酸1-3686)。把这些序列和已知的序列信息拼接起来,进行生物信息学分析。用标准的Smith-Waterman搜索直接比较TBP和hnRNPA2序列。结果显示,除如图19所示的几个Alu重复序列外,没有明显的同源区。屏蔽这些重复序列,并用GCG最佳拟合程序进行比较,结果找到了如下所示的两段很短的同源序列。RNP3868-3836TBP8971-9003长度=33同源性=75.758%RNP3425-3459TBP9049-9083长度=35同源性=74.286%经过鉴定,CpG-区域如图19所示。核苷酸位置如下所示RNP4399-5491,5749-6731TBP5285-5648,6390-6966按上述方法进行序列分析,以从RNP和TBP基因的上游区域得到更多的序列信息。图20和21给出的序列数据开始于HindIII位点的5′端,并包括Baseclear测得的序列和已经发表的经拼接得到的序列数据。其中Baseclear测得的TBP序列用大写字母表示。这些序列的分析表明存在一个已经定性的基因,HP1H-γ或RNP基因上游的异染色质相关蛋白H-γ(图19和22)。人体组织斑点印迹分析表明这个基因普遍表达(没有提供这个数据)。生物信息学分析和序列比对表明这两个基因座位之间没有明显的序列同源性。图19中显示了这些数据的概要。可以看到,几个公认的Sp1转录因子结合位点定位在这两个基因座位的双向启动子区域。也指出了未被甲基化的CpG区域。两个基因座位有双向结构,并含有一系列普遍表达的基因。hnRNPA2EGFP报告结构的构建通过用KpnI和NotI消化pEGFP-N1(Clontech)以递送EGFP序列,得到CMV-EGFP-IRES,导入被KpnI和NotI部分消化的pIRESneo(Clontech)。这样就构建了一个含有EGFP基因的载体,且EGFP位于CMV启动子的3′端,和位于IRESneo的5′端(CMV-EGFP-IRES)。将CMV启动子替换成RNP启动子来构建图22的结构。用AgeI消化CMV-EGFP-IRES,用T4DNA聚合酶(50mMTrispH7.5,0.05mMMgCl2,0.05mMDTT,1mMdNTP,每μgDNA1个单位T4DNA聚合酶)补平末端,接着用NruI酶切去掉CMV启动子以产生EGFP-IRES。从8kb的hnRNPA2HindIII克隆(8kbHindBKS,含有启动子和RNPA2和HP1H-γ基因的第一个外显子)中除去RNP启动子。用BspEI和Tth111I切8kbHindBKS(递送630bp的启动子),T4DNA聚合酶补平末端,将分离的RNP启动子连入EGFP-IRES。把EGFP-IRES盒插入8kbHindBKS构建5.5RNP,从而可通过RNP启动子来控制EGFP的表达。后者经过用Tth111I部分消化,用T4DNA聚合酶补平末端,再用SalI酶切,从而去除RNP启动子3′端的所有序列。用AgeI酶切把EGFP-IRES盒从CMV-EGFP-IRES中移出,补平末端后用XhoI酶切。然后连接进限定的8kbHindBKS。通过把CMV-EGFP-IRES盒插进8kbHindBKS,并随后去掉RNP启动子来构建5.5CMV。8kbHindBKS经过BspEI酶切,补平末端,SalI酶切去除RNP启动子和启动子3′端的所有序列。用NruI和XhoI酶切CMV-EGFP-IRES移走CMV-EGFP-IRES盒,然后将其移入酶切过的8kbHindBKS。大约从5.5RNP中去除4kbDNA,使RNP启动子5′端只留下1.5kb,构建成1.5RNP。此过程通过用BamHI消化5.5RNP进行,其得到4、2.9和5kb三个片段。分离2.9和5kb片段,重新连接起来,当2.9kb片段插入正确的位置时构建成1.5RNP。5.5RNP构建体延伸至含有位于RNP启动子3′端的hnRNPA2序列(构建体7.5RNP和8.5RNP),这个区域包括hnRNPA2基因的第一外显子和内含子。为了把EGFP-IRES报告基因加入这些结构中,必须把hnRNPA2基因外显子2的剪接受体序列和EGFP包括进来,这样,hnRNPA2基因的外显子1可以拼接到EGFP基因上,而EGFP基因的表达也可以脱离RNP启动子的控制。构建包含80bp的hnRNPA2基因拼接位点和第二外显子5′端的大约1kb区域的两个构建体,这些序列是用PCR方法从含有全部hnRNPA2基因序列的MA160中得到。用PCR方法分离80bp序列(20mMTris-HClpH8.4,50mMKCl,1μM引物,2mMMgCl2,0.2mMdNTP,3.5μgMA160DNA,5个单位铂TaqDNA聚合酶),其中引物为[5′ACCGGTTCTCTCTGCAAAGGAAAATACC3′]和[5′GGTACCCTCTGCCAGCAGGTCACCTC3′],分离1kb片段所用引物为[5′ACCGGTTCTCTCTGCAAAGGAAAATACC3′]和[5′GGTACCGAGCATGCGAATGGAGGGAGAGCTCCG3′]。设计这些引物使其PCR产物在5′端和3′端分别含有KpnI和AgeI酶切位点。将PCR产物克隆到TA克隆载体pCR3.1(Invitrogen)。从pCR3.1中分离出80bp和1kbKpnI-AgeI片段,转入KpnI部分消化过的CMV-EGFP-IRES,接着用AgeI酶切处理,这样就构建了EGFP基因和剪接受体(SA)的符合读框的融合。通过用ClaI消化8kbHindBKS、T4DNA聚合酶补平末端和SalI消化,构建了7.5RNP。用KpnI部分酶切、T4DNA聚合酶补平末端和XhoI消化,分离得到80bpSA-EGFP-IRES片段。将其导入ClaI-SalI消化过的8kbHindBKS。8.5RNP的构建如下。用SphI部分消化8kbHindBKS及SalI酶切处理。然后通过类似的SphI部分消化和XhoI酶切得到1kbSA-EGFP-IRES盒,将盒导入8kbHindBKS来构建8.5RNP。通过用BamHI/HindIII/BstEII从8kbHindBKS中切出一个4kb片段来构建4.0CMV。片段的末端用Klenow和T4DNA聚合酶补平。用AseI对pEGFP-N1(Clontech)进行线性化处理,用上面的方法补平末端,用小牛小肠磷酸酶(CIP)处理。所有片段连接过夜。从p8kbHindBKS中用HindIII切出8.3kb片段,以构建p7.5CMV。该片段末端用Klenow和T4DNA聚合酶补平。用AseI把pEGFP-NI(Clontech)线性化,末端如上补平,再用小牛小肠磷酸酶(CIP)处理。把这两种片段连接过夜。从所有克隆中进行正向和反向8.3kbUCOE插入子的筛选。用SalI从MA551(hnRNPA2基因组克隆,其包含含有整个编码区(如图13C所示的16kb片段)的5kb5′序列和1.5kb3′序列)中切出一个16kb的片段,以构建p16CMV。片段的末端用Klenow和T4DNA聚合酶补平。用AseI对pEGFP-N1(Clontech)进行线性化,末端如上补平,然后用小牛小肠磷酸酶(CIP)处理。两种片段连接过夜。从所有克隆中进行正向和反向16kbUCOE插入子的筛选。CHO细胞的转染从2×107细胞/ml的无血清培养液中收获CHO细胞。每次用1×107细胞(0.5ml)来进行转染,同时使用1μg(5μl)线性DNA和50μg(5μl)鲑鱼精载体DNA。DNA和细胞混合后,置冰上10分钟。用BioRadGenePulserIITM在975μF/250V的条件下进行细胞电穿孔,之后置冰上10分钟。接着把混合物加入10ml完全培养基(HF10),1400rpm离心5分钟。去除上清液,用5mlHF10悬浮沉淀。然后,将每5×104或1×104细胞铺在一个10cm细胞培养皿上或每个T225瓶2×106细胞。经过24小时后,用300μg/mlG418进行筛选,4天后使用600μg/mlG418。转染10天后,细群落用亚甲基蓝(用50%乙醇配制的2%溶液)染色和计数。平行实验的细胞以严格挑选的细胞群落或单细胞克隆的方式保种培养。转染的CHO细胞克隆中GFP基因的表达分析转染细胞用600μg/mlG418进行筛选。从6孔板上洗下细胞作GFP表达分析。细胞用磷酸盐缓冲液(PBS,Gibco)洗,然后用胰蛋白酶/EDTA(Sigma)培育直至细胞从培养板上脱落下来。将添加了10%胎牛血清(FCS,Sigma)的过量Nutrient混和物F12(HAM)培养基(Gibco)加入细胞,并将细胞转入5ml圆底聚苯乙烯管。用Becton-DickinsonFACscan分析细胞,通过比较亲代细胞的自身荧光来检测GFP基因的表达。分析19RNP克隆、245.5RNP克隆、21CMV克隆和125.5CMV克隆,结果取所有阳性克隆的荧光平均值。转染的CHO细胞群落中GFP基因的表达分析将经过G418筛选的转染的CHO细胞群从T225组织培养瓶中取出,铺在10cm细胞培养皿上,其中每盘大约100个集落。当集落长大之后,取出细胞,对这有的转染细胞库做GFP表达分析。每隔3-4天细胞以1∶10分裂,同时用常规方法检测GFP表达。每次分析前细胞都被分到24孔板,这样检测当天细胞差不多长到了50%覆盖率。接着从24孔板上取出细胞,用和前面相同的方法分析。对于表达时程,选定了一个只含有一小部分阳性细胞的标记区域(M1),用来研究GFP基因的表达随时间的降低。单拷贝或低拷贝整合基因的FISH分析用40kb的TBP质粒pWE-TSN或者pBL3-TPO-puro做FISH分析用40kbTBP质粒pWE-TSN(图9)或25kb粘粒pBL3-TPO-puro对生长在DMEM-10%胎牛血清的小鼠Ltk-细胞进行电穿孔。用200mg/mlG418(TSN)或5mg/ml嘌呤霉素(TPO)筛选转染细胞,这样就得到了标题提到的单拷贝或低拷贝克隆。收获细胞前,用0.4mg/ml秋水仙碱处理筛到的克隆中的对数生长期细胞1个小时。接着将细胞在0.056MKCl中低渗溶胀,用3∶1的甲醇-乙酸处理,并铺在显微镜载玻片上,得到中期染色体。载玻片事先用含有100mgRNaseA/ml的2XSSC(1XSSC是0.15MNaCl,0.015M柠檬酸钠)37℃处理1个小时,用2XSSC洗,并经过一系列乙醇(70、90和100%的乙醇)脱水。用含70%甲酰胺的2XSSC使染色体在70℃变性5分钟,投入冰预冷的70%乙醇,如上脱水。利用生产商指示的缺口翻译(Boehringer)方法,用毛地黄毒苷-11-dUTP和生物素-16-dUTP分别标记100ng的TBP探针(携带由TBP基因组成的25kb人基因组序列的整个TPO质粒)和50ng的小鼠γ-卫星探针(Horz等,Nucl.AcidsRes.9;683-696,1981)。标记的探针用1mgcot-1DNA和5mg鲱鱼精DNA沉淀,用50%甲酰胺-2XSSC-1%Tween20-10%硫酸葡聚糖溶液再次悬浮,在75℃变性。TBP探针在37℃预退火30分钟,富集,加到载玻片上。在37℃杂交过夜。载玻片在45℃用50%甲酰胺-2XSSC洗4次,每次3分钟;45℃用2XSSC洗4次,每次3分钟;60℃用0.1XSSC洗4次,每次3分钟。用4XSSC-0.1%Tween20洗5分钟之后,用4XSSC-5%脱脂牛奶封闭载玻片5分钟。通过依次与下面这些试剂在37℃温育30分钟检测生物素标记的探针偶联亲和素的TexasRed(VectorLaboratoriesInc,USA),生物素化的抗-亲和素(VectorLaboratoriesInc,USA),偶联了亲和素的TexasRed(VectorLaboratoriesInc,USA)。毛地黄毒苷标记的探针和生物素同时检测,所用试剂依次如下抗-毛地黄毒苷-荧光素(FITC,Boehringer),小鼠抗-FITC(DAKO),荧光素结合的马抗鼠IgG(VectorLaboratoriesInc,USA)。在每两次温育之间,用4XSSC-0.1%Tween20洗载玻片3次,每次2分钟。用DAPI(4′-6-二脒基-2-苯基吲哚)复染载玻片,用Vectashield(VectorLaboratoriesInc,USA)固定。用物镜为100X油镜的荧光显微镜观测结果。结果图像使用仪器Photometricscooledcharge-coupledevicecamera和VysisSmartcapture软件获得。用16RNP-EGFP构建体做FISH分析通过把EGFP-IresNeo表达盒和8.5RNP中的一些RNP5′序列插入MA551,构建了16RNP-EGFP载体。8.5RNP用XhoI消化,T4DNA聚合酶补平末端,再用PacI消化。将最后得到的片段导入NheI剪切、补平和用PacI处理过的MA551。如同8.5RNP一样,表达由RNP启动子驱动,因此产生EGFP和RNP的外显子1的符合读框的融合。转染了16RNP-EGFP的小鼠LTK-细胞克隆在DMEM-10%胎牛血清和200μg/mlG418中培养。收获细胞前,用0.4μg/ml的秋水仙碱处理对数生长期细胞1个小时。接着细胞用0.056MKCl低渗溶胀,用3∶1的甲醇-乙酸处理,并铺在显微镜载玻片上以得到中期染色体。载玻片事先用含有100μgRNaseA/ml的2XSSC(1XSSC是0.15MNaCl,0.015M柠檬酸钠)在37℃处理1个小时,用2XSSC洗,并经过一系列乙醇(70,90和100%的乙醇)脱水。用含70%甲酰胺的2XSSC使染色体在70℃变性5分钟,投入冰预冷的70%乙醇,如上脱水。采用生产商说明的缺口翻译(Boehringer)的方法,用毛地黄毒苷-11-dUTP和生物素-16-dUTP分别标记100ng的16RNP-EGFP和50ng的小鼠γ-卫星探针(Horz等,Nucl.AcidsRes.9;683-696,1981)。标记的探针用5μg鲱鱼精DNA和乙醇沉淀,RNP探针用1μgcot-1DNA沉淀;用50%甲酰胺-2XSSC-1%Tween20-10%硫酸葡聚糖溶液悬浮;在75℃变性后,RNP探针在37℃预退火30分钟;富集,并加到载玻片上。在37℃杂交过夜。载玻片在45℃用50%甲酰胺-2XSSC洗4次,每次3分钟;45℃用2XSSC洗4次,每次3分钟;60℃用0.1XSSC洗4次,每次3分钟。用4XSSC-0.1%Tween20洗5分钟之后,用4XSSC-5%脱脂牛奶封闭载玻片5分钟。通过依次与下面这些试剂在37℃温育30分钟检测生物素偶联了亲和素的TexasRed(VectorLaboratoriesInc,USA),生物素化的抗-亲和素(VectorLaboratoriesInc,USA),偶联了亲和素的TexasRed(VectorLaboratoriesInc,USA)。毛地黄毒苷和生物素同时检测,所用试剂依次如下抗-毛地黄毒苷-荧光素(FITC,Boehringer),小鼠抗-FITC(DAKO),荧光素结合的马抗鼠IgG(VectorLaboratoriesInc,USA)。在每两次温育之间,用4×SSC-0.1%Tween20洗载玻片3次,每次2分钟。用DAPI(4′-6-二脒基-2-苯基吲哚)复染载玻片,用Vectashield(VectorLaboratoriesInc,USA)固定。用物镜为100X油镜的OlympusBX40荧光显微镜观测结果。结果图像使用Photometricscooledcharge-coupledevicecamera和VysisSmartcapture软件获得。拷贝数的确定采用了标准的方法(Sambrook等,1989)从细胞克隆中获取基因组DNA。通过对HincII消化的基因组DNA进行Southern印迹分析来确定转染基因拷贝数。用来自16RNP-EGFP的包括新霉素抗性基因并用[α-32P]dCTP标记(MegaprimeDNA标记系统,Amersham)的1kb片段杂交可以检测到一个2.5kb的转基因条带。为了标准化,印迹同时用来自小鼠vav基因座位(Ogilvy等,1998)的如上标记的1kbpNcoI片段杂交,其产生一个1.4kb的条带。作为拷贝数目标准,来自几个pWE-TSN克隆的DNA被PstI消化,并与上述探针杂交。用CyclonePhorsphorImager(Packard)定量杂交信号。转染的Ltk克隆中GFP基因的表达分析转染细胞在200μg/mlG418选择下维持。从6孔板上刮下长到80-100%覆盖率的细胞,做GFP基因表达分析。细胞用PBS洗,用胰蛋白酶/EDTA(Sigma)处理直至细胞从培养板上脱落下来。向细胞中加入含10%胎牛血清的过量DMEM(Gibco),并转入5ml圆底聚苯乙烯管。细胞用一台Becton-DickinsonFACscan分析,通过比较未转染的对照的自身荧光来进行GFP荧光检测。EBV报告构建体的产生在制造商推荐的条件(NEB)下用限制性内切酶AseI和AflII(NEB)从pEGFP-N1(Clontech)载体上切去含有巨细胞病毒(CMV)启动子、加强的绿色荧光蛋白(EGFP)和猿病毒40(SV40)多聚腺苷酸序列的一段DNA片段。用0.5%琼脂糖电泳DNA以从载体上分离片段。从凝胶中切出DNA片段,并用标准的玻璃奶纯化技术从凝胶片中纯化出DNA。用T4DNA聚合酶(NEB)在制造商推荐的条件下补平片段末端,通过用等体积的苯酚∶氯仿∶异戊醇(25∶24∶1)抽提及随后的乙醇沉淀来纯化DNA。接着把报告基因盒克隆进Epstein-Barr病毒(EBV)载体,p220.2(参见国际专利申请WO98/07876)。用HindIII(在载体的多克隆序列(MCS)中的唯一的切点)限制性内切消化p220.2,补平末端,如上进行纯化。报告基因盒用T4DNA连接酶(Promega)连入p220.2。连接反应在10μl体系中进行,其包括200ng线性p220.2、等量或5倍CMV-EGFP-SV40pA片段和1X连接缓冲液(Promega)。连接反应在室温温育过夜。把2.5μl连接产物用电穿孔的方法转入电感受态DH5α大肠杆菌细胞,条件为2.5kV,400Ω,25μF,随后加入900μlSOB培养基,37℃温育1小时。每一个转化产物取200μl放在氨苄青霉素琼脂板上,37℃温育过夜。通过用在CMV和EGFP序列内的DNA引物进行菌落聚合酶链反应(PCR),在所得菌落中筛选报告基因盒的存在,其中使用Taq聚合酶(AdvancedBiotechnologies)和制造商推荐的标准条件。阳性菌落在LB-氨苄青霉素培养基中培养过夜,并制备为碱溶菌DNA小量制品(Qiagen)进行分析。用BamHI限制性酶消化来从DNA中筛选具有正确取向的片段。最终得到的构建命名为p220.EGFP。使用与下述基本相同的方法将其电穿孔转入K562细胞之后,用Becton-DickinsonFACScan进行分析,可说明p220.EGFP表达EGFP。构建含hnRNPA216kb(RNP16)UCOE片段的EBV报告基因构建体用SalI部分限制性内切酶消化载体的方法从p220.EGFP上去掉一个SalI位点,接着补平末端和重新连接载体,这样载体的多克隆位点区(MCS)就只有唯一一个SalI位点,其可以用来克隆16kbRNP片段。得到的载体用SalI限制性内切酶消化,用小牛小肠磷酸酶(防止载体在连接时自身环化)处理,用苯酚∶氯仿抽提和乙醇沉淀的方法进行纯化。从MA551载体上用限制性内切酶SalI切出16kbRNP片段,片段补平末端,电洗脱纯化,连入线性载体。连接反应用和上面相同的方法(使用等量片段),接着进行转化并根据该片段的存在筛选菌落。筛选出的菌落用作DNA小量制品,用琼脂糖电泳分析确定阳性克隆。用NotI限制性内切酶分析来确定16kbRNP片段的正确取向。最终得到的构建体命名为p220.RNP16。用EBV报告基因构建体转染Hela细胞在6孔板上用p220.EGFP和p220.RNP16转染Hela细胞,其中采用CL22肽介导的传递系统,其述于国际专利申请WO98/35984和下面的描述。培养24小时后,加入终浓度为400μg/ml的潮霉素B(Calbiochem)选择物。将抗潮霉素B的细胞群维持培养,用Becton-DickinsonFACScan阶段性分析GFP的表达。在分析前一天将细胞按常规分到24孔板,这样分析当天细胞可以达到约50%的覆盖率。对于表达时程,设定了一个含有GFP表达细胞群的标志区域,此标志用于研究GFP表达的时间稳定性。还对转染的Hela细胞去除潮霉素B筛选,以研究在没有筛选压力时,在UCOE缺失或存在下,GFP基因表达的稳定性。CET200的克隆用NheI/NotII酶切PEGFPN1,将以下的寡核苷酸退火并插入其中,以产生多克隆位点区(MCS)5′CTAGCGTTCGAAGTTTAAACGC3′5′GGCCGCGTTTAAACTTCGAACG3′得到的质粒用AseI酶切,补平末端,插入补平末端的8.3kbHindIIIRNPA2片段。确定取向以构建最终的载体CET200(见图49)。CET201载体的克隆用EcoRI/ArI消化pUC19,补平末端,去除一个PvuI位点,从而产生一个用于线性化(pUC19Δ)的PvuI位点。用NheI/AgeI从pEGFPN1上切出MCS,补平其末端。这样就产生了NheI位点。从CMVEGFPSV40上切出一个AflII-补平的AseI片段,将其插入PvuII消化过的pUC19Δ,同时利用NdeI插入pGKpurobGH(来自pGK-puro-BKS)。得到的载体用NheI/NotI酶切去除EGFP,并用和上面相同的方法插入MCS。用HindIII消化包含载体的MCS,插入8.3kbRNPHindIII片段,从而构建成最终的CET210载体(见图49)。含一个UCOE的质粒的制备含报告基因构建体的RNP-UCOE的克隆p8kbHindBKS含有RNP基因座位的一个8.3kb的HindIII基因组片段,其含有启动子和RNPA2的第一外显子和HP1H-γ基因。pCMVEGFP-IRES的构建如下,用KpnI和NotI消化pEGFP-N1(Clontech,和CMV-EGFP一样,见图35)以递送EGFP序列,将此连入用KpnI和NotI部分消化过的pIRESneo(Clontech)。这样产生了一载体,其中EGFP基因3′是CMV启动子,5′是IRESneo。IntronA-CMV的克隆如下进行,用NruI(平末端切割)和HindIII从pTX0350(一个pUC基CMVIntronA-MAGE1质粒)上切出一个1.5kbIntronA-CMV片段。用AseI消化pEGFP-NI,接着用Klenow和T4DNA聚合酶补平末端。接着用HindIII消化得到一个4.2kb片段。把这两个片段连接过夜。p4.0CMV通过用BamHI/HindIII/BstEII从p8kbHindBKS切出一个4kb片段来进行构建。片段末端用Klenow和T4DNA聚合酶补平。pEGFP-N1(Clontech)用AseI线性化,末端如上补平,并用小牛小肠磷酸酶(CIP)处理。将两个片段连接过夜。同时筛选4kbUCOE正向和反向插入的克隆。p7.5CMV通过用HindIII从p8kbHindBKS上切出一个8.3kb片段来进行构建。片段末端用Klenow和T4DNA聚合酶补平。pEGFP-N1(Clontech)用AseI进行线性化处理,末端如上补平,并用小牛小肠磷酸酶(CIP)处理。将两个片段连接过夜。同时筛选8.3kbUCOE正向和反向插入的克隆。p16CMV通过用SalI从MA551(hnRNPA2基因组克隆,其含有包括全部编码区的5kb5′序列和1.5kb3′序列)中切出一个16kb的片段来进行构建。片段末端用Klenow和T4DNA聚合酶补平。pEGFP-N1(Clontech)用AseI线性化处理,末端如上补平,并用小牛小肠磷酸酶(CIP)处理。将两个片段连接过夜。同时筛选16kbUCOE正向和反向插入的克隆。利用CL22肽转染Hela细胞CL22肽的氨基酸序列为NH2-KKKKKKGGFLGFWRGENGRKTRSAYERMCNILKGK-COOHCL22肽被用作一个转染工具,其方法参见WO98/35984。Hela细胞按常规在EF10培养基上培养,每3-4天分离汇合的瓶1∶10。在转染前24小时,按每孔5×104细胞把细胞铺在6孔培养板上。在转染之前一小时,加入等体积的DNACL22(DNA和CL22分别为40μg/ml和80μg/ml,缓冲液为Hepes缓冲盐溶液(10mMHepespH7.4,150mMNaCl)形成复合物,并在室温温育1个小时。培养液从细胞中除去,用1%磷酸盐缓冲液洗。向细胞中加入2.5μgDNA复合物(125μl),并加入RAQ(RPMI培养基(Sigma)、0.1%人白蛋白、137μM氯喹(新加入))使体积增大到1ml,其中氯喹的终浓度为120μM。细胞和复合物在37℃温育5个小时。接着去除复合物,换成EF10培养基(最低限度的基础培养基(Sigma),10%胎牛血清,100单位/ml青霉素/0.1mg/ml链霉素,1×非基本氨基酸(Sigma))。分析GFP在转染的Hela细胞中的表达从六孔板上刮下细胞做GFP表达分析。细胞用磷酸盐缓冲液(PBS,Gibco)洗涤,在胰蛋白酶/EDTA(Sigma)中温育直至细胞从培养板表面脱落。把含有10%胎牛血清(FCS,Sigma)的过量EF10培养基(Gibco)加入细胞中,并把细胞转入5ml圆底聚苯乙烯管。用Becton-DickinsonFACscan分析这些细胞,通过与亲代细胞的自身荧光比较来检测GFP基因的表达。制备全DNA样品为了检测转染细胞中游离基因DNA的量,制备了细胞DNA的全制品。细胞用PBS洗涤,接着用溶胞缓冲液[10mMTrispH7.5,10mMEDTApH8.0,10mMNaCl,0.5%十二烷基肌氨酸钠,其加入新配制的蛋白酶K1mg/mlF/C]溶解。用大口枪头将细胞溶胞产物从培养板上转入一个Eppendorf管。65℃温育过夜后,酚/氯仿提取,并且乙醇沉淀。最后将DNA重新悬浮于pH8.0的TE。检测全基因组DNA样品中的游离基因DNA转染7天后,将从转染的细胞制备得到的全基因组DNA用限制性内切酶(其可使转染时使用的DNA构建体及样品中的游离基因DNA线性化)消化,ApaLI(NEB)被用于模拟、CMV-EGFP、IntronA-CMV和4.0CMV正向和反向的样品。BspLU11I(Boehringer)被用于7.5CMV正向和反向的样品。按推荐的条件,用30个单位的限制性内切酶消化10μl(全部样品的20%)全基因组DNA16个小时。样品在400volt/小时的条件下进行电泳,其中使用0.6%琼脂糖,并用100pg或4ng的线性质粒做对照。接着用Southern印迹的方法把凝胶转至Hybond-N杂交转移膜(Amersham)。简单来说,凝胶用0.25MHCl温育15分钟脱嘌呤,接着在1.5MNaCl/0.5MNaOH中变性45分钟,并用1.5MNaCl/0.5MTris-ClpH7.0中和45分钟。利用20×SSC(3MNaCl,0.3M二水柠檬酸钠,pH7.0),经过16小时毛细作用把DNA从凝胶转移到膜上。滤膜在空气中干燥1个小时,用UVPCL-100紫外交联仪(GRI)交联2分钟,其中能量设定为1200。在“Church杂交条件”下,膜连上一个放射性标记的EGFP探针。膜用0.5MNaPipH7.2,1%SDS,在65℃预杂交超过2个小时。用BglII/NotI(NEB)限制性内切酶消化pEGFP-N1(Clontech)切出一段DNA的EGFP片段,片段用电泳分离,并用一个GFXTMPCRDNA和凝胶条带纯化试剂盒(AmershamPharmaciaBiotech)纯化。使用MegaprimeDNA标记试剂盒(Amersham),用α-32PdCTP(3000Ci/mmol,Amersham)对50ngEGFP片段进行标记。标记的探针和100μl10mg/ml鲑鱼精DNA混和,在95℃温育10分钟,置冰上,然后进行杂交。膜在65℃杂交16个小时,然后在65℃用40mMNaPipH7.2、1%SDS洗两次,每次30分钟。放射标记的膜在进行高分辨磷筛选之后,再用气旋存储磷系统(Packard)对其进行分析。荧光显微术将培养在六孔板中的转染细胞用ZeissAxiovertS100倒置显微镜在荧光下观察,所有的拍摄操作都在规定的时间使用ZeissMC100照相机和FujichromeProvia400ASA胶卷来完成。实施例1人类TBP基因座的分析TBP基因域的作图人TBP基因长20kb(Chalut等,1995),其定位于染色体6q27-tel(Heng等,1997),并同编码C5蛋白的基因紧密连锁。C5蛋白形成部分遍在蛋白体(图1A和C;Trachtulec,Z.等,1997)。C5基因的转录是从TBP基因的加帽位点上游1kb的位置反向开始的,因此C5基因和TBP基因可能包含有双重的启动子。由于双重启动子在不同的转录方向上可能有着不同的功率,因此在构建基于TBP基因的表达载体时需要考虑到这种重要的差别。序列分析显示TBP/C5启动子区域含有无甲基化的长3.4kb的CpG岛,该岛延伸自C5基因第一个内含子中的FspI位点和TBP第一个内含子中的HindIII位点之间,它包含了两个基因5′端第一个内含子的大部分5′1kb序列和两个基因转录起始点之间的1.4kb区域。(图1B)人TBP基因座包含了三个紧密连锁的基因。PSMB1基因(在这里又被称为C5基因)的转录是从TBP的加帽位点上游1kb的位置反向开始的。最近鉴定的基因PDCD2的3′端定位于TBP基因下游5kb处。这三个转录单位共长50kb。在PSMB1基因下游靠近着丝粒的方向上,有一个长度至少为80kb的区域,该区域由大量重复的DNA序列组成,并且没有可识别的结构基因。PDCD2基因上游朝向端粒的方向有一个长30kb的重复非编码序列,其后有一潜在的新转录单位。PDCD2基因距离端粒重复序列区的起始位点约有150kb,这使得TBP基因座成为染色体6的长臂上距离端粒最近的结构基因簇。来自TBP基因域的基因表达样式为了确定来自TBP基因簇的表达的组织分布,使用了一种商品化点印迹,其利用源自不同人体组织和细胞类型的Poly(A)+-RNA制备得来(图35A)。该点印迹与相应探针的杂交显示PSMB1基因(图35B)、PDCD2基因(图35C)和TBP基因(图35D)均有普遍的表达。该数据证实TBP基因座仅含有一个遍在表达的染色质域。携有pCP2-TLN鼠中的转基因完整性绘图来源于pCYPAC-2的pCP2-TLN(图1)长90kb,其被用来制造转基因鼠。该克隆开始于C5基因下游46kb处(TBP5′端65kb处),止于TBP基因3′端的4.5kb处。因此,该克隆包含了完整的C5基因和TBP基因。利用pCP2-TLN制造了三株转基因系。用来源于pCP2-TLN末端的探针进行Southern印迹分析,结果显示TLN3系包含了转基因的两个拷贝(图2a,b,TLN3系)的对头尾结构(图3a,TLN3株)。但是其中的一个拷贝发生了5′端的基因缺失,该缺失一直延伸到TBP基因的启动子处(图4,TLN3系)。利用末端分析方法显示TLN8系包含了pCP2-TLN的3个拷贝(图2a,b,TLN-8系)。分析表明TLN28株在多整合位点上携有多个拷贝(图3a,TLN28系)。图3B简要介绍了对这些TLN鼠的转基因拷贝数和整合特性的分析。对这些用pCP2-TLN产生的转基因系的进一步分析发现,在TLN3株中含有pCP2-TLN的两个缺失的拷贝,因此TBP和PSMB1基因的单功能拷贝仍然完整(图3c,TLN3)。TLN8株携有pCP2-TLN的两个纵向整合(图3c,TLN8)。TLN28株含有pCP2-TLN的四个纵向排列拷贝(图4,TLN28)。在TLN28和TLN8中的转基因纵向排列的5′端和3′端发生的缺失仍然保留了PSMB1基因和TBP基因的完整性。就如对携有CpG富集域的其它基因的5′区的观察(如鼠Thy-1,Kolsto等,1986),本次操作得到的转基因鼠也如期保留了TBP/C5的无甲基化的CpG岛(数据未显示)。TBPC5转基因在鼠pCP2-TLN上的表达分析在这里我们使用了基于RT-PCR的实验,该实验可以同时检测出鼠内源性的和人转基因TBP/C5的信息。RT-PCR实验中的探针(TB-14和TB-15)选自人和鼠TBP基因cDNA序列同源的区域(图5b)。这样,使用一对引物就可以从两种不同的mRNA中扩增出长度为284bp的RT-PCR产物。为了区分人和鼠的TBP基因产物,研究了少数碱基的差异造成的限制性内切酶切割位点的差异。人的PCR产物以Bsp1407I酶切时产生长221个核苷酸的片段(图6a)。相似地,对人和鼠C5cDNA序列的一同源区(图5a)能产生出源自这两个序列的长350个核苷酸的RT-PCR产物。用PstI酶切可使源自鼠C5mRNA的产物大小减少至173nt。以32P末端标记引物TB14(图5b)和C5RTF(图5a),使得PCR反应后的产物具有放射性。这些PCR产物以变性聚丙烯酰胺凝胶电泳加以分离。从转基因鼠TLN3系、TLN8系和TLN28系的各组织中提取1微克的RNA来进行上述的分析实验,RNA的定量采用ProsphorImager分析来完成(图8)。实验数据说明包括TLN3株在内的各鼠的各个测试组织中都检测到了明显水平的TBP基因和C5基因表达,其中TLN3携有一个该二基因的完整拷贝。更为重要的是,在指定鼠系的不同的组织间的表达水平可复写,尤其是C5基因。这暗示了所有可能的TLN克隆拥有遍在染色质开放能力。然而,在鼠系间,每个基因拷贝数的表达水平存在差异。另外,在TLN8系的不同组织间,TBP基因表达有5-40%的差异。这些结果表明,尽管TLN拥有染色质开放能力,但C5基因,尤其是TBP启动子容易受到阳性或阴性的转录干扰。这说明此克隆TBP和C5区本身所具有的转录激活潜力很弱且因此不能总是决定性影响阳性结果。这种情况同该区域存在的UCOE染色质开放效应相反,UCOE效应很强并能压倒阳性影响。以上的假说得到了实验证据的支持较弱的TBP启动子更容易倾向变化;比如将TBP基因在脾脏和肌肉中表达水平的比率与TLN8中C5基因相对比(图8)。如前所述,转基因表达的分析使用了来自2-6月龄的鼠的组织。同时,为了分析转基因表达的稳定性,使用了23个月龄的TLN3系和TLN8系转基因鼠并通过测定PSMB1mRNA表达的水平来进行。通过与年轻鼠的结果对比,在这两鼠系中都得到了相似的结果。结果进一步表明转基因正维持着具有转录能力的开放染色质结构。TBP基因座40kb亚克隆的表达分析在转基因鼠中从pCP2-TLN克隆获得的可再现的、生理水平的表达说明该基因座拥有遍在染色质开放能力。为了精细确定决定该活性的DNA区段,我们首先研究了人TBP基因座的一个40kb亚克隆(pCP2-TSN;图1a)。该亚克隆包括了邻近TBP基因的5′端和3′端长约12kb的侧翼序列。因此它只包含一个完整的TBP基因和一个3′端缺失的C5基因。过去对人β球蛋白LCR的研究表明通过比对含有一个转基因单拷贝的稳定转染组织培养细胞克隆的基因表达水平,可以初步显示LCR活性的存在。LCR基元越完整,独立克隆之间的表达水平的可再现性就越高。利用这种策略,可将pCP2-TSN的表达分析用于检测LCR型活性的存在。pCP2-TSN首先被克隆到含有新霉素抗性基因(图9)的装配型质粒载体pWE15(clontech)中。获得的pWE-TBP构建体被用来产生鼠纤维原L-细胞的稳定转染克隆。用Southern印迹分析确定了23个克隆中转基因的拷贝数(图10),然后在其中选出代表多个拷贝数目的克隆,并对其进行转基因鼠的转基因表达的研究。结果(图11)显示当转基因的拷贝数低于8个时,每一个转基因拷贝的表达都能够达到或者超过生理水平,但当目的基因拷贝数大于20时,单个转基因拷贝的表达只达到野生型的30-40%。以上的数据说明以pCP2-TSN构建的单个或者多个转基因拷贝都能够实现组织间可再现的、生理水平的表达,这充分证明了该基因组克隆具有遍在染色质开放能力。实验同时也显示某些克隆(如4、33、6)表现出“正”的位置效应,从而大大加强了单个转基因拷贝的表达并超过生理水平,这可能是由于有一些情况下转基因的整合发生了已开放、活化的染色质。同时,如果在这些环境附近存在强转录增强子,将可能对较弱的TBP基因的启动子有增强作用。这些构建体表达的稳定性通过一个长60天的周期来检测。结果表明表达的水平保持稳定(图36)。而且当去掉药物的选择压力之后,表达的水平依然保持稳定(图36,标记为G418的列)。另外,不管有没有药物的选择压力,在细胞在经过反复的冷冻和融解复苏循环后,表达仍然保持稳定。TBP基因座的25kb亚克隆的表达分析长为25kb的基因组克隆(TPO)覆盖了TBP基因5′端1kb的序列和3′端5kb的序列(图1c),该片段被克隆至改进的具有嘌呤霉素抗性基因的pBluescript载体中的聚合交联区,从而构建出pBL-TPO-puro。该构建体被用于产生鼠纤维原细胞L细胞的稳定转染克隆。以pBL-TPO-puro构建体对转基因的表达得出了与用pCP2-TSN进行的研究相似的实验结果(图37),实验收集的数据说明不管是用TPO还是TSN,对单个或者多个转基因拷贝都能实现可重复的、生理水平的表达。该数据与基因组克隆具有遍在染色质开放能力相一致。这种假设得到了以下实验证据的进一步支持以TPO克隆7(两个拷贝)、29(单拷贝)、34(两个拷贝)整合在着丝粒的异染色质区(数据见下),其说明这些基因组片断在异染色质环境中仍然拥有表达目的基因的能力。另外,某些克隆(如图37,克隆11)表现出“正”的位置效应,其表达水平显著高于生理态转基因拷贝。这可能是由于转基因的离合位于已开放的活化的染色质。如果在这环境周围存在强转录增强子,其可能对较弱的TBP基因的启动子有增强的作用。使用Hela细胞系代替CHO细胞系也得到了同样的结果(数据未列出)。DNaseI超敏感位点的绘图众所周知,LCR元件是指那些具有很高的组织特异性DNaseI的超敏感性的区域,这种DNaseI超敏感性的存在往往暗示了高度开放的染色质结构的存在。因此我们分析了在人TBP基因中间和周围DNaseI超敏感(HS)位点是否存在。图12简介了使用人骨髓来源的白血病细胞系K562所进行的一系列实验,其中将DNaseI超敏感(HS)位点映射在从TBP基因5′端12kb到3′端4.5kb共长约40kb的区域内。结果表明唯一明显的DNaseI超敏感(HS)位点紧挨于C5基因和TBP基因启动子区域(图12,最上面一行,HindIII消化/HindIII-XbaI探针)。这些DNaseI超敏感(HS)位点与前述启动子元件相关联,其过去利用瞬时转染的方法(Tumara,T.等,1994;FouldsandHawley,1997)确定且对于TBP和C5基因表达十分重要。然而,如果有LCR型基元存在于这个基因座之内,它们将距离TBP基因和C5基因的转录起始点都有相当的距离。这样就使LCR型元件存在于贯穿TBP基因的40kb克隆之外,此中TBP基因初步指示了遍在染色质开放能力。FISH分析总共有34个携带了人TBP基因的1-2拷贝的克隆被用来进行FISH分析。分别用荧光素和TexasRed(得克萨斯红)来检测TBP转基因和鼠着丝粒、γ卫星和主要卫星的异染色质成分。这些标记手段的使用使得其中转基因已整合到染色体臂上的克隆显示出绿的和红的荧光信号(图39A)。然而,当转基因整合至着丝粒区域时,由于两种荧光同时出现使得能被的两种颜色荧光的混合物为黄色荧光信号。在使用pWE-TSN所得到的18个克隆中,有两个克隆344-6和344-37在着丝粒区域显示出转基因信号。在克隆344-6中,TBP转基因被整合至一个罗伯逊易位染色体的着丝粒处,而在克隆344-37中,TBP转基因整合至鼠的一条典型的近端着丝粒染色体上。在使用pBL3-TPO-puro所构建的16个克隆中,有三个克隆440-7、440-29和440-34显示出在典型的近端着丝粒染色体中整合至着丝粒处。在含有一个TBP转基因拷贝的克隆440-29中,显示出TBP信号明显地被异染色质化的卫星DNA序列所包围(图39B和C)。进一步的实验还证明在没有选择压力存在的情况下这些克隆中TBP基因仍能从生理水平持续表达长达12-14周(数据未列出)。以上的数据说明,单拷贝的TBP基因座位的25kb的片段(TPO)是能保证生理水平的表达的,即使处在异染色质的包围中(如整合至着丝粒区域),从而为染色质的开放阅读提供了可信的证据(SabbattiniP,GeorgiouA,SinclairC,DillonN(1999)通过单个或多个拷贝的转基因对鼠进行分析,证明λ5-VpreB1基因座位调控区域产生一种新的排列。分子和细胞生物学(MolecularandCellularBiology)19671-679)。实施例2人类HNRNPA2基因座位的分析hnRNPA2基因区的基因作图hnRNPA2基因长10kb,包含12个外显子,它的编码序列和内含子/外显子的整体结构同hnRNPA1基因高度同源,说明二者可能起源于基因的重复(Biamonti等,1994),但与A1基因不同,A2基因没有特异性的假基因(Burd等,1989;Biamonti等,1994);另外,A1与A2基因并不连锁,它们分别位于人染色体12q13.1(Saccone等,1992)和7p15(Biamonti等,1994)。图13A描述了存在于来源于pCYPAC-2载体的长160kb的克隆MA160上的人hnRNPA2基因座位的图谱,该基因组片段包含了110kb长的5′侧翼序列和50kb长的3′侧翼序列。hnRNPA2基因转录起始位点上游4.5kb长的DNA序列已经被测定,所测得的序列表明编码人异染色质相关蛋白HP1γ的基因从距离hnRNPA2基因加帽位点上游约1-2kb处反向起始转录(图13C)。Southern印迹杂交的分析表明整个HP1γ基因位于10kb长的区域中(数据未列出)。由上可见,TBP和hnRNPA2基因座位都有紧密连锁排列的背驰转录的启动子的特征。为了确定HP1γ基因在人各组织内的表达情况,使用了一种斑点印迹杂交,这种印迹是利用不同组织和细胞的Poly(A)+RNA制备得来。结果证明和hnRNPA2基因在体内各组织有普遍的表达一样,HP1γ基因在体内各组织也有普遍的表达(图38)。因此这两个基因可以被认为组成了一个类似于TBP基因座位的普遍表达的基因区。hnRNPA2基因座位在转基因鼠中的功能分析MA160(图13A)被用来制造转基因鼠,通过对已饲喂至产生出子一代的亲代鼠进行的Southern印迹杂交实验证明,这些转基因鼠中含有1-2个拷贝的转基因(数据未列出)。类似于检测TBP基因表达的基于RT-PCR的方法被用来分析hnRNPA2转基因的表达,由于鼠hnRNPA2的cDNA序列仍然是未知的,因此我们无法通过序列比对的方法选出人和鼠共有的同源序列区来用于RT-PCR扩增。开始,我们选择了对应于人hnRNPA2基因第10个和第12个外显子的探针Hn9和Hn11(图14A)来进行实验并得到了长270bp的RT-PCR产物。然而,我们发现以这一对探针从鼠和人的RNA制备物产生相同大小的产物,证明了鼠和人的该基因具有同源区(图14B)。利用一些限制性内切酶进行的实验证明HindIII可以切割鼠的hnRNPA2基因产生出长170bp的片段(图14B,HindIIIM泳道),却不能切割人的hnRNPA2基因(图14B,HindIIIH泳道)。从转基因鼠品系Hn35和Hn55的子一代的不同组织中提取了总RNA(1微克),并依上述方法使用32P5′末端标记的Hn9进行分析(图16)。放射强度(PhosphorImager)分析被用来确定人和鼠的RT-PCR产物的比例,结果(图17A)显示在所有被检测的组织中单一拷贝的转基因都实现了可再现的、生理水平的表达。在转基因鼠中对hnRNPA2座位60kb亚克隆的分析通过对pCYPAC来源的MA160克隆的研究获得的数据表明该基因组片段具有普遍的开放染色质的能力,为了精细定位决定该活性的DNA区段,我们从MA160中以限制酶AatII切出了长60kb的AatII亚片段Aa60(图13B),该片段包含了hnRNPA2基因5′端30kb长和3′端20kb长的侧翼序列。为研究Aa60片段制备出了三个转基因鼠Aa7、Aa23和Aa31,其中的两株通过自交产生了转基因鼠系,各转基因鼠所包含的转基因拷贝数分别是Aa7,3;Aa23,1-2;Aa31,1-2。从转基因鼠的不同组织中提取总RNA(1微克)并依据前述的方法来分析转基因的表达,结果如图15所示,放射强度的定量测定如图17B所示。以上得到的数据显示在所有被检测的组织中各个单一拷贝的转基因都实现了可再现的、生理水平的表达。这说明在MA160中观察到的开放遍在染色质的能力存在于Aa60亚片段上。DNaseI超敏感位点的定位图18显示了对距hnRNPA2基因起始位点5′约20-25kb的区域进行DNaseI超敏感位点分析所做的初步试验的结果外显子2中用AatI和ClaI双酶切所获得的长766bp的探针给出了一系列的三个DNaseI超敏感位点(图18,上面一组),分别位于hnRNPA2基因-1.1kb,-0.7kb和0.1kb处(图18,下面一组),我们还把DNaseI超敏感位点分析延伸到距离hnRNPA2基因转录起始点下游12-13kb处,但并未发现新的DNaseI超敏感位点。像在TBP/C5座位中的情况一样,这些DNaseI超敏感位点都位于hnRNPA2基因和HP1γ基因启动子之间长约1-2kb的区域上,未检测出LCR型DNaseI超敏感位点说明该座位的染色质开放的能力与该类元件的作用无关。以上给出的数据清楚地显示我们已经能够利用两个基因座位(TBP和hnRNPA)在转基因鼠的各组织中实现可再现的、生理水平的表达,这说明确实存在非衍生于LCR的遗传控制元件,这些元件具有使遍在染色质开放的能力。这里需要着重说明的一点是这里所提供的数据所揭示的功能与过去那些利用来自其他遍在表达基因如人β-actin(如Ray,P.等,1991;Yamashita等,1993;Deprimo等,1996)、鼠羟甲基戊二酰辅酶A还原酶(Mehtali等,1990)、鼠腺苷脱氨酶(Winston等,1992和1996)、人鸟苷脱羧酶(Halmekyt等,1991)和鼠磷酸甘油激酶1(McBurney等,1994)的启动子和增强子的组合所得到的结果是完全不同的。那些早期的研究中只在部分组织中观察到高效表达,却或没有证明或检测到开放染色质的能力。对于TBP基因来说,从组织培养的细胞得来的数据(图11)说明具各12kb的5′端和3′端侧翼序列的长约40kb的染色质区段(pCP2-TSN,图1a)是其所具有的使遍在染色质开放能力所在之处。从以包含了hnRNPA2基因的长60kb的片段(Aa60;图13B)构建的转基因鼠所得到的数据显示该片段包含具有使遍在染色质开放能力的区域(图15-17)。目前定位在上述区域的唯一的DNaseI超敏感位点对应于经典的启动子而不同于LCR型的元件,因此以遍在染色质开放表达元件(UCOE)起作用之这些DNA区域不符合LCR元件的定义,因为LCR元件是与其表达有组织特异性或以限制性方式表达的基因相关的,UCOE元件和它们的活化作用因此可以清楚地同LCR及其衍生元件区分开来。表达载体的构建60kb长的RNP区的亚片段的UCOE活性可以使用基于报告基因的方法来测定。如上和图22所示,使用GFP和NeoR报告基因,来设计表达载体,其包含了位于RNP基因和HP1H-γ基因之间的双向启动子区域中的亚片段。它们包括,一个含有RNP启动子(其驱动GFP/Neo的表达)的表达载体(RNP);一个包含了RNP启动子和RNP启动子上游长5.5kb区段的表达载体(5.5RNP);利用剪接受体策载体,其中的拼接受体/分支同义序列(来源于RNP基因外显子2)在GFP基因前方进行克隆(保证包含了RNP基因内含子1一部分序列的整个CpG岛可以在同一基于报告基因的实验中进行检测),从而使得在GFP的上游包含了外显子1和内含子1的一部分(7.5RNP),其在GFP基因之前携带了7.5kbRNP基因;一个包含了RNP启动子和RNP启动子上游长1.5kb的DNA片段的载体(1.5RNP)。如上并见图23,还构建了包含异源的CMV启动子的一系列表达载体,这些载体包括由其中的CMV驱动GFP/Neo的表达并包含了内核糖体结合位点的表达载体(CMV-EGFP-IRES);与上一载体类似但无内核糖体结合位点的表达载体(CMV-EGFP);由其中的CMV驱动GFP/Neo表达并包含了RNP启动子区域上游长5.5kb的区域的表达载体(5.5CMV);由其中的CMV驱动GFP/Neo的表达并包含由CMV、RNP和HP1H-γ启动子组成的4.0kb长序列的表达载体(4.0CMV);由其中的CMV驱动GFP/Neo的表达并包含了RNP基因外显子1和内含子1的一部分(长7.5kb)的一个表达载体。如上所述,将构建体通过电穿孔的方法转染CHO细胞。图24说明,在RNP启动子区前加入5.5kb片段使得G-418R菌落的数目增加了3.5倍。利用核酸缩合肽转移机制将同样的构建体转染进COS7细胞,可以使菌落数目提高近7倍(数据未列出)。图24还说明,将CMV基载体(如CMV、5.5CMV)转染CHO细胞,可以使菌落的数目提高1.5倍。来自这些转染的菌落的环状克隆产生稳定的G418R的细胞系,其随后被用来分析GFP的表达水平。图25显示了FACS分析所得到的数据。当使用内源启动子进行分析时,上游序列的加入使得GFP的表达水平提高了3.5倍;(RNP及5.5RNP)当将5.5kb序列加到异源CMV启动子前时,也发现了GFP表达水平的提高。对比5.5RNP,包含了整个无甲基化的CpG岛的表达载体并未显示出G418抗性菌落的增加,但GFP荧光的平均中值却有所提高(5.5RNP对比7.5RNP,见图26)。单个细胞克隆和限制性群落(约100个菌落)表达GFP之后,在有或没有G418选择压力的情况下进行细胞培养。由RNP基因启动子独自形成的细胞克隆表现出极大的不稳定性,且随着时间的延长,表达GFP的细胞的比例呈快速下降趋势。而以5.5RNP构建体得来的表达GFP的细胞克隆,其稳定性可以长达3个月。尽管CMV-GFP克隆群在初期表现出较好的稳定性,但是在长时间无G418的情况下,表达GFP的细胞数呈下降趋势,而5.5CMV在这种情况下却表现出长时间的稳定性。图27和28给出了这些克隆群的FAC谱,这些数据清楚地显示一种向左的迁移,即使用CMV-GFP构建体可使非荧光细胞的比例增大,相反,5.5CMV-GFP克隆群却表现出稳定的表达统一峰。低表达或无表达细胞的百分数由门控群M1来进行评价。对RNP基因座位的研究缩小到包含了RNP基因和HP1H-γ基因双向启动子的长5.5kb的区域。该片段继续向3′端延伸的产物(如7.5RNP和8.5RNP)能够提高基因的表达水平,并可能与保持无甲基化岛的完整性关联。同时也发现5.5RNP的缩小化至1.5kb区产物(1.5RNP,图23),在通过FAC分析确定其G418R菌落的数目及表达时,其不会明显影响报告因子转染研究的结果(图29)。但是,1.5RNP并未象5.5RNP或者7.5RNP那样赋予细胞长时间稳定表达基因的能力。如图30所示,表达GFP的细胞数在68天后迅速减少。设计构建体4.0CMV,从而使代表CpG无甲基化岛的整个4.0kb序列保持完整。此外,将盒双向插入CMV-EGFP之前(4.0CMV-EGFP-F(正向);4.0CMV-EGFP-R(反向))。图31显示,对比于标准CMV-GFP构建体CMV-EGFP,4.0CMV中GFP荧光的平均强度有大幅度的提高(超过10倍)。同时还显示不论该4.0kb盒正向或是反向插入都能使GFP表达有大幅度的提高。从基因表达的稳定性上来说,包含了RNP基因上游5.5kb序列的表达载体在转染CHO细胞后表现出一定的优越性。更重要的是,这种稳定性不仅限于内源的启动子,还给予了异源和广泛使用的CMV启动子。图32对比了基于CMV的表达载体4.0CMV和7.5CMV和对照载体CMV-EGFP转染入CHO细胞,并在13天后进行分析并进行G18选择。结果显示,将RNP座位4.0kb或者7.5kb区段加入CMV启动子之前,可以将荧光的平均强度实质性地提高(15-20倍),这种提高与这些区段取向无关(数据未列出)。图33显示了一个与图32相同的以G418选择的细胞群中表达GFP的细胞的比例。可以看到,4.0kb或是7.5kb片段加入提高了GFP阳性细胞在这一细胞群中的百分率。另外,尽管以前的实验说明CMV-EGFP在培养近60天以后表现出不稳定性,但此细胞群却表现出随时间的稳定性。图34显示了以等摩尔数的不同构建体转染CHO细胞后得到的菌落。相对于对照载体CMV-EGFP,7.5CMV构建体得到的菌落提高了近2.5倍。这些观察与7.5CMV-F相符合,其保证了整合数的增加并给予7.5kb片段染色质开放/维持能力。包含了UCOE的腺病毒载体在现有条件之下,腺病毒(Ad)是基因治疗的一类载体系统,其可将基因最有效传递至感兴趣的细胞类型。发展到临床水平的许多最有前景的基因治疗都使用这一载体系统,尤其是来源自腺病毒亚型5的载体。通过提高治疗基因以以下两种主要方式进行表达,可使Ad在基因治疗中的使用将实质性提高。一种是提高转基因的表达水平,以使在尽量少的剂量下获得最好的治疗效果,无论使用哪一种启动子;第二种方法是改善组织特异性或者肿瘤特异性的启动子,从而使转基因既具有特异性又能在特定细胞内实现强表达。尽管已经发现了许多具有很好的组织或肿瘤型特异性的启动子,但这些启动子在指定细胞中导致的表达水平通常很弱,从而无法真正用于基因治疗。比如鼠α-胎蛋白(AFP)基因的启动子,其引起的表达很弱但对肝癌细胞具有非常好的特异性(Bui等,1997,HumanGeneTherapy,8,2173-2182)。这样的肿瘤特异性启动子对于通过基因导向酶前药治疗(GDEPT)来治疗癌症十分有意义,其中研究基因转运以完成靶向化学治疗。在GDEPT中,编码一个前药转化酶的基因被转运至肿瘤细胞,例如可通过将转运载体注射入肿瘤。然后给予相对无毒的前药,其转化为潜在的细胞毒性药物并杀死细胞,细胞在原位进行酶的表达。例如利用硝基还原酶(NTR)和前药CB1954(Bridgewateretal.,1995,Eur.J.Cancer,31A,2362-2370)。腺病毒载体给予编码这些酶的基因最有效的转运,例如通过直接注射入肿瘤。利用AFP启动子和一个UCOE构建表达NTR的腺病毒载体通过在AFP启动子的前面加入4kb的RNPUCOE(图20中所示的序列,从核苷酸4102-8286)构建了表达NTR的重组5型腺病毒。4kb长的UCOE首先作为Pme1片段被克隆入pTXO379,pTXO379是一个介导载体,其携带了NTR基因且在该基因前有AFP启动子(Bui等,1997,HumanGeneTherapy,8,2173-2182)。用Ad5序列与之侧面相接,(1-359,3525-10589),通过以平末端连接至位于AFP启动子5′端的ClaI位点。限制性酶消化被用于确定存在一个UCOE单拷贝及用于确定UCOE的取向。然后用质粒pTXO384产生重组Ad构建体,其中pTX0384含有反向的UCOE片段和Ad装配细胞系Per.C6,其由Introgene开发并提供(Fallauxetal.,1998,HumanGeneTherapy,9,1909-1917)。由Introgene提供的方法被用于病毒拯救。用SwaI使pTXO384基本线性化,然后与SwaI线性化的骨架载体pPS1160共转染Per.C6细胞,其中载体pPS1160包含了5型腺病毒的右末端以及与pTXO384交叠的区域,通过同源重组形成重组Ad。在转染细胞中同源重组的病毒进行汇聚并被定名为CTL208。NTR在体外细胞系中的表达重组病毒CTL208的大量制备通过标准的步骤进行,同时还制备了其他两株重组腺病毒一株称为CTL203,其携有NTR基因(其前有AFP的启动子)和弱增强子但是没有UCOE片段;另一株是CTL102,其携有NTR基因(其前有CMV启动子)。CMV启动子被广泛应用在重组腺病毒中,以在大范围的组织和肿瘤类型中实现强表达。CTL203、CTL102和CTL208由相同的骨架构建而来,它们的区别只在于用于NTR基因转录的基元不同。接着利用CTL203、CTL102和CTL208在体外转导两个癌细胞系,以研究NTR表达的水平和特异性,这两株癌细胞系分别是初级人肝癌细胞系HepG2,它表达AFP;鼠鳞状上皮细胞癌细胞系KLN205,它不表达AFP。把处在指数生长期的细胞用胰蛋白酶消化并按照1.25×104个细胞/毫升的密度重新悬浮在感染培养基中,然后铺到六孔板中培养,接着先将重组腺病毒进行50倍的稀释,再将重组腺病毒CTL203按照稀释100倍或者500倍加入培养基中,感染90分钟之后加入胎牛血清使终浓度为10%,然后放置在37℃培养箱培养24小时。利用低渗条件裂解细胞,裂解产物离心以去除细胞碎片,然后用免疫酶联吸附实验(ELISA)的方法测定上清液中的NTR含量先用重组的NTR包被实验用的Nunc-ImmunoMaxisorpAssayPlate,然后在每个孔中加入50微升裂解上清液4℃过夜,接着用含有0.5%Tween的PBS缓冲液洗涤3次,然后在每个孔中加入按照1∶2000稀释后的山羊抗NTR多克隆抗体100微升室温放置30分钟。在洗去多余的一抗以后,在每个孔中加入按1∶5000稀释的辣根过氧化物酶标记的驴抗山羊二抗100微升,温育30分钟后以PBS缓冲液洗去多余的二抗,然后在每个孔中加入100微升TMB底物(1MPBS溶液、以含有1毫克/毫升于二甲基亚砜中+9毫升0.05M的磷酸-柠檬酸盐缓冲液+2微升30%v/v的过氧化氢/10ml)放置于室温10分钟。加入25微升2摩尔/升的硫酸中止反应,然后在450纳米波长下读取数据。图46给出了ELISA的结果以AFP启动子/增强子启动NTR表达时CTL203产生弱而特异性NTR表达,其只在AFP阳性细胞系中达到检测限。以CMV启动子启动NTR表达时,CTL102产生强而非特异性表达,其中NTR在实验使用的两种细胞系中具有相似水平。让人兴奋的是以CTL208(以UCOE和AFP启动子启动NTR的表达)感染的AFP阳性HepG2细胞系的NTR表达高于CTL102感染的细胞,而用CTL208感染的AFP阴性KLN205细胞系的NTR表达却明显低于相应的CTL102感染细胞。这些数据说明UCOE在保留特异性的同时显著地提高了腺病毒环境中的表达。NTR在体内的表达和抗肿瘤活性从安全性角度考虑,用于癌基因治疗的肿瘤特异性启动子与非特异性启动子相比具有优越性,因为这种启动子使得转基因在正常的组织中只保持低水平表达。这对以腺病毒为手段的基因治疗更为重要,因为腺病毒在注入肿瘤后,病毒有可能扩散出肿瘤并感染其他组织。腺病毒特别容易侵入肝细胞,因此腺病毒基因治疗的剂量限制性毒性通常为肝损伤。在GDEPT的情况下,能在正常组织中表达的强启动子如CMV启动子,可能导致那些表达NTR的正常细胞也被杀死。这类情况可以使用组织特异性的启动子来加以避免或使之最小化。这些组织特异性的启动子有效保证了肿瘤细胞中的高水平表达,从而产生抗肿瘤作用。于是,通过用CTL208和CTL102比较研究肿瘤细胞和肝细胞中的NTR基因表达,将其注射入鼠肿瘤,来比较它们的抗肿瘤活性。在这里我们使用了先天无胸腺的BALB/cnu/nu裸鼠,其均为无特定病原体的8-12周龄的雄性小鼠并在带有过滤盖的微量隔板盒中饲养。以体外培养的处于指数生长期的HepG2细胞作为肿瘤接种物,将细胞在摇瓶中培养,然后通过胰蛋白酶消化和800g离心5分钟来收获细胞,用无菌盐水洗涤并悬浮细胞。细胞的活性用台盼兰染色排除法加以鉴定,只有单细胞比例大于90%的细胞悬液才被用来接种裸鼠。在普通麻醉下,每只裸鼠胁腹皮下注射2-5×106个细胞,并腹膜注射0.2毫升的二甲代苯胺(ChanelleAnimalHealthLtd.,Liverpool,UK)和氯胺酮(WillowsFrancisVeterinary,Crawley,UK)的混合物(二者浓度分别为1毫克/毫升和10毫克/毫升)进行诱导。在第一个实验中,将CTL102和CTL208注射入裸鼠体内已经产生的25-60mm2皮下HepG2肿瘤(指肿瘤的表面积,以肿瘤水平方向最长的直径乘以其垂直方向最长的直径,以平方毫米计)。每种病毒的单次剂量为7.5×109个病毒颗粒。48小时后将小鼠处死并取出其肿瘤及肝脏,放置于4%的福尔马林/PBS缓冲溶液中固定24小时,然后依标准步骤进行石蜡包埋及切片。切好一系列3微米厚的组织片并进行免疫标记以检查细胞NTR的表达,其中使用间接免疫过氧过物酶标记、羊抗NTR抗血清(PolyclonalAntibodiesLtd)和VECTASTAINEliteABC试剂盒(VectorLabs)。然后将组织切片置于标准显微装置下观察并用显微术测定整个肝脏和肿瘤块中表达了NTR的细胞的百分数。图47给出了各个鼠的结果。其说明UCOE和(否则弱表达)AFP启动子联合导致鼠AFP阳性肿瘤中NTR有高水平的表达,因此以CTL208感染的肿瘤中其NTR表达高于可检测水平的细胞数与将CTL102感染肿瘤中的相似。然而,将CTL102直接注射入肿瘤块后六只小鼠中有五只的肝脏检出了NTR的表达,而以CTL208接种六只小鼠这一数字为零。以上这一结果说明,在CTL208的情况中,UCOE-AFP的启动子组合在AFP阳性肿瘤细胞中产生与CMV启动子相似或更强的表达,而在正常组织(AFP阴性)细胞中只低水平表达。为了证明UCOE已经将AFP启动子的表达强度提高到了有效的治疗水平,通过把CTL102或CTL208与前药CB1954联合,比对了二者的抗肿瘤能力。把CTL102和CTL208(剂量分别为7.5×109和2×1010个病毒颗粒)分别单次注射进已经产生了25-60平方毫米皮下肿瘤的裸鼠体内。48小时后给予CB1954。首先将CB1954(OxfordAsymmetry,Oxford,UK)溶于二甲基亚砜(Sigma,StLouis,Mo,USA)制成20毫克/毫升的溶液。临使用前用无菌盐水将原液稀释5倍使终浓度为4毫克/毫升。然后在非麻醉状态下给小鼠腹膜内注射相同剂量的CB1954,每天五次。对照组中以PBS代替病毒进行注射并在48小时后给予前药。在之后的27天内,用游标卡尺每天测量肿瘤的大小。图48给出了其结果。在只给以CB1954而未接种病毒的对照组中,7/7的肿瘤块还在快速长大;在给予NTR表达病毒和CB1954的所有组中都观察到一些鼠的肿瘤块变小,对CTL102来说,在给以低剂量的3/8只小鼠和给以高剂量CB1954的4/8只小鼠中的肿瘤块变小。对于CTL208,以上的两个数字分别是5/8和6/8。这些结果证明,对于CTL208的情况,UCOE元件使得源自AFP启动子的NTR在导入的肿瘤细胞中的表达水平得以提高并高于强CMV启动子产生的表达,并在以GDEPT为目的的临床状态鼠模型中表现出较高抗肿瘤活性。以上的研究说明了UCOE的两个重要且有实用价值的特性。第一,它可以实质性提高在腺病毒环境中的表达,其作为非整合载体在基因治疗中有着很大潜力;第二,将来自弱而特异性启动子的表达提高到更为有用的水平,同时保留有用的特异性。FISH分析在鼠Ltk细胞系中分析3116RNP-EGFP克隆的拷贝数,由于转染中使用的DNA量很少(约0.5-1微克),因此单拷贝克隆的比例较高(83%)。而且,在这些单拷贝的克隆中,EGFP的表达水平的差异能够超过两倍,这说明转基因容易受到阳性和阴性位置效应的影响。然而,三个单拷贝克隆被整合到了着丝粒异染色质(图42),这说明该构建体能够开放染色质。在克隆F1和G6中,16RNP-EGFP转基因整合到由罗伯逊易位形成的等臂染色体的一个着丝粒上(图B、C),而在克隆I3中,整合发生于鼠的一条典型近端着丝粒染色体的着丝粒上(图D)。在载体CET300和CET301中表达促红细胞生成素(EPO)红细胞生成素(EPO)表达载体CET300和CET301的构建用聚合酶链反应(PCR)从人胎儿肝的cDNA文库Quick-CloneTM(Clontech,PaloAlto,US.)中扩增了红细胞生成素的编码序列,其中引物为EP2(5′-CAGGTCGCTGAGGGAC-3′)和EP4(5′-CTCGACGGGGTTCAGG-3′)。得到的705bp产物包含了整个可读框,用EukaryoticTACloningKit(Invitrogen,Groningen,TheNetherlands)将其亚克隆至载体pCR3.1中,以获得载体pCR-EPO。EPO序列通过双链的自动DNA测序来加以确认。从pCR-EPO切出790bp长的包含EPO编码序列的NheI-EcoRV片段,将其亚克隆至载体CET200和CET201(分别包含了正向和反向的7.5kb长的RNP片段)的NheI和PmeI位点之间,以分别构建出CET300和CET301表达载体。同时,还将EGFP编码序列作为NheI-NotI片段从pEGFP-N1上切除,再用源自含EPO编码序列的pCR-EPO上的NheI-NotI片段进行替换,从而构建出对照载体pCMV-EPO。在CHO细胞中表达红细胞生成素用限制性内切酶DraIII将质粒pCMV-EPO、CET300和CET301线性化。通过用苯酚-氯仿提取及随后乙醇沉淀来纯化DNA,然后将DNA重新悬浮在无菌水中并以电穿孔的方法将等量的质粒转入CHO细胞。转染后的细胞置于225cm3的培养瓶中,培养基在24小时后换成含有G418(0.6mg/ml)的完全培养液以筛选出稳定的转染细胞。在此培养基进行细胞培养直至长出具有G418抗性的菌落(约电穿孔后十天)。然后将细胞从培养瓶中刮下来并按照每个孔106的量接种至含有1毫升完全培养液的六孔板。48小时后,将培养液除去,并使用QuantikineIVD人EPO免疫分析试剂盒(R&Dsystems,Minneapolis,US)以酶联免疫吸附试验(ELISA)定量培养基中EPO。结果显示构建体CET300、CET301和pCMV-EPO的EPO产量分别是1780单位/毫升、1040单位/毫升和128单位/毫升。因此,包含了正向和反向7.5kb长的RNP片段的构建体CET300和CET301,EPO的产量比对照质粒pCMV-EPO的EPO的产量分别提高了14倍和8倍,其中的对照质粒含有强CMV启动子以驱动EPO的表达。被包含和不包含hnRNPA216kbUCOE片段的EBV报告基因构建体转染的Hela细胞中GFP的表达在最初以潮霉素筛选细胞来进行的最初实验中,包含了RNP16UCOE的构建体(p220.RNP16)能够在23天产生水平的内源性的EGFP表达,反之,用p220.EGFP(无UCOE的构建体)却观察到更多异源性EGFP表达方式。EGFP在p220.EGFP转染的细胞中的表达逐渐丧失,而p220.RNP16转染的细胞中的稳定表达可以持续160天。三组平行实验进一步确证了上述的实验结果p220.RNP16转染的细胞表现出高水平的同源性表达,而p220.EGFP转染的细胞表现出异源表达。和最初实验一样,存在RNP16UCOE的情况下EGFP稳定表达,而无UCOE的情况下其表达在30-40天显著下降(图43)。在进一步的实验中,在第27天去除潮霉素的选择,结果证明,即使不进行选择,包含RNP16UCOE的情况下仍然保持了稳定的EGFP表达,而不包含UCOE的情况下EGFP仍然不能稳定表达(图44)。实施例3包含了一个UCOE的质粒图50显示产生的构建体和用来同内源的hnRNPA2基因座位比较的片段。图51显示利用瞬时转染的Hela细胞群的平均荧光强度进行的FAC分析图。利用上述的CL22肽段凝集的报告基因质粒进行细胞转染。可以看到,对照组CMV-GFP报告基因构建体只能维持短时间的持续表达,其在转染后24-48小时即显著降低。与对照组相反,包含质粒7.5CMV-F的UCOE表现出长时间(至少9天)的显著GFP表达。在重复实验中观察到了转染后长达14天的GFP表达。图52显示具有代表性的瞬时转染Hela细胞的局部低倍数放大。这些数据与FAC分析所得到的数据一致,从而可以在同样的时间跨度内观察细胞。在瞬时转染后24小时,不管是在CMV-GFP对照组中还是在7.5CMV实验组中都明显出现了GFP阳性的细胞(图52A和B)。实际上,在24小时时,对照组的GFP阳性细胞还要多于7.5CMV转染细胞群。这是由于在两种情况下DNA导入的量并不是校正的基因剂量,因此造成了每次转染时对照组明显含有更多的质粒拷贝。然而,在转染后6天,CMV-EGFP对照组中已经很难找到阳性荧光细胞(图52C)。而这时以7.5CMV转染的Hela细胞中仍然有大量的表达GFP的细胞(图52D)。实际上,在转染后14天仍然能较容易地找到阳性荧光细胞(数据未列出)。我们在整个实验中在不同的时间段上提取了细胞的全DNA,并对其进行线性化、凝胶电泳及印迹实验(见材料和方法)。有趣的是,即使是在转染后6天已经基本无GFP表达的对照组中仍然能够很容易地检测出呈未整合状态的质粒(数据未列出)。这可能暗示在CMV-GFP对照质粒中观察到的GFP表达的快速丧失并不能归因于质粒模板随时间的丧失,而是染色质基因表达关闭机制的作用。以红细胞生成素表达载体对CHO细胞的瞬时转染用超螺旋形式的质粒CET300、CET301和CMV-EPO在标准条件(975μF,250V)下对CHO细胞进行电穿孔转染。存活的细胞按106个细胞的量重新接种在含有1毫升完全CHO培养基的六孔板中。培养基以24小时为间隔更换1ml新鲜的培养基。9天后取培养基样品,并使用QuantikineIVD人EPO免疫分析试剂盒(R&Dsystems,Minneapolis,US)以酶联免疫吸附试验(ELISA)定量测定其中EPO的含量。附加的图表显示分别转染了CET300、CET301和CMV-EPO质粒的细胞中红细胞生成素表达随时间的变化所有细胞中EPO的表达在48小时内不断上升,在这之后,转染CMV-EPO的细胞群中的EPO表达逐天下降,而以CET300或CET301转染的细胞群的EPO表达在9天内仍然持续上升(图45)。参考文献1.Altschul,S.F.,Madden,T.L.,Schffer,J.Z.,Zhang,Z.,Miller,W.,andLipman,D.J.(1997).GappedBLASTandPSI-BLAST新一代的蛋白质数据库检索程序(anewgenerationofproteindatabasesearchprograms).核酸研究(NucleicAcidsRes).253389-3402.2.Antoniou,M.(1991).在鼠源红白血病(MEL)细胞系中红细胞特异性表达的诱导(Inductionoferythroid-specificexpressioninmurineerythroleukaemia(MEL)celllines).分子生物学方法(MethodsinMolecularBiology),Vol.7基因转移和表达手册(GeneTransferandExpressionProtocols),E.J.Murray编辑,HumanaPressInc.,Clifton,NJ,U.S.A.pp.421-434.3.Antoniou,M.andGrosveld,F.(1990).β-血红蛋白基因显性控制区与远端和近端启动子元件的作用不同(Theβ-globingenedominantcontrolregioninteractsdifferentlywithdistalandproximalpromoterelements).基因进展(GenesDev.).41007-1012.4.Archer,T.K.,Lefebvre,P.,Wolford,R.G.andHager,G.L.(1992)位于MMTV启动子上的转录因子启动子活化的双模型机制。(TranscriptionfactorloadingontheMMTVpromoterabimodalmechanismforpromoteractivation).科学(Science)2551573-1576.5.Aronow,B.J.,Ebert,C.A.,Valerius,M.T.,Potter,S.S.,Wiginton,D.A.,Witte,D.P.andHutton,J.J.(1995)基因座位控制区域的分离通过延长增强子侧翼系列来加强增强子的功能(DissectingaLocusControlRegionFacilitationofEnhancerFunctionbyExtendedEnhancer-FlankingSequences).分子细胞生物学(MolCell.Biol).151123-1135.6.Auffray,C.,andRougeon,F.(1980).从骨髓细胞瘤总RNA中纯化小鼠免疫球蛋白重链RNA(Purificationofmouseimmunoglobulinheavy-chainRNAsfromtotalmyelomatumorRNA).欧洲生化杂志(Eur.JBiochem).107303-324.7.BiamontiG,RuggiuM,SacconeS,DellaValleG,RivaS(1994)由重复起源的两个同源基因,编码人hnRNP蛋白质A2和A1(Twohomologousgenes,originatedbyduplication,encodethehumanhnRNPproteinsA2andA1).核酸研究(NuclAcidsRes).221996-2002.8.Bimboim,H.C.,andDolly,J.(1979).筛选重组质粒DNA的快速碱抽提步骤(ArapidalkalineextractionprocedureforscreeningrecombinantplasmidDNA).核酸研究(NucleicAcidsRes).71513.9.BlomvanAssendelft,G.,Hanscombe,O.,Grosveld,F.,andGreaves,D.R.(1989).β-球蛋白显性控制区以组织特异性方式活化同源和异源的启动子(Theβ-globindominantcontrolregionactivateshomologousandheterologouspromotersinatissue-specificmanner).细胞(Cell)56969-977.10.BoniferC,VidalM,GrosveldF,SippelAE(1990)鸡溶菌酶的完全基因域在转基因鼠中的组织特异性和位置非依赖性表达(Tissuespecificandpositionindependentexpressionofthecompletegenedomainforchickenlysozymeintransgenicmice).EMBOJ.92843-2848.11.Bonifer,C.,Yannoutsos,N.,Grosveld,G.andSippel,A.E.(1994)位于鸡溶菌酶基因域的基因座控制功能在转基因鼠中的分解(Dissectionofthelocuscontrolfunctionlocatedonthechickenlysozymegenedomainintransgenicmice.).核酸研究(NucleicAcidsRes.)224202-4210.12.BrinesRDandKlausGG(1993)通过预活化T细胞来多克隆激活未成熟B细胞IL-4和CD40配体的作用(PolyclonalactivationofimmatureBcellsbypreactivatedTcellstheroleofIL-4andCD40ligand.)国际免疫学(Int.Immunol.)51445-1450.13.BurdCG,SwansonMS,GorlachM,DreyfussG(1989)异源细胞核核糖核蛋白A2、B1和C2蛋白的一级结构由小肽插入引起的RNA结合蛋白的多样性(PrimarystructuresoftheheterogeneousnuclearribonucleoproteinA2,B1,andC2proteinsadiversityofRNAbindingproteinsisgeneratedbysmallpeptideinserts.)。国家学院科学学报(Proc.Natl.Acad.Sci.)USA8697889792.14.Carson,S.andWiles,M.V.(1993).EaMHCII型上游远区是Ea转基因的位置非依赖性的复制依赖性表达所必需的(FarupstreamregionsofclassIIMECEaarenecessaryforposition-independent,copy-dependentexpressionofEatransgene.)核酸研究(Nucl.AcidsRes.)212065-2072.15.Chalut,C.,Gallois,Y.,Poterszman,A.,Moncollin,V.,andEgly,J.-M.(1995).人类TATA-框-结合蛋白(TBP)的基因组结构(GenomicstructureofthehumanTATA-box-bindingprotein(TBP)).基因(Gene)161277-282.16.Chu,G.,Hayakawa,H.,andBerg,P.(1987).DNA电穿孔用于哺乳动物细胞的有效转染(ElectroporationfortheefficienttransfectionofmammaliancellswithDNA).核酸研究(NucleicAcidsRes.)151311-1326.17.Church,G.M.,andGilbert,W.(1984).基因组测序(Genomicsequencing.)国家学院科学学报(Proc.Natl.Acad.Sci.)USA811991-1995.18.Collis,P.,Antoniou,M.andGrosveld,F.(1990).定义人β球蛋白基因及显性控制区高水平表达时的最小需要量(Definitionoftheminimalrequirementswithinthehumanβ-globingeneandthedominantcontrolregionforhighlevelexpression.),EM.BO.J.9233-240.19.Cooper,M.J.andMiron,S.,1993,人癌变细胞的有效游离基因表达载体(Efficientepisomalexpressionvectorforhumantransitionalcarcinomacells)人类基因治疗(Hum.GeneTher.)4557-566.20.Dai,Y.,Roman,M.,Naviaux,R.K.andVerma,1.M.(1992)借助初级成肌细胞的基因治疗体内移植后的IX因子蛋白的长期表达(GeneTherapyviaprimarymyoblastslong-termexpressionoffactorIXproteinfollowingtransplantationinvivo.),国家学院科学学报(Proc.Natl.Acad.Sci.)USA8910892-10895.21.DeBenedetti,A.andRhoads,R.E.,1991,一种用于外源基因在哺乳动物细胞中表达的新型BK病毒基游离基因载体(AnovelBKvirus-basedepisomalvectorforexpressionofforeigngenesinmammaliancells),核酸研究(Nucl.AcidsRes.),191925-1931.22.Deprimo,S.E.,Stambrook,P.J.andStringer,J.R.(1996)人胎盘碱性磷酸酶作为转基因小鼠中基因表达的组化标记(Humanplacentalalkalinephosphataseasahistochemicalmarkerofgeneexpressionintransgenicmice),转基因研究(TransgenicRes.)5459-466.23.Diaz,P.,Cado,D.andWinoto,A.(1994).T细胞受体α/δ基因座的基因座控制区(AlocuscontrolregionintheTcellreceptorα/δlocus.),免疫性(Immunity)1207-217.24.Dillon,N.,andGrosveld,F.(1993).使用转基因动物进行转录分析。基因转录一个实用的方法(Transcriptionalanalysisusingtransgenicanimals.InGeneTranscriptionApracticalapproach),B.D.HamesandS.J.Higgins编辑,eds.(OxfordIRLPress),pp.153-188.25.Dillon,N.andGrosveld,F.(1994).染色质域作为真核基因功能的潜在单元(Chromatindomainsaspotentialunitsofeukaryoticgenefunction.)当代遗传学进展(Curr.Opin.Genet.Develop.)4260-264.26.Dillon,N.,Trimbom,T.,Stroubouhs,J.,Fraser,P.andGrosveld,F.(1997)距离对于长程染色质相互作用的影响(Theeffectof30distanceonlong-rangechromatininteractions).分子细胞(MolCell)1131-139.27.Earle,W.lt,Schilling,E.L.,StarkT.H.,Straus,N.P.,Brown,M.F.,andShelton,E.(1943).体外恶性肿瘤的产生IV。小鼠纤维原细胞培养物及活细胞中的可见变化(Productionofmalignancyinvitro.IV.Themousefibroblastculturesandchangesseeninthelivingcells.)国家癌症协会杂志(J.Nat.CancerInst.)4165-212.28.Ellis,J.,Tan-Un,K.C.,Harper,A.,Michalovich,D.,Yannoutsos,N.,Philipsen,S.andGrosveld,F.(1996).人β-球蛋白基因座控制区中5′超敏感位点3的显性染色质开放活性(Adominantchromatin-openingactivityin5′hypersensitivesite3ofthehumanβ-globinlocuscontrolregion.)EMBOJ15562-568.29.Festenstein,R.,Tolaini,M.,Corbella,P.,Mamalaki,C.,Parrington,J.,Fox,M.,Miliou,A.,Jones,MandKioussis,D.(1996).基因座控制区功能和异染色质诱导位置影响斑(Locuscontrolregionfunctionandheterochromatin-inducedpositioneffectvariegation.)科学(Science)2711123-1125.30.Flotte,T.R.andCarter,B.J.(1995)腺伴随病毒载体用于基因治疗(Adeno-associatedvirusvectorsforgenetherapy.),基因治疗(GeneTher.)2357-362.31.Foulds,C.E.andHawley,D.K.(1997)分析人TATA结合蛋白启动子并识别一个决定活性的ets位点(AnalysisofthehumanTATAbindingproteinpromoterandidentificationofanetssitecriticalforactivity.)核酸研究(Nucl.AcidsRes.)252485-2494,32.Forrester,W.C.,Takegawa,S.,Papayannopouplou,T.,Stamatoyannopoulos,G.,andGroudine,M.(1987).基因座活化区的证明稳定性不断发展的高敏感位点在球蛋白表达杂化物中的形成(Evidenceforalocusactivationregiontheformationofdevelopmentallystablehypersensitivesitesinglobin-expressinghybrids.)核酸研究(NucleicAcidsRes.)1510159-10177.33.Freshney,R.I.(1994).动物细胞培养基本技术指南(InCultureofanimalcellsamanualofbasictechniques)(NewYorkWiley-Liss,Inc.),pp.169-171.34.Gavalas,A.andZalkin,H.(1995)分析用于嘌呤核苷酸从头合成的鸡GPAT/AIRC双向启动子(AnalysisofthechickenGPAT/AIRCbidirectionalpromoterfordenovopurinenucleotidesynthesis).生物化学杂志(J.Biol.Chem.)2702403-2410.35.Gilliland,G.,Perrin,S.,Blanchard,K-,andBunn,H.F.(1990).分析细胞因子mRNA和DNA通过竞争聚合酶链反应进行检测并定量(AnalysisofcytokinemRNAandDNADetectionandquantitationbycompetitivepolymerasechainreaction.)国家学院科学学报(Proc.Natl.Acad.Sci.)USA872725-2729.36.Greaves,D.R.,Wilson,F.D.,Lang,G.AndKioussis,D.(1989).人类CD23′侧翼序列在转基因鼠中产生高水平、T细胞特异性、位置非依赖性的基因表达(HumanCD23′flankingsequencesconferhigh-level,Tcellspecific,position-independentgeneexpressionintransgenicmice.)细胞(Cell)56979-986.37.Grosveld,F.,BlomvanAssendelft,G.B.,Greaves,D.R.andKollias,G.(1987).人类β-球蛋白在转基因鼠中进行位置非依赖性高水平表达(Positionindependenthighlevelexpressionofthehumanβ-globingeneintransgenicmice.)细胞(Cell)51975-985.38.Grosveld,F.,Dillon,N.andHiggs,D.R.(1993)人球蛋白基因的调控(Theregulationofhumanglobingeneexpression.)BaillieresClin.Haematol.631-55.39.Hammekyt,M.,Alhonen,L.,Wahlfors,J.,Sinervirta,R.,Janne,A.,andJanne,J.(1991).人鸟氨酸脱羧酶在转基因鼠中的位置非依赖性异常表达(Position-independent,abberantexpressionofthehumanornithinedecarboxylasegeneintransgenicmice.)生化和生物物理学研究通讯(Biochem.Biophys.Res.Comm.)180262-267.40.Hanscombe,O.,Whyatt,D.,Fraser,P.,Yannoutsos,N.,Greaves,D.,Dillon,N.andGrosveld,F.(1991)球蛋白基因顺序对于正确发展表达的重要性(Importanceofglobingeneorderforcorrectdevelopmentalexpression.)基因进展(GenesDev.)51387-1394.41.Hartman,P.S.(1991).透射可大大降低转化频率(Transilluminationcanprofoundlyreducetransformationfrequencies.)生物技术(BioTechniques)11747-748.42.HengHH,XiaoH,ShiXM,GreenblattJ,TsuiLC(1994)RNA聚合酶II转录的普通起始因子的编码基因分散在人基因组中(GenesencodinggeneralinitiationfactorsforRNApolymeraseIItranscriptionaredispersedinthehumangenome.)人类分子遗传学(HumMolGenet.)361-64.43.Hong,N.A.,Cado,D.,Mitchell,J.,Ortiz,B.D.,Hsieh,S.N.andWinoto,A.(1997)T细胞受体α位点的有目的突变破坏T细胞发展并揭示邻近存在抗凋亡基因Dad-1。(AtargetedmutationattheTcellreceptor(xlocusimpairsTcelldevelopmentandrevealsthepresenceofthenearbyanti-apoptosisgeneDad-1.)分子细胞生物学(Mol.Cell.Biol.)172151-2157.44.Ioannou,P.A.,Amemiya,C.T.,Garner,J.,Kroisel,P.M.,Shizuya,H.,Chen,C.,Batzer,M.A.,anddeJong,P.J.(1994).一种源自抗菌素P1的新型载体用于人DNA大片段的增长(AnewbacteriophageP1-derivedvectorforthepropagationoflargehumanDNAfragments.)天然遗传学(Nat.Genet.)684-89.45.Jarman,A.P.,Wood,W.G.,Sharpe,J.A.,Gourdon,G.,Ayyub,H.andHiggs,D.R.(1991)位于人α-球蛋白基因簇上游的主要调控元件的特征(Characterizationofthemajorregulatoryelementupstreamofthehumanalpha-globingenecluster.)分子细胞生物学(Mol.Cell.Biol.)114679-4689.46.Jones,B.K.,Monks,B.R.,Liebhaber,S.A.andCooke,N.E.(1995)人生长激素基因由多元基因座控制区调控(TheHumanGrowth15HormoneGeneisRegulatedbyaMulticomponentLocusControlRegion.)分子细胞生物学(Mol.Cell.Biol.)157010-7021.47.Kaufinan,R.J.(1990)酶学方法(MethodsinEnzymology)185537-566.48.KolstoA.-B.,Kollias,G.,Giguere,V.,Isobe,K.-I.,Prydz,H.andGrosveld,F.(1986)转基因鼠中无甲基化岛的维持(Themaintenanceofmethylation-freeislandsintransgenicmice.)核酸研究(Nucl.AcidsRes.)149667-9678.49.Kotin,RM(1994)腺伴随病毒作为载体用于人基因治疗的前景(Prosspectsfortheuseofadeno-associatedvirusasavectorforhumangenetherapy.)人类基因治疗(Hum.GeneTher.)5793-801.50.KozuT,HenrichB,SchaferKP(1995)编码人hnRNP蛋白A2/B1的基因(HNRPA2B1)的结构及表达(Structureandexpressionofthegene(HNRPA2B1)encodingthehumanhnRNPproteinA2/B1.)基因组(Genomics)25365-371.51.Lake,R.A.,Wotton,D.andOwen,M.J.(1990)一个3′转录增强子调控人CD2基因的组织特异性表达(A3′transcriptionalenhancerregulatestissue-specificexpressionofthehumanCD2gene.)EMBOJ.93129-3136.52.Lang,G.,Wotton,D.,Owen,M.J.,Sewell,W.A.,Brown,M.H.,Mason,D.Y.,Crumpton,M.J.andKioussis,D.(1988)人CD2基因的结构及其在转基因鼠中的表达(ThestructureofthehumanCD2geneanditsexpressionintransgenicmice.)EMBOJ.71675-1682.53.Larsen,F.,Gundersen,G.,Lopez,R.,andPrydz,H.(1992).CpG岛作为人基因组中的基因标志(CpGislandsasgenemarkersinthehumangenome.)基因组(Genomics)131095-1107.54.LeeCC,PonsF,JonesPG,BiesRD,SchlangAM,LegerJJ,CaskeyCT(1993)Mdx转基因鼠重组肌营养不良蛋白在营养不良肌肉中的复原(Mdxtransgenicmouserestorationofrecombinantdystrophintothedystrophicmuscle.)人类基因治疗(Hum.GeneTher.)4273-287.55.Lennon,G.G.,Auffray,C.,Polymeropoulos,M.,andSoares,M.B.(1996).TheI.M.A.G.E.Consortimn基因组的整合分子分析及其表达(Anintergratedmolecularanalysisofgenomesandtheirexpression.)基因组(Genomics)33151-152.56.Lozzio,C.B.,andLozzio,B.B.(1975).人慢性骨髓白血病细胞系及阳性费城染色体(Humanchronicmyelogenousleukemiacell-linewithpositivePhiladelphiachromosome.)血液(Blood)45321-334.57.McBurney,M.W.,Staines,W.A.,Boekelheide,K.,Parry,D.,Jardine,K.andPickavance,L.(1994)鼠PGK-1启动子在转基因鼠中启动广泛但不均一的表达(MurinePGK-1promoterdriveswidespreadbutnotuniformexpressionintransgenicmice.)动力学进展(Devel.Dynam).200278-293.58.Mehtali,M.,LeMeur,M.andLathe,R.(1990)无甲基化状态的管家转基因损失高拷贝数(Themethylation-freestatusofahousekeepingtranssgeneislostathighcopynumber.)基因(Gene)91179-184.59.YeomanHandMeliorAL(1992)在红细胞中表达MHCI基因的转基因鼠的忍受力及MHC限制性(ToleranceandMHCrestrictionintransgenicmiceexpressingaMHCclassIgeneinerythroidcells.)国际免疫学(IntImmunol)459-65.60.Michelsen,B.K.(1995).大肠杆菌的转化使T4DNA连接酶的失活增长260倍(TransformationofEscherichiacoliincreases260-foldupon30inactivationofT4DNAligase.)生化分析(Anal.Biochem.)225172-174.61.Miller,A.D.(1992)逆转录病毒载体(Retroviralvectors.)当代微生物免疫学主题(Curr.Top.Microbiol.Immunol.)1581-24.62.Miller,A.D.,Miller,D.G.,Garcia,J.V.andLynch,C.M.(1993)逆转录病毒载体用于基因转移及表达(Useofretroviralvectorsforgenetransferandexpression.)酶学方法(Meth.Enzymol.)217581-599.63.Milot,E.,Strouboulis,J.,Trimbom,T.,Wijgerde,M.,deBoer,E.,Langeveld,A.,Tan-Un,K.,Vergeer,W.,Yannoutsos,N.,Grosveld,F.andFraser,P.(1996).异染色质影响LCR介导的基因转录的频率及持续时间(HeterochromatineffectsonthefrequencyanddurationofLCR-mediatedgenetranscription.)细胞(Cell)87105-114.64.Montoliu,L.,Umland,T.andSchiitz,G.(1996).在酪氨酸酶基因-12kb的基因座控制区(Alocuscontrolregionat-12kbofthetyrosinasegene.)EMBOJ.156026-6034.65.Muzyczka,N.(1992)腺伴随病毒用作哺乳动物的普通转导载体(Useofadeno-associatedvirusasageneraltransductionvectorformammaliancells,)当代微生物免疫学主题(Curr.Top.Microbiol.Immunol.,)15897-129.66.Needham,M.,Egerton,M.,Millest,A.,Evans,S.,Popplewell,M.,Cerillo,G.,McPheat,J.,Monk,A.,Jack,A.,Johnstone,D.andHollis,M.(1995).位点控制区/鼠红白血病表达系统的进一步发展重组人类降血钙素受体的高水平表达及特性(Furtherdevelopmentofthelocuscontrolregion/murineerythroleukemiaexpressionsystemhighlevelexpressionandcharacterisationofrecombinanthumancalcitoninreceptor.)蛋白质表达及纯化(ProteinExpressionandPurification)6124-131.67.Needham,M.,Gooding,C.,Hudson,K.,Antoniou,M.,Grosveld,F.andHollis,M.(1992).LCR/MEL一种多用途系统用于异源蛋白在红细胞中的高水平表达(Aversatilesystemforhigh-levelexpressionofheterologousproteinsinerythroidcells.)核酸研究(Nucl.AcidsRes.)20997-1003.68.Ogilvy,S.,Elefanty,A.G.,Visvader,J.,Bath,M.L.,Harris,A.W.,andAdains,J.M.(1998).Vav的转录调控,其表达贯穿造血区(TranscriptionalregulationofVav,ageneexpressedthroughoutthehematopoieticcomparhment.)血液(Blood)91419-430,69.Ortiz,B.D.,Cado,D.,Chen,V.,Diaz,P.W.andWinoto,A.(1997)相邻的DNA元件显著限制一种新型染色质开放区的遍在活性至特定组织(AdjacentDNAelementsdominantlyrestricttheubiquitousactivityofanovelchromatin-openingregiontospecifictissues.)EMBOJ.165037-5045.70.Peterson,M.G.,Tanese,N.,Pugh,B.F.,andTijan,R.(1990).已克隆的人TATA结合蛋白的功能域和上游活化特性(FunctionaldomainsandupstreamactivationpropertiesofclonedhumanTATAbindingprotein.)科学(Sicience)2481625-1630.71.Philipsen,S.,Talbot,D.,Fraser,P.andGrosveld,F.(1990)β-球蛋白显性控制区超敏感位点2(Theβ-globindominantcontrolregionhypersensitivesite2),EMBOJ.,92159-2167.72.Piirsoo,M.,Ustav,E.,Mandel,T.,Stenlund,A.andUstav,M.(I996)稳定的游离基因维持BPV-1复制子的顺反要求(CisandtransrequirementsforstableepisomalmaintenanceoftheBPV-Ireplicator.)EMBOJ.151-11.73.Pruzina,S.,Hanscombe,O.,Whyatt,D.,Grosveld,F.andPhilipsen,S.(1991)人类β-球蛋白位点控制区的超敏感位点4(Hypersensitivesite4ofthehumanβ-globinlocuscontrolregion,)核酸研究(Nucl.AcidsRes.),191413-1419.74.Raguz,S.,Hobbs,C.,Yagiie,E.,Ioannou,P.A.,Walsh,F.S.andAntoniou,M.(1998)与人结蛋白基因伴随的肌肉特异性位点控制区活性(Muscle-specificlocuscontrolregionactivityassociatedwiththehumandesmingene.)生物学进展(Develop.Biol.)inpress.75.RayP,HigginsKM,TanJC,ChuTY,YeeNS,NguyenH,LacyE,BesmerP(1991)小基因在转基因鼠中的异位表达扼要说明W-显型并证明C-试剂盒对成黑细胞原始因子的作用(Ectopicexpressionofac-kitW42minigeneintransgenicmicerecapitulationofWphenotypesandevidenceforc-kitfunctioninmelanoblastprogenitors.)基因进展(GenesDev.)52265-2273.76.Reeves,R.,Gorinan,C.M.andHoward,B.(1985)由转染进哺乳动物细胞的非整合质粒DNA装配的微染色体(MinichromosomeassemblyofnonintegratedplasmidDNAtransfectedintomammaliancells.)核酸研究(Nucl.AcidsRes.)133599-3615.77.Reitmann,M.,Lee,E.,Westphal,H.,andFelsenfeld,G.(1993).一个增强子/基因座控制区对于开放染色质并不充分(Anenhancer/locuscontrolregionisnotsufficienttoopenchromatin.)分子细胞生物学(Mol.Cell.Biol.)133990-3998.78.SacconeS,BiamontiG,MaugeriS,BassiMT,BunoneG,RivaS,DeliaValleG(1992)用cDNA竞争性原位杂交将人类异源核核糖核蛋白A1基因(HNRPA1)分配到染色体12q13.1(AssignmentofthehumanheterogeneousnuclearribonucleoproteinAlgene(HNRPA1)tochromosome12q13.1byCDNAcompetitiveinsituhybridization.)基因组(Genomics)12171-174.79.Sambrook,J.,Fritsch,E.F.,andManiatis,T.(1989).分子克隆实验指南(MolecularCloningALaboratoryManual)(ColdSpringHarbor,NYColdSpringHarborLaboratoryPress).80.Smith,C.L.,Archer,T.K.,Hamlin-Green,G.andHager,G.L.(1993)新表达的孕酮受体不能激活稳定、重复的鼠乳腺癌病毒模板,但能潜在反式激活持续的表达(Newlyexpressedprogesteronereceptorcannotactivatestable,replicatedmousemammarytiunorvirustemplatesbutacquirestransactivationpotentialuponcontinuousexpression.)国家学院科学学报(Proc.Natl.AcadSci.)USA9011202-11206.81.Southem,E.M.(1975).测定通过凝胶电泳分离的DNA片段中的特定序列(DetectionofspecificsequencesamongDNAfragmentsseparatedbygelelectrophoresis.)分子生物学杂志(J.Mol.Biol.)98503-517.82.Sun,T.Q.,Fernstemacher,D.A.andVos,J.M.(1994)人的人工游离基因染色体用于在人体细胞中克隆DNA大片段(HumanartificialepisomalchromosomesforcloninglargeDNAfragmentsinhumancells.)国家遗传学(Nat.Genet.)8,33-41.83.Talbot,D.,Philipsen,S.,Fraser,P.andGrosveld,F.(1990)详细分析人β-球蛋白显性控制区的位点3(Detailedanalysisofthesite3regionofthehumanβ-globindominantcontrolregion,)EMBOJ.,92169-2178.84.TamuraT,OsakaF,KawamuraY,HigutiT,IshidaN,NothwangHG,TsurnmiC,TanakaK,IchiharaA(1994)人蛋白酶体的α型HC3和β型HC5亚单元基因的分离及特性(Isolationandcharacterizationofalpha-typeHC3andbetatypeHC5subunitgenesofhumanproteasomes.)分子生物学杂志(J.MoLBioL)244117-124.85.Tartof,K.D.,andHobbs,C.A.(1987).改进的培养基用于质粒和装配型质粒克隆的生长(Improvedmediaforgrowingplasmidandcosmidclones.)BethesdaRes.Lab.焦点(Focus)912.86.Tewari,R.,Gillemans,N.,Wijerde,M.,Nuez,B.,vonLindem,M.,.Grosveld,F.andPhilipsen,S.(1998)EKLF(ErythroidKrüppel-likefactor)在原始及发育完全的红细胞中具有活性并且其为b-球蛋白位点控制区的5′HS3发挥功能所必需的(ErythroidKrüppel-likefactor(EKLF)isactiveinprimitiveanddefinitiveerytbroidcellsandisrequiredforthefunctionof5′HS3oftheb-globinlocuscontrolregion.)EMBOJ.172334-2341.87.TrachtulecZ,HwnvasRM,ForejtJ,Lehr-achHR,VincekV,KleinJ(1997)TATA结合蛋白和蛋白酶体亚单元C5基因在鼠和人中的连接显示了保守于哺乳动物和无脊椎动物间的同线性(LinkageofTATA-bindingproteinandproteasomesubunitC5genesinmiceandhumansrevealssyntenyconservedbetweenmammalsand′invertebrates.)基因组(Genomics)441-7.88.VyasP,VickersMA,SimmonsDL,AyyubH,CraddockCF,HiggsDR(I992)顺式作用序列调控位于结构开放染色质中的人α-球蛋白簇的表达(Cis-actingsequencesregulatingexpressionofthehumanalpha-globinclusterliewithinconstitutivelyopenchromatin.)细胞(Cell)69781-793.89.Wijgerde,M.,Grosveld,F.andFraser,P.(1995).转录复合物的稳定性和染色质在体内的动力学(Transcriptioncomplexstabilityandchromatindynamicsinvivo.)自然(Nature)377209-213.90.Winston,J.H.,Hanten,G.R.,Overbeek,P.A.,andKellems,R.E.(1992)鼠腺苷脱氨酶基因的5′侧翼序列在转基因鼠中直接表达报告基因至特定的出生前及出生后组织(5′flankingsequencesofthemurineadenosinedeaxninasegenedirectexpressionofareportergenetospecificprenatalandpostnataltissuesintransgenicmice.)生物化学杂志(J.Biol.Chem.)267,13472-13479.91.Winston,J.H.,Hong,L.,Datta,S.K.andKellems,R.E.(1996)鼠腺苷脱氨酶的内含子1调控区可激活异源启动子用于转基因鼠中的遍在表达(AnintronIregulatoryregionfromthemurineadenosinedeaminasegenecanactivateheterologouspromotersforubiquitousexpressionintransgenicmice.)人体细胞分子遗传学(Som.CellMolGenet.)22261-278.92.Yamashita,T.,Kasai,N.,Miyoshi,I.,Sasaki,N.,Maki,K.,Sakai,M.,Nishi,S.andNwnioka,S.(1993)人α-胎蛋白在转基因鼠中的高水平表达(Highlevelexpressionofhumanalpha-fetoproteinintransgenicmice.)生化和生物物理学研究通讯(Biochem.Biophys.Res.Comm.)191715-720.93.Yates,J.L.,Warren,N.andSugden,B.(1985)源自EP病毒的质粒在不同哺乳动物细稳定复制(StablereplicationofplasmidsderivedfromEpstein-Barrvirusinvariousmammaliancells.)自然(Nature)313812-815.94.ZhumabekovT,CoThellaP,TolainiM,KioussisD(1995)改进的人CD2小基因基载体用于转基因鼠中的T细胞特异性表达(ImprovedversionofahumanCD2minigenebasedvectorforTcell-specificexpressionintransgenic.mice.)免疫学方法杂志(JImmunolMethods.)185133-140.权利要求1.一种包含UCOE的聚核苷酸,其开放染色质或使染色质保持在开放状态,并在至少两种不同组织细胞中促进被操纵连琐基因的可再现表达,其中该聚核苷酸不是从基因座位控制区衍生的。2.根据权利要求1所述的聚核苷酸,其中该聚核苷酸以非组织特异性的方式促进被操纵连琐基因的可再现表达。3.根据权利要求1所述的聚核苷酸,其中在有活化基因表达发生的所有组织中该聚核苷酸均促进被操纵连琐基因的可再现表达。4.根据前述权利要求中任一项所述的聚核苷酸,其中该聚核苷酸促进被操纵连琐基因在生理水平上的表达。5.根据前述权利要求中任一项所述的聚核苷酸,其中UCOE包含延长的无甲基化的CpG-岛。6.根据前述权利要求中任一项所述的聚核苷酸,其中UCOE衍生于其天然内源位置与遍在表达基因相关联的序列。7.根据前述权利要求中任一项所述的聚核苷酸,其中UCOE包含背弛转录的双重或双向启动子。8.根据前述权利要求中任一项所述的聚核苷酸,其中UCOE是一个跨越人TATA结合蛋白(TBP)基因的44kbDNA片段和各12kb的5′和3′侧翼序列;或其功能同源体或功能片段。9.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE是一个跨越人hnRNPA2基因的60kbDNA片段和5′的30kb及3′的20kb的侧翼序列;或其功能同源体或功能片段。10.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE包含图21中在核苷酸1至6264之间的序列,或其功能同源体或功能片段。11.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE包含图21中在核苷酸1至5636之间的序列和CMV启动子,或其功能同源体或功能片段。12.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE包含图21中在核苷酸4102至8286之间的序列,或其功能同源体或功能片段。13.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE包含图21中在核苷酸1至7627之间的序列,或其功能同源体或功能片段。14.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE包含图21中在核苷酸1至9127之间的序列,或其功能同源体或功能片段。15.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE是一个跨越人TBP基因的25kbDNA片段和5′的1kb及3′的5kb的侧翼序列;或其功能同源体或功能片段。16.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE是一个跨越人hnRNPA2基因的16kbDNA片段和5′的5kb及3′的1.5kb的侧翼序列;或其功能同源体或功能片段。17.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE包含图20或图21所示的核苷酸序列,或其功能同源体或功能片段。18.根据权利要求1-7中任一项所述的聚核苷酸,其中UCOE的一个或多个启动子是异源启动子。19.上述权利要求中任一项所述的聚核苷酸或其片段在鉴定其它UCOE的试验中的应用。20.一种对在至少两种不同组织细胞中促进被操纵连琐基因可再现表达的UCOE进行鉴定的方法,包括(1)用具有候选UCOE的载体通过转染至少两种不同组织的细胞对候选UCOE进行测验,所述候选UCOE被操纵连琐到标记基因上;和(2)确定是否在两种或更多种组织细胞中能得到该标记基因的可再现表达。21.一种载体,具有权利要求1-18中任一项所述的聚核苷酸。22.根据权利要求21所述的载体,其中还具有被操纵连琐到所述聚核苷酸上的可表达基因。23.根据权利要求21或22所述的载体,其中该载体是游离型载体或整合型载体。24.根据权利要求21或22所述的载体,其中该载体是质粒。25.根据权利要求21至24中任一项所述的载体,其中被操纵连琐的基因是治疗用核酸序列。26.根据权利要求21所述的载体,其含有图20中在核苷酸1和7627之间的序列、CMV启动子、多克隆位点、聚腺苷酸化序列和在适当调控元件下的编码可选择标记物的基因。27.一种如图49所示的载体CET200。28.一种如图49所示的载体CET210。29.一种用权利要求21至28中任一项所述载体转染的宿主细胞。30.在治疗中使用的权利要求1至18中任一项所述的聚核苷酸、权利要求21至28中任一项所述的载体或权利要求29所述的宿主细胞。31.权利要求1至18中任一项所述的聚核苷酸、权利要求21至28中任一项所述的载体或权利要求29所述的宿主细胞在制备在基因疗法中所用的组合物中的用途。32.一种治疗方法,包括给需要治疗的患者施用治疗有效剂量的权利要求1至18中任一项所述的聚核苷酸、权利要求21至28中任一项所述的载体或权利要求29所述的宿主细胞。33.一种药物组合物,包括权利要求1至18中任一项所述的聚核苷酸、权利要求21至28中任一项所述的载体或权利要求29所述的宿主细胞以及可药用赋形剂。34.权利要求1至18中任一项所述的聚核苷酸、权利要求21至28中任一项所述的载体或权利要求29所述的宿主细胞的用途,将其用于细胞培养体系中以获得目的基因产品。35.权利要求1至18中任一项所述的聚核苷酸用于增加内源基因的表达的用途,包括把所述聚核苷酸插进细胞的基因组中与所述内源基因可操纵相关的位置上,由此来提高所述基因的表达水平。36.一种转基因非人动物,其细胞中具有权利要求1至18中任一项所述的聚核苷酸。37.权利要求1至18中任一项所述的聚核苷酸的用途,其用于得到反义基因序列的表达,从而使相应内源基因序列的表达失活。38.权利要求1至18中任一项所述聚核苷酸在制备表达文库中的用途。39.权利要求1-18中任一项所述的聚核苷酸在用于在非人动物动物中鉴定可表达基因的方法中的用途,包括把具有所述聚核苷酸的构建体插进所述非人动物的胚胎干细胞中,其中所述构建体只在插进表达基因中后才允许药物筛选。全文摘要本发明涉及具有非衍生于LCR的遍在染色质开放表达元件(UCOE)的聚核苷酸。本发明还涉及具有该聚核苷酸序列的载体、具有该载体的宿主细胞、在治疗和试验中该聚核苷酸或载体或宿主细胞的使用以及鉴定UCOE的方法。UCOE能开放染色质或使染色质保持在开放状态,并在至少两种不同组织细胞中促进被操纵连琐基因的可再现表达。文档编号C12N15/85GK1334878SQ9981115公开日2002年2月6日申请日期1999年7月21日优先权日1998年7月21日发明者迈克尔·安东尼乌,罗伯特·克龙比申请人:科布尔药物有限公司
网友询问留言 已有1条留言
  • 访客 来自[中国] 2021年03月08日 11:04
    nice
    0
1