通过反式互补系统识别顺式沉默基因的制作方法

文档序号:580121阅读:718来源:国知局

专利名称::通过反式互补系统识别顺式沉默基因的制作方法
技术领域
:反式互补实验可系统识别双等位封闭基因。
背景技术
:多细胞生物被定义为在单一生物中,存在一系列基因组相同但生理功能不同的细胞。这通常是通过多潜能干细胞逐步分化和多样化成功能专一的细胞实现。作为一个基本规则,尽管细胞外环境和细胞内调节网络发生波动,但是分化后的细胞还是可以稳定地保持其表型特征。在生物学中,细胞的特征在分子水平是如何维持的,是一个核心的却又知之甚少的问题。一种可能的解释是分化细胞的表型特征通过谱系不恰当基因一如促进其他不正常表达导致错误细胞型出现的谱系基因的稳定沉默得以维持。这一解释与人们对基因的转录输出是两个不同输入联合产物认识的增长相一致。第一个输入是细胞的反式作用环境,定义为通过共同影响基因调节序列,促进或抑制基因表达的所有扩散性因子。第二个输入是基因本身染色质状态的顺式作用,定义为在基因位点上所有的染色质标记,如DNA甲基化、组蛋白修饰和染色质重构因子的结合,这些因素共同确定基因位点如何应答其环境。在染色质沉默位点富有特定的染色质标记,如DNA甲基化和组蛋白去乙酰化。然而,大多数情况下,这些染色质标记对沉默状态的确切贡献不能与环境因素的影响区分开。因为很难知道染色质标记是沉默的原因还是结果;或环境变化时,基因的沉默状态及其相应的染色质标记的可逆程度有多少。因此,是否基于染色质的顺式机制的基因沉默,在维持细胞类型特征时起关键作用仍需解决。单等位基因沉默如X染色体失活和遗传印记,是以上不确定解释的一个明显例外。在此,可以毫无疑问地确定沉默是不依赖于环境的染色质顺式作用机制的结果。单等位基因沉默的特征是在相同细胞内,一个基因的两个拷贝的表达不同-一个沉默,一个激活。激活的拷贝作为阳性对照,证明了有利于基因表达的环境是存在的。在这种情况下,处于同样环境下的沉默拷贝,肯定是通过染色质状态的顺式效应来阻断环境的影响。因此,至少在单等位基因沉默的情况下,一个基因的转录能力可以被确定为两种状态的一种。一种是"能动的(competent)"状态,基因可以应答细胞环境,如果适当的转录激活因子存在时基因激活,激活因子缺失或阻遏物存在时基因沉默;另一种可以被称为"封闭的(occluded)"状态,基因不再能应答细胞环境,即便存在有利于转录的环境,基因仍然保持沉默在发育过程中,一些基因可能通过类似单等位基因沉默机制,逐渐双等位封闭。这一过程在维持细胞表型特征中可能起到了一个必不可少的作用。验证这个模型的关键是双等位封闭基因的识别。然而,阳性对照_相当于单等位基因沉默中的激活拷贝_的缺乏使确定双等位封闭基因的存在技术挑战。没有这样一个对照,不可能明确地区分一个基因是处于封闭状态,还是有转录能力但是因为诱导环境的缺乏没有表达。此外,可能以顺式作用调节基因表达的染色质生化修饰是极其复杂的(如已有超过100种已知的染色质标记),因此限制了利用"自下而上"的方法区分将顺式与反式调节。
发明内容反式互补实验可系统识别双等位封闭基因。在此描述的方法是融合至少两种迥异不相近似的细胞,在融合细胞中搜索在一基因组中沉默但在另一基因组中激活的(表达的)基因。这些"迥异"或"不相近似"的细胞包括来自不同物种的细胞或来自同一物种的不同类型细胞。例如,一种重编程细胞可以提供与应答细胞的环境不同的转录环境。不相似或迥异度可能不同,取决于使用细胞的类型。尤为适用于这种实验的细胞是那些容易培养的细胞,因为使用细胞数量的增加可以提高实验的灵敏度。与单等位基因沉默类似,激活的拷贝作为阳性对照,与之相比较,沉默拷贝的封闭状态就可以得以确定。应答细胞的封闭状态与其相应的重编程细胞有关。多种不同的重编程细胞可以类似地与应答细胞融合,以识别该应答细胞中大量的封闭基因。也可以使用具有转录环境的人造细胞脂质体(或任何其它细胞融合组件)。该脂质体可以包含编码一个或多个由其固有转录控制元件和表达所需反式因子控制的待分析基因的核苷酸链。合成的转录环境也可用于识别顺式沉默基因。反式互补识别顺式沉默(封闭)基因的方法包括(a)选择第一类和第二类细胞,此处细胞遗传上不相近似;(b)融合第一类和第二类细胞产生一个或多个的融合细胞,此处细胞被不同地标记;(C)对融合细胞中表达的多个基因进行基因表达分析;并(d)通过比较融合前后基因的表达识别第一类细胞中的顺式沉默(封闭)基因,顺式沉默基因是第二类细胞基因组中融合前后均表达,但第一类细胞基因组中融合前后均不表达的基因。第一类细胞可被称为应答细胞,第二类细胞则称为重编程细胞。重编程细胞可以没有细胞核。第一类细胞可以是癌细胞。细胞可以源自不同的组织或物种。多细胞类型也在公开的范围内。具体的异种细胞包括C3H鼠的mS匪和BG鼠的mDF。—类细胞的封闭基因组(occludome)定义为顺式沉默基因的集合,顺式沉默基因不具有被不相似细胞的适当反式激活因子所激活的能力。在目标基因组中,确定与反式机制相比,顺式机制对调节编码基因有关贡献的方法,方法包括(a)在体外融合至少两类不同的细胞;(b)搜索在融合细胞和未融合细胞基因组之间表达不同的目标基因,引入并共享融合细胞的顺式封闭基因不能应答反式信号;并(c)比较顺式基因和反式基因。确定与反式机制相比,顺式机制对调节编码基因有关贡献的方法,方法包括(a)在体外融合至少两类不同的细胞;(b)比较来自不同细胞基因组的目标基因在未融合和融合细胞中的表达水平,相关贡献与目标基因对被引入融合细胞的共享环境中的反式信号的相关响应性有关。识别封闭基因的方法,包括(a)融合不同种类的细胞,其中一类细胞作为"应答细胞",另一类细胞作为"重编程细胞";(b)用与重编程细胞不同的标记标记应答细胞;(c)通过双标记的存在确定融合细胞;(d)检测融合细胞以确定表达形式;并(e)识别在应答细胞基因组中沉默但在重编程细胞基因组中激活的基因。在一些实例中,表达形式可通过微阵列分析或RT-PCR确定。在特定实例中,表达形式需通过微阵列分析以及RT-PCR才能确定。物种的实例包括鼠和人。应答细胞实例包括人肺成纤维细胞hLF;重编程细胞实例包括鼠骨骼肌成肌细胞mS匪。按照本说明书所描述的方法,以人肺成纤维细胞为应答细胞和鼠骨骼肌成肌细胞作为重编程细胞,通过微阵列分析确定了大约300个候选基因,在后续的验证中确认52个基因是封闭的。部分封闭基因在鼠/鼠、人/人和黑猩猩/人细胞融合体内进行了测试,在绝大多数情况下确认了其封闭状态,表明该封闭不是鼠人细胞杂交的人为结果。后续的长期培养和杂交细胞的核融合表明基因的封闭状态是稳定的。部分肌肉相关的封闭基因在mS匪和其它类人体细胞如HeLa、间质干细胞和角质化细胞的融合体中是封闭的。此外,一种可选的方法被应用于检测hLF和鼠肝细胞单独与鼠神经瘤系细胞融合细胞中的基因封闭。发现2个在肝细胞表达、在hLF封闭基因在肝融合细胞中封闭,如同一个在成神经细胞表达、在hLF封闭基因,表明封闭状态在响应不同潜能重编程细胞时通常能够维持。封闭的分子基础如DNA甲基化,同样进行了分析。运用亚硫酸氢盐测序了部分封闭和未封闭基因,以确定与mS匪相比hLF中潜在的甲基化差异。少量的封闭基因在转录起始位点附近显示有不同的甲基化。用去甲基化试剂5-氮杂胞苷处理hLF并未显著地改变封闭基因的表达,但细胞融合后,观察到很多这种基因有低水平的激活,表明封闭状态至少已经部分削弱(需要注意的是许多这种基因并未显示不同的甲基化形式)。在类似的实验中同样研究了HDAC抑制剂TSA的影响,但是发现影响甚微。检测了封闭状态的稳定性对生理条件变化(低营养、缺氧等)的响应。发现与反式激活控制的基因相比,封闭基因是极其稳定的。这表明染色质标记将一些基因,如封闭基因,与一个给定类型细胞内的转录环境相隔离,同时其它基因对反式作用因子明显更为开放。关键谱系决定子通常有染色质修饰将其屏蔽以免谱系不恰当地激活。图1,封闭基因的识别(A)使用RT-PCR分析hLF-S匪融合细胞的表达;显示有四类基因封闭的hLF基因、反式激活的hLF基因、消减的(extinguished)mS匪基因和封闭的mS匪基因;每一个基因都显示有四个RT-PCR结果顶部的两个以融合前后mS匪同源直系基因为目标,而底部的两个以融合前后hLF直系同源基因为目标,已知的肌肉相关基因都在基因名字的上方用"+"标记;(B)对基因在hLF、mDF和cDF细胞中是封闭(用0表示)还是反式激活(T)的总结;指明了每个基因中CpG岛的存在与否,以及hLF和hS匪之间转录起始位点TSS的是否被不同地甲基化;也指明了每个基因在人胚胎干细胞中是否是Polycomb的结合位点。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞;mDF:鼠真皮成纤维细胞;cDF:黑猩猩真皮成纤维细胞;hS匪人骨骼肌成肌细胞。图2,mDF-mSMM融合细胞的RT-PCR表达分析和在hLF中封闭或反式激活基因的序列;(A)使用mDF和mS匪通用弓|物进行的RT-PCR;显示了在mS匪和融合细胞中但在mDF中没有的表达;(B)融合细胞RT-PCR产物的序列(电泳图的最后一排);mDF的14个基因中有ll个是封闭的,因为融合细胞中只有mS匪的等位基因表达;相比之下,Chrnd,Myog和Myl4是反式激活的,因为mDF和mS匪的等位基因都表达;电泳图的前两排不是mS匪就是mDF的单独序列,显示这两类细胞之间的不同等位基因。电泳图中的箭头所指的是mDF和mS匪之间的多态位置。mDF:鼠真皮成纤维细胞;mS匪鼠骨骼肌成肌细胞;hLF:人肺成纤维细胞。图3,各培养条件下封闭基因表达状态的对照;除了正常培养条件,还使用了5个模拟生理改变的条件,包括低营养、低氧、低温、高温和干扰素_Y处理;选择正常条件下沉默的基因作为对照基因(A)hLF中在各种培养条件下都稳定沉默的封闭基因(B)—些在模拟生理改变培养条件下激活的对照基因;在一个或多个条件下激活的基因用"*"标示。图4,封闭基因Myf5(A)和反式激活基因Actal(B)的亚硫酸氢盐法测序分析;在基因结构的模式图中,外显子用实心的条带表示,其中宽带表示编码区域而窄带表示非编码区域,标示了通过生物信息法识别的CpG岛,在保守图中,峰的高度反映了跨物种保守的程度;亚硫酸氢盐测序中的单独扩增子及其对应的基因组区域用括号标示;在每块亚硫酸氢盐测序数据内,柱对应于CpG位点,行对应于测序过的克隆,实心环代表甲基化的CpG,点代表未甲基化的CpG。图5,AdC和TSA处理对hLF中封闭基因的影响RT-PCR分析药物处理的未融合的hLF以及药物处理过的并与mS匪融合的hLF的基因表达。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞。图6,hLF中16个染色质标记的ChIP分析;分析选择的基因可以分为沉默组和表达组两组。而沉默组可以进一步分成封闭组和反式激活组(A)PCR定量的单个基因ChIP;每个条带代表PCR扩增子研究的区域;每个条带的高度代表基因的富集度(fold-enrichment)和相对输入;P值由这些数据根据t检验计算得到,表明两组基因在研究的染色质标记上不同具有统计学意义,误差带根据多次重复实验得到;(B)16个染色质标记的主成分ChIP数据分析。NS:无意义;hLF:人肺成纤维细胞。图7,基因组调节的不同观点(A)提议的封闭基因组观点认为基因组的组成部分包括封闭部分和可转录部分;(B)传统的转录基因组观点认为基因组由表达部分和沉默部分组成;与转录基因组说相比,封闭组说可以提供在分子上更基础、在生理上更稳定细胞类型的解释。图8,hLF和mS匪之间的融合(A)融合细胞FACS纯化;融合前,分别用红色和绿色荧光染料标记hLF和mS匪;化学诱导融合后,根据双荧光来纯化hLF-mS匪融合细胞。左侧是对照实验的流式细胞仪图,为未进行化学诱导融合的hLF和mS匪共培养,显示为两种不同的细胞群。右侧是具有第三种,含有融合细胞的双荧光细胞群的融合实验图;(B)FACS-纯化的细胞的光学显微镜检查;几乎所有的细胞都有双荧光,并且每个细胞都含有两个或多个细胞核;(B)融合细胞中hLF与mS匪细胞核的比率大部分融合细胞具有同等数量的hLF和mS匪细胞核(要么是1:1,要么是2:2)。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞。图9,hLF-mS匪融合细胞的时间过程分析;细胞融合后的第1、2、3、4、8或16日通过RT-PCR分析融合细胞中人和鼠的基因表达;hLF基因的封闭状态在这些不同时间点始终保持沉默。hLF:人肺成纤维细胞;mSMM:鼠骨骼肌成肌细胞。图lO,mDF-mS匪融合细胞的时间过程分析。融合细胞中Myf5,Car2,Cxcr4和Chrnd的表达在融合后第2、4或8日,通过对各自基因RT-PCR产物测序进行了分析;箭头所指的是mDF和mS匪之间的多态位点;Myf5,Car2和Cxcr4在mDF细胞中始终封闭,而Chrnd到第四天明显被反式激活。mDF:鼠真皮成纤维细胞;mS匪鼠骨骼肌成肌细胞。图11,通过RT-PCR和测序得到的cDF-hS匪融合细胞的表达分析;hLF的24个封闭基因和10个反式激活基因中,分别有12个和8个在cDF-hS匪融合细胞有表达,它们含有cDF和hSMM间的外显子替代物,且在两类细胞中的差异表达(A)使用cDF和hS匪通用引物对20个表达基因进行RT-PCR,显示了在hS匪和融合细胞中有,但是在cDF中没有的表达;(B)融合细胞PT-PCR产物的序列(电泳图的最后一排),表明一个基因在cDF中要么是封闭的,因为融合细胞中只有hS匪等位基因是表达的,要么是反式激活的,因为cDF和mS匪的等位基因都是表达的;电泳图前两道要么只是cDF要么只是hS匪,表明这两类细胞之间不同的等位基因。电泳图中的箭头所指的是cDF和hS匪之间的核苷酸置换点。cDF:黑猩猩真皮成纤维细胞;hS匪人骨骼肌成肌细胞;hLF:人肺成纤维细胞。图12,DF-mS匪融合细胞有DNA合成和细胞核融合的证据。(A)融合和FACS纯化4天后,细胞核直径增大(大约40%)的单核细胞;这一阶段绝单核细胞占细胞的绝大多数;(B)随着时间增长,BrdU标记细胞的增加表明有DNA合成;(C)融合后四天BrdU结合的免疫荧光染色;(D)融合后四天mDF和mS匪两个基因组在单核细胞的单个细胞核的存在;在融合之前,分别用CldU和IdU标记mDF和mS匪基因组,通过免疫荧光染色在融合细胞中可见。mDF:鼠真皮成纤维细胞;mSMM:鼠骨骼肌成肌细胞;A和B中的误差带代表平均值的标准差。图13,在不同类型细胞封闭基因的中识别;三种非肌细胞,hMSC、hKe和Hela分别与mS匪融合,其结果分别如A、B、C所示;hLF-mS匪融合细胞中识别的24个hLF封闭基因在这些融合实验中同样进行了检测;已知的与肌肉相关的基因在基因名字的上方用"+"标示。hLF:人肺成纤维细胞;hMSC:人间质干细胞;hKe:人成角质细胞;mS匪鼠骨骼肌成肌细胞。图14,封闭的hLF基因Myodl(A)、Cacngl(B)、R即sn(C)和Tnni2(D)以及反式激活的hLF基因Myog(E、Ckm(F)、Tnnil(G)和Tnncl(H)的亚硫酸氢盐测序分析。在hLF和hS匪之间进行了比较;本图沿用图4的标记约定。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞。图15,hLF中18个封闭基因和5个反式激活基因的转录起始位点(TSS)的亚硫酸氢盐测序分析;在hLF和hS匪之间进行了比较;Ncaml的TSS被2个扩增子覆盖;Cxcr4和Myl4分别有两个不同的TSS(用a和b表示),分别地进行分析;用"*"标示的基因在hS匪中不表达,所以这些基因在hS匪中是封闭的还是能动的是未知的;所有其它基因在hS匪细胞有表达(因此是能动的)。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞。图16,在hLF-m0st融合细胞中识别的hLF封闭基因;每一个基因对应有4个RT-PCR结果顶部的两个以融合前后mOst中鼠的直系同源基因为目标,而底部的两个以融合前后hLF中人的直系同源基因目标;在hLF-mSMM融合细胞发现的同样封闭基因中也标示了;发现为人胚胎干细胞Polycomb结合位点的基因用"Pc"标示。hLF:人肺成纤维细胞;m0st:鼠成骨细胞;mSMM:鼠骨骼肌成肌细胞。图17,hLF-mHe(A)和hLF-mNeu(B)融合细胞的RT-PCR表达分析;每个基因对应有四个RT-PCR结果顶部的两个以融合前后鼠mHe(A)直系同源基因或mNeu(B)的直系同源基为目标,而底部的两个以融合前后人hLF的同源基因为目标。hLF:人肺成纤维细胞;mHe:鼠肝细胞;mNeu:鼠成神经细胞瘤。图18,应答细胞与不同的重编程细胞融合时封闭状态的稳定性;在hLF-mS匪融合细胞中识别的hLF的24个封闭基因中,Spock2和Mnda在mHe中同样表达,而Gnaol在mNeu中同样表达,提供了检测与不同重编程细胞融合后这些基因在hLF细胞中是否封闭的条件(A)hLF-mHe融合时,hLF的Spock2和Mnda同样是封闭;(B)hLF-mNeu融合时,hLF中的Gnaol也是封闭的;其它基因不能确定,因为它们既不在mHe也不在mNeu中表达。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞。mHe:鼠肝细胞;mNeu:鼠神经细胞瘤。图19,应答细胞与不同重编程细胞融合时其反式激活基因的稳定性;在hLF-mS匪融合细胞中识别的10个hLF反式激活基因中,Mfap5在m0st同样表达,而Actal,Myl4和T皿il在mHe中表达。提供了检测当与不同重编程细胞融合后这些基因在hLF是否也是反式激活的;(A)hLF-mHe融合时,hLF中的Mfap5也是反式激活的;(B)hLF-mHe融合时,hLF中的Actal,Myl4和Tnnil也是反式激活的;其它基因不能确定,因为它们既不在m0st也不在mHe中表达。hLF:人肺成纤维细胞;mS匪鼠骨骼肌成肌细胞;m0st:鼠成骨细胞;mHe:鼠肝细胞。具体实施例方式—个基因的转录输出是两个输入共同作用的产物细胞环境中的扩散性因子反式作用,而染色质状态顺式作用。确定与反式机制相比,顺式机制对基因调节的相对贡献称为反式互补。这通过融合至少两类不同的细胞并在融合细胞中搜索两个基因组之间基因的差异表达可以实现。任何差异表达都可以归结于顺式机制因为融合细胞中的两个基因组共享单一的反式作用环境。基因转录能力被遮蔽的状态称为"封闭态",通过阻断基因对细胞中反式作用的应答,受影响的基因由于顺式作用机制而沉默。封闭基因在多种细胞中得到了确认。在一种给定细胞类型的封闭基因倾向于含有细胞特征选择的主触发器。这些主触发器是驱动谱系特异程序激活的转录调节子,其封闭可以保持细胞的类型特征。而且,基因的封闭状态在细胞分裂过程是稳定的,在宽范的生理条件下也都极其稳定。染色质分析表明部分基因的封闭可能与DNA甲基化有关,并且封闭基因富含HPl-a结合位点。这些结论一起支持了谱系不恰当基因的封闭是细胞类型限制的关键机制的这一观点。通过在此公开的方法对封闭基因系统的描述,提供了新的细胞类型分子水平的的定义,并且提供了一个全新的识别基因组中染色质状态功能的方法。细胞融合在过去已被用于基因调节的研究,通常集中于融合细胞内组织特异性基8因的反式激活和消减,显示反式作用转录激活因子或抑制因子的存在。细胞融合的一个重要用处是应用于反式互补实验。通过融合不同类型细胞并搜索融合细胞中两个基因组之间差异表达的基因,这个实验可以将顺式作用机制和反式作用环境对基因沉默效应的贡献区分开。对本领域的熟练技术人员而言,基于本发明方法,任何用于差异表达分析的合适方法都可被采用,这些方法包括但不限于微阵列分析,实时PCR,Northern分析和由半定量反转录PCR(RT-PCR)获得的cDNA的序列。物种特异性微阵列分析的使用,对来自不同种类的细胞融合后差异表达的基因的全局分析是极其有用的。利用这个实验,识别了一类以封闭状态存在的基因,封闭状态定义为即使存在有利于转录的微环境,这个基因仍保持沉默的一种转录能力状态。基因的封闭状态可在细胞分裂期间维持并且在宽范的生理条件下高度单等位基因沉默如X染色体失活和遗传印记明显符合封闭态的定义。双等位封闭也是普遍存在的生物学现象,影响不同类型细胞中的许多基因。实际上,单等位沉默可以认为是基因封闭的一个特例,单等位沉默是从原始的双等位封闭状态进化而来似乎是可信的。通过可以稳定地关闭谱系不恰当基因否则会激活,双等位封闭可能是确定和维持细胞表型特征的关键因素。基因组调节的"封闭组"观点认为一类细胞的基因组包括两部分,一部分是所有的封闭基因,另一部分是所有的能动(活跃表达的)基因(图7A)。在一类细胞中活跃表达的基因具有全部活性,但沉默基因要么是能动的要么是封闭的。这种观点与目前基因组的"转录基因组"认为基因要么是表达的要么是沉默的观点是不同的概念框架(将图7A与7B比较)。为了系统地描绘一类细胞中的所有封闭基因,可将这类细胞与其它多种类型的细胞融合共同表达其整个基因组。与相当易变的转录基因组相比,这样一个封闭组图提供的细胞类型的定义生理上更一致,且可能分子水平上更基础。通过比较不同谱系的细胞、具有相同基因组的干细胞和特化细胞、新细胞和老细胞、正常和病理细胞(如癌细胞)、以及不同物种的细胞之间的封闭组图,可以更广泛地深入理解发育、老化、疾病过程、进化机制的基础。而且,对于一个给定类型的细胞,还比较了其封闭图谱和全基因组图的染色质标记,如DNA甲基化和组蛋白修饰。这样的比较可反映封闭状态的生化基础,更重要的是,提供了一个全新的识别遗传密码上复杂的染色质编码重叠的功能的方法。这里描述了基因封闭开/关的二元观点。然而,封闭有时可以导致部分基因的部分沉默也是合理的,在这种情况下一个基因在融合细胞中的两个基因组之间可能显示出表达量的不同而非量有/无的不同。只要基因在融合细胞的基因组之间显示有不同的表达(假设混杂因素如种间不相容排除在外),反式互补实验就可用来揭示完全封闭和部分封闭。基因的封闭状态定义要求一个基因即使在存在有利于转录的环境中仍保持沉默(或几乎沉默)。然而,这种定义仪与特定的环境有关。一个基因在一个环境中可能是封闭的但是在另一个环境中是激活的。这是有可能发生的,如果第一个环境中的转录因子被存在于基因的某些顺式调节序列中的抑制性染色质标记所屏蔽,但是第二个环境中的转录因子,与第一个中的不同,可以通过识别基因上另一组未受抑制性染色质影响的不同顺式调节序列来驱动表达。或者,第二个环境中的转录因子不同于第一个于环境中的,即便存在抑9制性染色质也可以识别其目标序列。环境具有"去封闭"基因的能力-例如,消除与封闭状态有关的染色质标记。这样的消除可以影响单个基因或整个基因组,可以是一个主动的过程或是被动的过程。体细胞通过核移植进入卵细胞或与胚胎干细胞ESC、胚胎生殖细胞ESG融合而重编程,证明了这些类型的细胞具有消除体细胞在发育过程中建立的绝大部分,如果不是所有的染色质标记的能力。这样的能力可以仅来源于少量的基因,这些基因的异常表达可以使成纤维细胞重编程形成多潜能的,类似ESC的细胞,称为诱导多潜能干细胞iPS。囊胚期(ESC分裂期)过后不久,细胞就失去了去封闭基因组的能力,这可能是通过封闭在第一个时期内与全基因去封闭有关的相同基因而达到。,细胞在随后的发育阶段中逐步分化,伴随着不可逆或几乎不可逆的,基因数量不断增加的封闭,不同谱系中的不同组基因就逐步封闭了。谱系不恰当基因的封闭可以保证多细胞有机体中各种类型细胞表型的稳定性,抵抗细胞外环境和细胞内调节网络两者的变化。而且,不同细胞类型的特征由不同的封闭组决定,也可以解释为什么相同的信号传导途径,在不同的细胞类型中常常引起不同组基因的激活这一多细胞生物发育过程中常见的现象。相同转录因子在不同类型细胞中发挥不同作用的能力使得多细胞生物在不增加基因组大小/复杂程度的情况下提高细胞类型的复杂程度。因此,将部分基因封闭的进化可能是多细胞体进化的先决条件。封闭状态应该是相当稳定的以赋予和维持生物体整体中细胞的特征,(生殖细胞是一个例外,在生殖细胞中,对大部分基因而言封闭状态要么尚未完全确定,要么在配子发育过程中被消除)。对于有些基因,正常条件下,体细胞中的封闭状态基本上是不可逆的(如x-失活和遗传印记状态下)。然而,通过刻意机制,有些类型的体细胞中的封闭基因可以去封闭,这对组织再生过程中细胞的去分化和转分化有贡献,尤其是在那些受伤后能再生整个部位的物种中。罕见情况下,基因的能动/封闭状态可以以一种随机的、不受调节的方式改变,这可能影响衰老和疾病如癌症的进展。因此利用反式互补实验系统识别和表征封闭基因在健康和疾病的研究中有着广泛的应用。通过种间细胞融合识别封闭基因为了识别特定细胞类型中的封闭基因,采取种间细胞融合的策略。待融合细胞类型中的一种叫做"应答细胞",另一种叫"重编程细胞"。目的是识别应答细胞中的封闭基因,因为封闭基因在融合细胞中的应答基因组中沉默,但在重编程基因组中激活(表l)得以确认。人肺成纤维细胞(在此縮写为hLF)被用做应答细胞,鼠骨骼肌成肌细胞mS匪作为重编程细胞。通过使用不同种类的,直系同源基因之间有序列差异的细胞可区分融合细胞中的转录产物是重编程细胞还是应答细胞基因组产生的。在一实施例中,用不同的荧光染料标记两个细胞群,使用聚乙二醇融合。占总细胞中很少一部分的双荧光细胞通过荧光激活细胞分选法FACS被分离出来(图8A)。显微观察确认FACS分离的细胞主要(>98%)是hLF和mS匪的融合细胞,因为这些融合细胞包含两种不同形态的多倍细胞核(与mS匪相比,hLF细胞核更大且DAPI染色更弱),(图8B)。对于细化实验,异型融合细胞(如hLF和mS匪之间的融合)可以通过使用抗生素清除未融合细胞或同型融合的细胞进一步富集(见材料和方法)。融合细胞中,超过70%的融合细胞具有等个数的hLF和mSMM细胞核,其中绝大部分含有一个hLF细胞核和一个mSMM细胞核,而剩下的含有两个hLF细胞核和两个mS匪细胞核。少于30%的融合细胞显示不等个数的hLF和mS匪细胞核,其中绝大部分含有过较多的mS匪细胞核(图8C)。细胞培养不同的周期以便在新环境中的基因重新表达。不管培养周期和培养基配方如何改变,融合细胞保持为多核的异核细胞,表明它们在融合之后失去了分裂的能力。基因表达形式在融合后3天内逐渐稳定,融合后第四天是分析基因表达的时期。为了探究融合前后hLF和mS匪中的基因表达,人和鼠的Affymetrix微阵列被使用。尽管人和鼠基因组之间的序列有显著差异(编码区平均为16%),但是融合细胞中人的转录产物仍然可以与鼠微阵列上的直系同源基因探针杂交,反之亦然,给定的微阵列不是为物属特异性杂交而设计。为了检测跨物种杂交是否存在问题,将来源于每类细胞的cRNA与人和鼠微阵列进行了杂交。当来自正确物种的cRNA与微阵列杂交时,大约有45%的基因响应为"存在"。做为对照,cRNA来自错误物种时只导致大约10%的基因响应为"存在"。这表明在研究融合细胞中相当一部分基因的表达时,微阵列仍有着充分的物种特异性。获得了4组阵列数据人阵列上的hLF、鼠阵列上的mS匪、人阵列上的融合细胞和鼠阵列上的融合细胞。为了确保这些分析的可靠性,选择了一组经阵列数据显示的在融合之前在mS匪中激活但在hLF中沉默的基因。在融合细胞中,如果这些基因在mS匪基因组中保持活跃而在hLF基因组中保持沉默,那么这些基因将列到hLF封闭基因的候选清单中。通过这个分析获得了一个包含279个推定为封闭的hLF封闭基因候选清单,然后对清单上所有的候选基因进行RT-PCR确认。对于每一个基因,都设计了鼠特异的和人特异的RT-PCR引物,并确定了这些引物可以独立地用来研究融合细胞中鼠和人基因的表达。与先前的Affymetrix微阵列研相一致,RT-PCR分析显示,在阵列数据中缺失响应比存在响应的可靠性低得多。因此,通过RT-PCR分析,大量来自阵列数据获得的候选hLF封闭基因在融合前后的hLF中都具有可观水平的表达。排除了这些和其它假象,通过RT-PCR确定了24个基因建立了与其在hLF中的封闭状态相一致的表达形式(图1A和表2)。在这些基因中,有9个已知有肌肉相关功能(在图1A中标示)。用人特异性引物对融合细胞的基因组DNA进行PCR,成功扩增出这些hLF基因的拷贝,表明融合细胞中它们表达缺失不是由hLF染色体的缺失引起的。事实上,在有丝分裂停止的异核细胞中是不大可能发生染色体丢失。应用表1的标准,获得了1040个推定为反式激活的hLF基因候选清单。选择其中202个基因进行RT-PCR确认。许多基因不能通过确认是因为RT-PCR检测到在融合前后的hLF细胞中都有可观水平的表达,对于其中的许多基因,RT-PCR没有显示融合后表达增加了,但是按照本文件公开的反式激活的严格定义,不能被认为是反式激活基因。这导致识别的10个反式激活的hLF基因,其中7个已知有肌肉相关功能(图1A和表2)。这些基因中的3个(Ckm,Actal和Myll),其反式激活与之前的报告相一致。对于在融合的细胞中hLF转录产物的扩增明显少于mS匪转录产物的反式激活基因(如Myog,Actal和R即lgal),额外的引物也证实了扩增的不同,反映了人和鼠直系同源基因之间实际的基因表达的不同,而不是PCR效率的不同。总体而言,融合细胞中观察到的人和鼠之间基因表达的差异可以归因于至少三个可能第一,基因可以部分封闭,这样它们激活作为对有利于转录的环境的响应,但这不是最大的可能。第二,hLF细胞群基因可能是异质的,被研究的基因在部分细胞但不是所有细胞封闭。第三种可能是mS匪基因组产生的鼠转录因子和hLF基因组中的人顺式调节序列不相容,导致这些基因仪部分激活。尽管封闭和反式激活基因在融合前的hLF细胞中都是沉默的,但它们显然是以两种不同的转录能力的状态存在。封闭基因即使在有利于转录的环境中也不会变活跃。与之相反,反式激活基因以能动的状态(尽管是非激活的)存在,可以应答环境中引入的反式作用因子。特别的RT-PCR分析还发现4个消减的mS匪基因和6个封闭的mS匪基因(图1A)。消减可以归结于转录抑制因子的引入,或因为细胞融合导致的转录激活因子的稀释或消失。对于消减的mSMM基因,不能确定其在hLF细胞中的直系同源基因是否是封闭的。封闭的mS匪基因的存在表明给定的细胞融合实验可用来识别融合双方中的封闭基因。hLF封闭基因的识别以一种系统且无偏见的方式进行,也就是说所有通过阵列数据获得的候选封闭基因都要进行RT-PCR确认。最后得出的24个hLF基因很可能代表了hLF-mS匪反式互补实验中所有hLF封闭基因的很小一部分。相比之下,反式激活的hLF基因、消减的mS匪基因和封闭的mS匪基因的发现方法就没那么系统了。肌原谱系的特化由四个转录因子Myodl,Myf5,Myog和Myf6控制。这些主肌化触发器中,Myodl和Myf5在hLF细胞中是封闭的,Myog在hLF细胞中是反式激活的(因此是能动的),而Myf6在mS匪细胞中是消减的(因此在hLF细胞中要么是封闭的,要么是能动的)。已知Myodl和Myf5是位于Myog和Myf6上游的驱动肌源程序,而且它们还参与正向自身调节和正向交叉调节。在这样一个调节回路中,假设在非肌细胞中Myodl和Myf5没有遭到封闭,那么由于细胞变化引起的这些基因的任何低水平的表达都可能通过反馈回路放大,反过来引起错误的肌肉表型出现在非肌肉细胞中。所以Myodl和Myf5在hLF细胞(和其它在本文件中展示的非肌肉类细胞)中封闭的事实支持了关键的谱系不恰当基因的封闭可以保持细胞的类型特征以对抗异常转分化这一模型。长期培养融合细胞中封闭基因的稳定性为了研究融合细胞中基因表达重启是如何被培养时间影响的,细胞融合后培养l、2、3、4、8或16天,然后用RT-PCR检测列在图1A中的基因的表达。结果显示基因表达的重启大部分发生在融合的前3天内,随后表达形式逐渐稳定。不管融合后细胞培养的时间有多长,封闭基因始终保持沉默(图9),表明了融合细胞中封闭基因的时间稳定性。通过与其它类型细胞的融合进一步证实了这种时间稳定性。观察到基因封闭的不是由于种间不相容尽管大量使用人的启动子/增强子驱动鼠报告基因的转基因实验已经显示了人转基因和内源鼠转基因之间具有保守的表达形式,但是一些看似是某些hLF基因的封闭现象实际上可能是种间不相容的结果_如mS匪基因组产生的转录因子识别hLF基因组中相应的顺式调节序列的失败。为了确认这种可能性,将两种不同品系的鼠源的细胞类型融合,其中一种是C3H品系的mS匪,另一种是B6品系的鼠真皮成纤维细胞mDF。探索B6和C3H鼠品系之间的序列多态性来确定融合细胞中转录产物的来源。在24个封闭和10个反式激活的hLF基因中,分别有11和3个基因在mDF-mS匪融合中有表达,这就是说基于测序数据分析,这些基因在两个品系之间具有外显子多态性,同时RT-PCR数据分析表明他们在mS匪中但不在mDF中表达。对于这些基因中的每一个,RT-PCR引物的设计用于显示品系间多态性位点的面。在mdDF-mS匪融合细胞中,mDF(B6品系)对mS匪(C3H品系)基因转录产物的相对丰度通过对RT-PCR产物的测序来评价。分析结果显示,在hLF封闭的ll个在融合细胞中有表达的基因中,除了一个,其他的在mDF中也封闭,这一结论基于融合细胞中mS匪等位基因的独有表达,独有表达的基因包括主肌化触发器Myodl和Myf5(图2;数据也总结在FIG.IB中)。唯一的例外是Chrnd,mS匪和mDF中的这一等位基因的水平表达大致相等,表明反式激活了。在hLF反式激活的3个在融合细胞中有表达的基因中,2个被发现在mDF中也是反式激活的,1个是封闭的(图2;同样总结在图1B)。与以上描述的hDF-mS匪融合类似,发现在mDF封闭基因,在mDF-mS匪融合实验的融合细胞中保持封闭并不受培养时间影响(图IO)。因此,有表达的基因中,在hLF中封闭的在mDF几乎全部封闭,并且在hLF中反式激活的在mDF中绝大部分也是反式激活的。这些结果强力地证明了种间不相容在识别hLF-mS匪融合细胞的封闭基因时所起的作用微不足道,尽管不相容可能影响了少量的基因。Chrnd在hLF表现为封闭但在mDF中反式激活的事实,表明在hLF-mSMM融合中,在hLF细胞中观察到的这一基因的封闭状态可能是种间不相容的结果。封闭状态的跨物种保守性hLF和mDF之间的比较表明给定类型细胞_此处为成纤维细胞_中的一组处于封闭状态的基因在不同的物种之间是保守的。为了进一步研究这一保守性,将黑猩猩真皮成纤维细胞cDF与人骨骼肌成肌细胞hSMM融合以检测在hLF中封闭基因是否在cDF中也封闭。人-黑猩猩基因组的差异大约是人和鼠基因组差异的1/30,事实上比许多物种的种内多态性水平低。因此种间不相容在此可以忽略。24个封闭和10个反式激活的hLF基因中,分别有12和8个在cDF-hS匪融合中是有表达。对于这些基因,使用两个物种通用但显示人-黑猩猩核苷酸取代面的引物进行RT-PCR。RT-PCR产物的测序表明,12个有表达的基因在hLF中封闭,在cDF中同样封闭(图11;总结在图1B中)。封闭的cDF基因包括Chrnd在mDF中反式激活,表明在hLF中这一基因的封闭状态是真实的。8个在hLF有表达的反式激活基因中,在cDF中6个反式激活,另外2个封闭(图11,总结在图1B中)。因此,hLF中基因的封闭或反式激活状态与mDF和cDF大体上一致,这表明在一个给定类型的细胞中处于封闭状态的一组基因在物种之间是高度保守的。这种保守性说明谱系不恰当基因的封闭是一个具有重要生物学功能、被高度调节的过程。DNA合成和细胞核融合对封闭状态的影响在mDF-mS匪融合实验中,尽管大部分细胞是异核细胞,但是融合和FACS纯化后,培养几天后,很快大部分细胞都变成了单核细胞。而且,这些单核细胞的平均细胞核直径比单独的mDF或mS匪细胞的大约40X(图12)。这可以归结为一个给定融合细胞中的多个细胞核形成单个细胞核(例如,核融合)。异核细胞的多个细胞核可以融合最可能的方式是细胞有丝分裂核膜崩解并重建。因此实现这一过程,mDF-mS匪融合的细胞必须具有合成DNA和有丝分裂的能力。通过监测胸腺嘧啶类似物5-溴-2'-脱氧尿苷BrdU的掺入,发现大部分融合的mDF-mS匪细胞在融合的几天之后重新开始DNA合成(图12)。为了进一步确认在单核化细胞的单个细胞核中确实含有mDF和mS匪两者的基因组,mDF和mS匪的DNA在融合前,分别用胸腺嘧啶类似物5-氯-2'-脱氧尿苷(CldU)和5-碘-2'-脱氧尿苷(IdU)标记。融合并FACS纯化后的第四天,对融合细胞进行CldU和IdU免疫共染色。发现在大部分单核化细胞中,细胞核都显示出CldU和IdU双阳性,与mDF和mS匪细胞核融合相符(图1312)。有丝分裂中染色体丢失的可能性增加了在融合细胞中识别封闭基因的复杂性。如果一些染色体被选择性地丢失,在融合的细胞中其量不足,使其携带的基因可能表现为封闭。对融合细胞的基因组DNA进行PCR扩增,扩增位点包括使用RT-PCR研究过的相同多态性位点。物理散布在整个基因组的被研究基因的PCR产物测序结果表明,两组等位基因存在的水平相当。等位特异表达如图2所示,不是染色体丢失所引起的。这些数据也说明在mDF-mS匪融合细胞中观察到的DNA合成应该是mDF和mS匪两个基因组复制造成的,因为如果两个基因组中只有一个进行了复制,复制基因组中等位基因的PCR产物相应的应该比未复制基因组的等位基因多,而事实不是。mDF-mS匪融合中的细胞可以进行分裂,然而在其它融合实验中的细胞大部分以有丝分裂停止的异核细胞存在。尽管如此,即便异核细胞进行了分裂,封闭基因仍保持封闭的事实说明基因的封闭状态对DNA复制、细胞核融合和细胞周期状态的改变稳定。肌细胞相关的基因在不同非肌类细胞中的封闭如果肌肉相关的基因,特别是Myodl和Myf5,确实有着保护hLF对抗肌化程序意外激活的作用,那么类似的肌肉相关的成组基因在其它非肌细胞谱系类型的细胞中应该是封闭的。为了检测这种可能性,将mS匪与不同谱系的非肌肉类细胞进行融合,然后用RT-PCR检测24个在hLF中封闭基因在这些类型细胞中是否同样封闭。所用的非肌肉细胞包括人间质干细胞(hMSC)、人角质化细胞(hKe)和人子宫颈癌细胞系Hela。这些细胞类型广泛代表了干细胞和特化细胞、正常细胞和转化细胞和起源于不同胚层的细胞。9个已知与肌肉相关的基因在hLF中封闭,大多数在其他非肌肉类细胞中也封闭,包括主肌化触发器Myodl和Myf5(FIG.13)。剩下的15个已知与肌肉无关的hLF封闭基因中,大部分在至少一种被研究的非肌肉类细胞中,要么融合前有表达要么融合后被反式激活。这些结果支持了谱系不恰当基因,特别是谱系选择的关键主触发器的关闭,有助于保护细胞的类型特征的模型。封闭状态在不同生理条件下的稳定性如果封闭状态在保持细胞类型特征中确实至关重要,那么这一状态在不同生理条件下应该保持稳定。为了研究封闭状态在不同生理条件下的稳定性,将hLF在各种培养条件下培养模拟各种生理压力,包括低营养、缺氧、低温和高温。已知对各类细胞包括成纤维细胞中许多基因的表达有显著影响的干扰素-Y处理同样包括在内。检测了这些培养条件下24个hLF封闭基因的表达形式。不管培养条件如何改变,所有的这些基因都保持沉默(图3A)。作为对照,根据微阵列数据和RT-PCR验证确认了正常培养条件下在hLF细胞中一组61个沉默基因。其表达形式在其他培养条件下进行验证。61个基因中总计有24个(39%)至少在一种条件下变得活跃的(图3B),与24个封闭基因中无激活的情况相比,这在统计学上具有显著差异(按Fisher精度检验p<0.00007)。这些结果表明了封闭状态在变化的生理条件下的高度稳定性,与基因组中其它基因转录的不稳定性形成了鲜明的对比。研究者经常用全基因组基因表达形式(例如转录基因组学)作为定义细胞类型特征的方法。然而,一类细胞在不同生理条件下具有产生相当不同的基因表达形式的潜能,使得转录基因组因为过于不稳定而不能确切的定义细胞类型。与生理不稳定的转录基因组相比,在此描述的结果说明全基因组中基因的封闭形式(如封闭基因组)可以更为确切的定义细胞类型。探索封闭状态的生化基础对封闭状态的生化基础进行了研究,集中于染色质修饰。通常伴随着基因沉默的启动子和增强子DNA甲基化进行了检测。生物信息学调查发现hLF的24个封闭基因中的18个,10个反式激活基因中的4个有CpG岛(总结在图IB)。封闭基因因此表现为富含CpG岛,尽管这只具有边际显著意义(按Fisher精度检验p<0.06)。运用大量的亚硫酸氢盐法测序分析5个封闭的和5个反式激活的hLF基因的甲基化形式(在此分析的封闭基因中的3个和反式激活基因中的2个含有CpG岛)。分析在hLF和hS匪两类细胞中进行。RT-PCR确认所有lO个基因在hS匪中都表达,表明在这类细胞中它们是能动的。由于大部分基因对亚硫酸氢盐测序法而言太大,推定的顺式调节区域是通过跨物种序列保守性识别的。分析还包括了转录起始位点TSS周围的区域和实验确认的与保守性无关的增强子元件。图4显示了一个封闭基因(Mf5)和一个反式激活基因(Actal)甲基化分析代表性的结果。其余8个基因的结果如图14所示。在hLF和hS匪之间观察到,5个封闭基因中的3个(Myf5,Cacngl和Rapsn)的甲基化显著不同,至少在取样的部分区域内,hLF比hS匪中的甲基化程度要高。在剩下的两个封闭基因中,Myodl在TSS的远上游增强子中显示出少量不同的甲基化,而T皿i2在任何取样的区域都没有显示出不同的甲基化。与封闭基因相反,反式激活基因在hLF和hS匪之间都没有显示明显不同的甲基化。对于Myf5和Cacngl而言,在hLF中至少有部分甲基化区域落入CpG岛内。尽管通常认为CpG岛是非甲基化的,但还是存在明显的例外,包括X-失活的许多基因、部分印记基因和癌细胞中异常沉默的基因。此外,普通的CpG甲基化偶尔可以在非印记、非X-失活的基因中发现,通常以组织特异化的形式存在。因此一些封闭基因CpG岛内的甲基化可能代表了另一个这样的特例。对于在hLF和hS匪之间存在显著差异甲基化的3个hLF封闭基因,TSS附近的区域是甲基化差异区域的一部分。使用亚硫酸氢盐测序检测其余23个基因(不包括Ly75,因为在技术上无法对其进行亚硫酸氢盐测序)的TSS的甲基化状态。hLF和hS匪之间的这些基因只存在很小或者没有甲基化差异,不管它们在hLF中是否封闭(图15,TSS甲基化分析的数据也总结在图1B中)。对于部分基因,封闭状态特征在于能动状态甲基化的增加,特别是TSS周围。然而,许多在hLF中封闭而在hS匪中能动的基因之间,在TSS中没有显示出明显的甲基化差异,表明甲基化要么不参与这些基因的封闭状态,要么即使是参与的,也是在其它而不是TSS区域中发挥作用。至少对于部分基因来说,此处的数据与后一种可能相吻合。为了进一步验证DNA甲基化是否会导致封闭状态的产生,在细胞融合前使用去甲基试剂5-氮杂-2'-脱氧胞嘧啶核苷(AdC)处理hLF。除了Msln被试剂非常轻微地激活外,处理本身是不会开启封闭的hLF基因。然而,在与mS匪融合中,大约一半hLF封闭基因显示出不同水平的反式激活(图5A)。当然,这些基因中的绝大部分,hLF拷贝的表达水平明显低于mS匪拷贝。这可能反映了细胞对药物处理的异质反应,或部分封闭基因的去封闭的事实。值得注意的是AdC处理可以改变那些在hLF和hS匪之间未显示出明显TSS甲基化差异基因的封闭状态。这表明DNA甲基化在维持这些基因的封闭状态中发挥了一定的作用,但是它是通过影响TSS邻近区外的调节区域而发挥作用。AdC处理改变这些基因中一部分的封闭状态也有可能不是通过DNA的去甲基化,而是药物对染色质状态其它未知的影响。但是这些结果,辅以亚硫酸氢盐测序数据,说明至少对于部分基因而言,DNA甲基化可能是一个促成其封闭的因素,在这里面可能还有其它机制起的作用。除了DNA甲基化,许多染色质标记在基因组的沉默位点或被认为是异染色质的区域(例如失活的X染色体和着丝点)不是偏高就是偏低。因此这些标志可以作为寻找封闭状态潜在生化机制的上好候选对象。通过染色质免疫共沉淀(ChIP)和PCR检测了16个这样的标志。包括7个组蛋白修饰((H3K9Ac、H3K4me3、H3K9me2、H3K9me3、H3K27me3、H4K20mel和H4K20me3),5个组蛋白变体(H2A.X、macroH2A、H2A.Z、H2A.Bbd和CENPA),以及4个染色质结合的蛋白(Polycomb抑制是Drosophila异染色质protin-l的哺乳动物同源物的复合蛋白SUZ12和EZH2,以及HPl-a和HPl-y)。在hLF的三类基因中检测了这些标志如图1A描述的24个封闭基因和10个反式激活基因,和一组17个通过微阵列数据随机筛选并由RT-PCR确认的活跃表达的基因(表3)。对于所有这些基因,染色质分析的焦点在TSS附近,因为它是与基因活性相关的不同染色质修饰的主要位点。对于少部分基因,已确认的增强子也包括在分析之内。对于这些标记中的大部分,沉默基因(包括封闭和反式激活基因)和表达基因之间在某种程度上有显著的区别(图6A)。特别是H3K9Ac,H3K4me3和H2A.Z这三个标志,相对于沉默基因,在表达基因中显著富集,其中富集最显著的是H3K4me3。相反,另外11个标志,H3K9me2、H3K9me3、H3K27m3、H4K20me1、H4K20me3、H2A.X、macroH2A、CENPA、SUZ12、EZH2和HPl-a,显示了相反的趋势相对于表达基因它们在沉默基因中显著富集,其中富集最显著的是H3K9me2,H3K9me3,H3K27me3和H4K20me3。两个标志,H2A.Bbd和HP1-Y,在沉默基因和表达基因之间没有显著的区别。然而,仅有一个标志,HPl-a,在两类基因中显示有显著不同,相对于反式激活基因,富集在封闭基因中。为了在视觉上更直观地表示基因间染色质标记间隔,使用主成分分析以将来自16个标记的16-维数据减少到2维。正如预期的,封闭基因和反式激活基因紧密地簇集在一起,而表达的基因是独立成簇的(图6B)。这些数据表明,被调查的染色质标记中,沉默基因(包括封闭和反式激活基因)和表达的基因之间非常不同,而封闭基因和反式激活基因相当近似。不过,与反式激活基因相比,封闭基因表现富含HPl-a结合位点,表明HPl-a可能与封闭机制有关。ChlP数据不能确定封闭状态和反式激活状态之间的组蛋白乙酰化区别。为了进一步探索组蛋白乙酰化是否与基因的封闭有关,在细胞融合之前用组蛋白去乙酰化酶抑制剂曲古霉素A(trichostatinA,TSA)处理hLF细胞。这个处理本身对封闭基因的沉默状态没有长期影响。在融合之后,hLF基因组中仅有两个基因MyodlandRcan2,显示出非常弱的反式激活(图5B)。这些结果表明,与ChIP数据一样,组蛋白乙酰化的水平不是建立封闭状态的主要原因,尽管组蛋白低乙酰化与表达的缺乏极其相关。识别人肺成纤维细胞中的其他封闭基因尽管在hLF-mS匪融合实验中寻找封闭的hLF基因是以无偏见、系统的方式进行,但是只有在mS匪中表达的基因可以研究。因此在hLF-mS匪融合中识别的hLF封闭基因绝大部分是肌肉相关的基因。然而,为了探查hLF中更多组的基因的封闭状态,将hLF与其它类型的细胞包括鼠成骨细胞(mOst)、鼠肝细胞(mHe)和形成神经元前体的鼠成神经细胞瘤系(mNeu)融合。和mS匪一起,这些细胞类型代表了全部三个胚层。16对hLF和m0st之间的融合,重复用于hLF-mS匪融合的系统方法-如用微阵列分析确定候选封闭基因,接着用RT-PCR确认。RT-PCR分析中还包括了在hLF-mS匪融合中识别的24个hLF封闭基因。通过这些方法,识别了36个在mOst中表达但在hLF中封闭的基因,其中9个在hLF-mS匪融合表现为封闭(图16)。在这些封闭基因中,需要特别注意的是R皿x2,它是一个功能为成骨化主触发器的转录因子。这类似于hLF-mS匪融合中发现的hLF中肌化主调节子Myodl和Myf5的封闭。hLF-mS匪融合和hLF-mOst融合一起在hLF中识别出了51个封闭基因。其中11个之前显示在人胚胎干细胞中结合有Polycomb抑制复合体2(PolycombR印ressiveComplex2PRC2)(这些Polycomb结合基因标示在图IB和图16中)。这个数字明显高于随机期望(p<0.003),因为在先前的研究中,在22500个被调查的基因中仅有1896个是Polycomb的结合目标。这一发现显示出在多潜能ES细胞中Polycomb结合到某些基因和当ES细胞分化成特异的细胞类型后这些基因的封闭之间可能存在一个必然的(mechanistic)联系。将封闭基因清单与先前在鼠ES细胞中识别的双价基因及启动子甲基化的基因(包括或不包括CpG岛)清单进行比较,但没有发现有意义的关联。对于hLF-mHe和hLF-mNeu融合,没有使用费时费力的系统法,代替的是一种更专注的方法(因此是非系统的)。随机选择一组已知的肝基因,并通过RT-PCR检测它们在mHe和hLF中的表达。在mHe中活跃但在hLF中沉默的基因进一步用RT-PCR检测以确定其在hLF-mHe融合中的表达形式。通过这些方法,在hLF中识别出了6个封闭基因和3个反式激活基因(图17)。同样,随机选择一组已知的神经基因并在hLF-mNeu融合中检测,识别出了hLF中的3个的封闭基因和8个反式激活基因(图17)。使用不同重编程细胞时封闭或反式激活的稳定性在hLF-mS匪融合中识别的24个hLF封闭基因中,9个在mOst中表达,2个在mHe中表达,还有一个在mNeu中表达(其它基因在这些类型的细胞中沉默)。当hLF与mS匪之外的其他类型细胞融合,这些基因在hLF中是否同样表现为封闭也进行了研究。通过hLF-mOst融合,发现9个在mOst中表达的基因在hLF中确实都是封闭的(图16)。类似地,hLF-mHe融合中,2个在mHe中表达的基因在hLF中依然是封闭的,在mNeu中表达的一个基因在hLF中依然是封闭的(图18)。在hLF-mS匪融合中识别的10个反式激活的hLF基因中,其中一个在mOst中表达,3个在mHe中表达。当hLF与mS匪之外的其他类型细胞融合,这些基因在hLF中是否同样表现为反式激活也进行了研究。这就是观察结果(图19)。因此,给定应答细胞类型中基因的封闭或反式激活对使用不同的重编程细胞作为融合对象是是稳定的,尽管可能有例外。材料与方法细胞融合鼠骨骼肌成肌细胞(mS匪)、成骨细胞(mOst)、肝细胞(mHe)和成神经细胞瘤(mNeu),以及人的肺成纤维细胞(hLF)先前已经描述过了,其为人们所知的通用名分别是C2C12、MC3T3-E1、Subclone4、AML12、Neuro-2a和MRC-5(Blauetal.,1985;KlebeandRuddle,1969;Wangetal.,1999;Wuetal.,1994;YaffeandSaxel,1977)。C2C12(CRL-1772),MC3T3-E1亚克隆4(CRL-2593),MRC-5(CCL-171),Hela(CCL-2)和人角质细胞(hKe;CRL-2404)从ATCC获得;人间质干细胞(hMSC)是按文献(Zhangetal.,2007)描述的方法获得;黑猩猩真皮成纤维细胞(cDF;S006007)从CoriellInstituteforMedicalResearch)获得;人骨骼肌成肌细胞(hS匪;CO2580T25)从Cambrex获得。细胞培养的条件参照出版的或者供应商提供的操作规程。新霉素抗性的mS匪细胞是通过转染pEGFP-Nl质粒(Clontech)然后用800iig/mlG418筛选而得到。EGFP荧光在这个细胞群内有所不同,但是与细胞分选用的染料荧光相比,这种不同微不足道。嘌呤霉素抗性的hLF细胞是利用来自Addgene的pBabe-puro逆转录病毒载体(#1764)(MorgensternandLand,1990)获得的。将载体转染入ProPakA.6包装细胞(ATCC)。转染48小时后,过滤病毒上清,然后在存在8i!g/ml凝聚胺的情况下加入细胞中,24小时后用2iig/ml嘌呤霉素筛选细胞。在融合前一天,在细胞培养基中用30iiM的CMTMR或10yM的CMFDA细胞追踪染料(Invitrogen)37t:下标记细胞30分钟。随后,细胞在基础培养基中培养1个小时,用PBS洗两次。染色后,mS匪细胞培养在添加有2%马血清的DMEM的低血清培养基。按照文献(Davidsonetal.,1976)中描述的方法用聚乙二醇(MW1500)融合细胞。大致操作如下,将两群中的一群细胞接平铺在lOcm的组织培养皿中,然后将另外一群细胞覆盖在其上。细胞粘附后,用温PEG处理细胞1分钟,然后用温基础培养基清洗三次。分选前将融合的细胞在低血清培养基中培养2个小时。通过荧光激活细胞分选(FACS)具有双荧光的融合细胞,使其纯度>98%。FACS后,纯化的融合细胞用低血清培养基培养,直到RNA提取。在表达研究中,未融合的mS匪作为对照,在低血清培养基中培养和融合细胞相同的周期。对于实验中融合了抗生素抗性细胞的,在融合后一天将4-8iig/ml嘌呤霉素和400-800yg/mlG418加入到培养基中。在融合中用到的m0st细胞系,MC3T3-El亚克隆4是一个成骨前细胞系,如文献(FranceschiandIyer,1992)描述的那样,在无抗坏血酸的培养基中维持正常的增殖状态。在融合前,如文献(Xiaoetal.,1997)描述的那样,将细胞在抗坏血酸存在的情况下培养7天。微阵列分析按供应商的操作规程使用TRIZ0L试剂(Invitrogen)纯化hLF、mS匪和融合的细胞中总RNA,然后按照标准Affymetrix操作规程合成微阵列探针。使用oligo(dT)引物(Affymetrix)合成第一链,然后用该链和GeneChipOne-CyclecDNA试剂盒合成双链cDNA样品,再用该双链DNA和GeneChipIVT标记试剂盒(Affymetrix)合成生物素标记的cRNA。然后用GeneChipSampleCleanupModule(Affymetrix)将标记的cRNA样品切割成片段。杂交、标记和扫描都是由Stanford大学的蛋白和核酸机构(PAN)进行。将每类细胞标记的cRNA样品与鼠MGU74Av2和人HGU133A基因芯片(Affymetrix)进行杂交并重复实验,以确定基因表达和种间的交叉杂交。芯片扫描图的探针水平分析由Affymetrix芯片操作软件(GC0S)进行。在hLF-mOst融合细胞中进行类似的杂交过程。检测阈值p-值被设置为"存在"(p<0.05)、"边际"(0.05《p《0.49)或"缺失"(p>0.49),每一基因的决定响应值(decisioncalls)使用GC0S按MAS5.0标准分配。根据绝对决定响应值过滤基因清单得到封闭基因候选清单并使用GeneSpring(SiliconGenetics)进行分析。过滤的封闭基因根据以下标准在hLF与人芯片杂交中所有重复都"缺失"的响应、在融合细胞与人芯片杂交中所有重复都"缺失"的响应、在mS匪与鼠芯片杂交中重复的至少一个为"存在"或"边际"的响应、在融合细胞与鼠芯片杂交中重复的至少一个为"存在"或"边际"的响应。反式激活基因的过滤按1)使用GeneSpring按在hLF与人芯片杂交中所有重复都"缺失"的响应、在融合细胞与人芯片杂交中重复的至少一个为"存在"或"边际"的响应的标准,根据绝对决定响应值比较基因;2)使用RMAe邓ress(http:〃rmaexpress.bmbolstad.com)RMA标准化的信号强度为依据,选择两种细胞中表现出表达差异的基因;或者3)使用dChip(http:〃biosun1.harvard,edu/complab/dchip)基于模型表达指数分析比较来自两种细胞的数据。RT-PCR和测序使用M-MLV逆转录酶和随机引物(Invitrogen)逆转录RNA(2iig以上)、或者按供应商操作规程使用含有RT-PCR随机引物的SuperscriptIII第一链合成系统(Invitrogen)得到cDNA。使用不同模板浓度和PCR循环数进行半定量PCR以获得每个基因扩增的线性范围。对于人_黑猩猩融合实验,引物选择的依据是识别非多态性起始序列,这些起始序列分布在跨内含子的扩增子(amplicons)的两侧,根据基因序列分析表明两个物种之间的这些扩增子中至少含有一种单核苷酸取代。对于鼠-鼠融合实验,两个鼠品系之间的扩增子含有至少一种可通过随机测序跨内含子的扩增子附近序列确认的多态性。PCR引物的序列和RT-PCR具体的条件可以向发明人请求获得。所有的DNA序列分析使用ABIBigDyeTerminator(AppliedBiosystems)在ABI3730DNAAnalyzer上进行。DNA合成和细胞核融合的分析对于细胞核融合的分析,融合之前将未融合的细胞在加入了10M5-碘-2'-脱氧尿苷(IdU)或5-氯-2'-脱氧尿苷(CldU)的培养基中标记72小时,然后按照出版的操作规程(VegaandPeterson,2005)用鼠单克隆抗IdU抗体(Becton-Dickinson,#347580;1:500稀释)和大鼠单克隆抗CldU抗体(Accurate,#0BT0030;1:250)对融合细胞进行特异性染色。当IdU和CldU用于双染色时,两个抗体不会发生交叉反应,但是两者都能识别5-溴-2'-脱氧尿苷(BrdU)。二抗是OregonGreen标记的羊抗鼠(Invitrogen;1:1000)和Cy3标记的鼠抗大鼠(JacksonImmunoresearch;1:300)。对于DNA合成的分析,细胞融合72小时后立即加入10iiMBrdU,之后一个时间点用抗BrdU抗体(Accurate,#0BT0030;1:250)对细胞染色。由于将卤化核苷酸整合到DNA中可能影响基因的表达,因此将与卤化核苷酸标记相关的融合实验与确定基因表达状态的融合实验分开进行。染色质分析根据UCSC基因组浏览器(UCSCGenomeBrowser)(PlacentalMammalConservedElementsby28_wayMultizAlignment,Kuhnetal.,2007)确定的跨物禾中保守区域,挑选用于亚硫酸氢盐测序的目标基因组区域。按文献(VallenderandLahn,2006)中描述的亚硫酸氢盐诱变测序进行DNA甲基化分析。对大约20个克隆的兴趣区域进行了测序,并用软件BiQAnalyzer分析序列文件(Bocketal.,2005)。亚硫酸氢盐测序的引物可以向发明人请求获得。使用6组引物都未能扩增Ly75的TSS区域后,放弃对其分析。染色质免疫共沉淀(ChIP)基本上是按照以前描述的方法进行(Lietal.,2003),修改如下用带有0.5英寸平角头的FisherDismembratorModel500以33%的功率,超声处理7ml—份的试样9个循环,每次循环20s。这种程度的超声获得的DNA片段平均大小是300-700bp。为了对7乂106个细胞的进行免疫共沉淀,用40iU:1的蛋白A和蛋白G磁珠(Dynabeads)(Invitrogen)偶联10yg抗体,然后与超声过的染色质样品一起培养过19夜。免疫共沉淀的染色质用150ill洗脱液缓冲液(50mMTrispH8,10mMEDTA,1%SDS)从磁珠上洗脱下来,经蛋白酶K(Roche)消化后,使用GenCatchPCRCleanup试剂盒(EpochBiolabs)纯化DNA。每个扩增子用特定的模版浓度和PCR循环进行半定量PCR以获得线性范围的扩增。PCR产物通过琼脂糖凝胶电泳固定,并通过溴化乙锭染色而可见。使用GelAnalyzermoduleoflmagej1.37v(NationalInstitutesofHealth,http://rsb.info.nih.gov/ij)对清除背景后的PCR带图像进行光密度分析。将测量的PCR带强度标准化作为IP输入对照。每个数值点是至少三个独立重复数据的平均值。PCR引物的序列和具体的PCR条件可以向发明人请求获得。ChIP所用的抗体如下抗H3(abl791)、H3K9Ac(ab4441)、H3K4me3(ab8580)、H3K9me2(abl220)、H3K9me3(ab8898)、H3K27me3(ab6002)、H4K20mel(ab9051)、H4K20me3(ab9053)、H2A.X(abl1175)、macroH2A.1(ab37264)、H2A.Z(ab4174)、H2A.Bbd(ab4175)和HPl-gamma(ab50365)购自Abcam;抗CENP-a(sc-22787)购自SantaCruzBiotechnology;抗SUZ12(04-046)和HP1-alpha(05-689)购自Millipore;抗EZH2(36-6300)购自Invitrogen。在DNA甲基化的药物抑制实验中,细胞首先以20-25%的密度平板培养,并用10iiM的5-氮杂-2'脱氧胞嘧啶核苷(AdC)处理,直到细胞数量两次倍增。然后进行细胞融合,融合的细胞不带AdC再培养4天。对于组蛋白乙酰化的药物抑制实验,在融合前用1yM曲古霉素A处理细胞24小时。对于AdC和曲古霉素A共同处理,对照细胞无需融合,暴露于药物处理相同的时间。在生理改变下基因表达的分析0134]细胞要么在正常条件下(10%小牛血清,371:),要么在一个模拟生理变化的条件下包括低养分(0.1%血清),缺氧(380iiM的缺氧模拟物去铁胺)、低温(33tO、高温(41°C)和干扰素-Y处理(100ng/ml;CellSciences)培养。每种条件下培养细胞持三天,然后如本说明书所述用,RT-PCR分析挑选的基因。表一封闭的、反式激活的、消减的基因的表达形式重编程细胞中的表达形式应答细胞中的表达形式融合前融合后融合前融合后活跃的活跃的沉默的沉默的活跃的活跃的沉默的活跃的活跃的沉默的沉默的沉默的基因在应答细胞中封闭基因在应答细胞中反式激活,因此是能动的基因在重编程细胞中消减表2.在hLF-mS匪融合细胞中识别的封闭和反式激活的hLF基因基因代号基因名称别名基因功能Myodl(封闭的)Myogenicdifferentiation肌tigenlMyod,Myf3碱性螺旋_环_螺旋转录因子,在肌肉谱系特化中起关键作用,被认为参与了正向自调节。Myf5(封闭的)Myogenicfactor5碱性螺旋_环_螺旋转录因子,在肌肉谱系特化中起关键作用,被认为受Myodl的正向调节。Chrnd(封闭的)胆碱能受体,烟碱的deltasub皿itAchrd烟酰胺乙酰胆碱受体的亚基,存在于神经肌肉接头的突触中。Cacngl(封闭的)牵丐离子通道电压依赖gamma-1亚基骨骼肌内控制钙离子内流的钙通道的亚基。R即sn(封闭的)突触受体辅助蛋白,43kDR即syn外周膜蛋白,在树突中与神经递质受体的局部化和聚集有关。Myom2(封闭的)Myomesin2只在骨骼肌中发现的细胞骨架结构组分。Tnni2(封闭的)Troponinl肌动蛋白沟,与骨骼肌内的快肌收縮相关Ncaml(封闭的)神经细胞附着分子iCD56;Msk39细胞膜糖蛋白,可能与脑和肌发育中的细胞细胞粘附和迁移相关。CN101743328A眾s步19/2S<table>tableseeoriginaldocumentpage22</column></row><table><table>tableseeoriginaldocumentpage23</column></row><table><table>tableseeoriginaldocumentpage24</column></row><table><table>tableseeoriginaldocumentpage25</column></row><table>〔0139〕〔0140〕〔S41U謝3:chIPIPCR4等忍皿都^図<table>tableseeoriginaldocumentpage26</column></row><table>Int:基因内增强子;Up:紧接TSS的上游;TSS#:多个可选择TSS中的一水权利要求通过反式互补识别顺式沉默(封闭)基因的方法,方法包括(a)选择第一类和第二类细胞,此处细胞遗传上不相近似;(b)融合第一类和第二类细胞产生一个或多个的融合细胞,此处细胞被不同地标记;(c)对融合细胞中表达的多个基因进行基因表达分析;并(d)通过比较融合前后基因的表达识别第一类细胞中的顺式沉默(封闭)基因,顺式沉默基因是第二类细胞基因组中融合前后均表达,但第一类细胞基因组中融合前后均不表达的基因。2.根据权利要求1所述的方法,所述第一类细胞称为应答细胞,第二类细胞称为重编程细胞。3.根据权利要求1所述的方法,所述第一类细胞是癌细胞。4.根据权利要求2所述的方法,所述重编程细胞无细胞核。5.根据权利要求1所述的方法,所述细胞属于不同类型的组织。6.根据权利要求1所述的方法,所述细胞属于不同的物种。7.根据权利要求1所述的方法,所述异种细胞是来自C3H鼠的mS匪和来自BG鼠的mDF。8.确定与反式机制相比,顺式机制对调节编码基因有关贡献的方法,方法包括(a)在体外融合至少两类不同的细胞;(b))比较来自不同细胞基因组的目标基因在未融合和融合细胞中的表达水平,相关贡献与目标基因对被引入融合细胞的共享环境中的反式信号的相关响应性有关。9.一个细胞的封闭基因组包括所有顺式沉默的基因,这些顺式沉默的基因不能被来自不同细胞的适当的反式激活因子所激活。10.在目标基因组中,确定与反式机制相比,顺式机制对调节编码基因有关贡献的方法,方法包括(a)在体外融合至少两类不同的细胞;(b)搜索在融合细胞和未融合细胞基因组之间表达不同的目标基因,引入并共享融合细胞的顺式封闭基因不能应答反式信号;并(c)比较顺式基因和反式基因。11.识别封闭基因的方法,包括(a)融合不同种类的细胞,其中一类细胞作为应答细胞,另一类细胞作为重编程细胞;(b)用与重编程细胞不同的标记标记应答细胞;(C)通过双标记的存在确定融合细胞;(d)检测融合细胞以确定表达形式;并(e)识别在应答细胞基因组中沉默但在重编程细胞基因组中激活的基因。12.根据权利要求11所述的方法,所述物种是鼠和人。13.根据权利要求11所述的方法,所述应答细胞是人肺成纤维细胞,重编程细胞是鼠骨骼肌成肌细胞。14.根据权利要求11所述的方法,所述表达形式由微阵列分析确定。15.根据权利要求11所述的方法,所述表达形式由RT-PCR确定全文摘要本发明公开了通过融合不同的细胞(例如应答细胞和重编程细胞)来识别顺式沉默(封闭)基因的方法。通过反式互补机制以及融合细胞和未融合细胞中反映出的差异表达,在应答细胞中识别出双等位顺式沉默的基因。利用反式互补实验系统识别和区分的封闭基因在研究健康和疾病包括癌症的治疗中有广泛的应用。文档编号C12Q1/68GK101743328SQ200980000531公开日2010年6月16日申请日期2009年4月2日优先权日2008年6月6日发明者蓝田申请人:赛业(广州)生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1