早期肝细胞的产生及其用途的制作方法

文档序号:586177阅读:544来源:国知局
专利名称:早期肝细胞的产生及其用途的制作方法
技术领域
本发明涉及胚胎干细胞肝向分化。具体而言,本发明涉及非人哺乳动物胚胎干细胞定向分化为肝细胞的系统、技术,以及由此所获得的分化细胞的用途。
背景技术
GATA4和R)xa2是定型内胚层发育和肝脏发生相关的核心转录因子。Foxa2和 GATA4可能作为先锋因子,以一种预先结合基因的promoter/enhancer并改变其染色质结构的方式,在定型内胚层(DE)细胞中调控Alb等肝脏发育相关基因的表达,并且可能存在一种广泛的共同调控的作用方式。因此,在DE细胞中寻找GATA4和R)xa2在全基因组的下游基因以及GATA4和R)xa2共同的下游基因,不仅能更好地阐明这一问题,而且能发掘更多的DE和肝脏发育相关的重要基因。但是,寻找两者在早期胚胎发育中的下游基因这一方案目前存在两大技术障碍第一、要从胚胎组织中分离到数量足够做免疫共沉淀(Chromatin Immunoprecipitation, ChIP)的DE细胞十分困难;第二、要得到特定胚胎发育阶段的高纯度和同步的细胞群体有相当难度。在全基因组水平定位蛋白和DNA的相互作用对于理解转录调控非常必要。转录因子结合位点的精确定位对于解读多种生物学过程背后的转录调控网络大有裨益。染色质免疫共沉淀结合测序 Chromatin immunoprecipitationfollowed by sequencing (ChlP-seq) 是近年来兴起的研究全基因组水平的DNA和转录因子等蛋白相互作用的一种新技术。最先使用ChlP-seq的研究工作发表在2007年。不同于之前的基于芯片杂交的ChIP_chip技术,ChlP-seq技术中对目的DNA片段直接测序,因此,具有更高的分辨率,更低的背景噪音, 更大的基因组覆盖率。目前,ChlP-seq正发展成一种研究转录调控必不可少的工具。针对以上技术障碍,本发明人利用ESC体外诱导分化产生的DE细胞作为模型来寻找GATA4和R)xa2在全基因组的下游基因以及GATA4和R)xa2在全基因组的共同下游基因。 这些基因信息已经整理为两个基因文库和相关的生物信息学数据文库。

发明内容
本申请提供一种基因芯片,该芯片包含至少一条表1、表2或表3所示的核苷酸序列。在一个具体实施方式
中,所述芯片含有表1、表2或表3所列核苷酸序列中的至少 100条核苷酸序列。在一个具体实施方式
中,所述芯片含有表1、表2或表3所列核苷酸序列中的至少 1000条核苷酸序列。在一个具体实施方式
中,所述芯片含有表3所列核苷酸序列中的至少1200条核苷酸序列。在一个具体实施方式
中,所述芯片含有表3所列核苷酸序列中的至少1600条核苷酸序列。
本申请提供一种检测基因表达水平的方法,该方法包括使生物学样品与本申请的基因芯片接触,以及检测感兴趣基因的表达。本申请提供一种鉴定培养的多能干细胞是否发生了肝向分化的方法,该方法包括将所述培养的多能干细胞与本申请的基因芯片接触,以及检测感兴趣基因的表达,其中,如果在该基因芯片上获得阳性结果,表明该多能干细胞发生了肝向分化。本申请提供一种筛选发生了肝向分化的多能干细胞的方法,所述方法包括将所述多能干细胞与本申请的基因芯片接触,以及检测感兴趣基因的表达,其中,如果在该基因芯片上获得阳性结果,表明该多能干细胞为肝向分化的多能干细胞。在一个具体实施方式
中,所述多能干细胞为哺乳动物多能干细胞。在一个具体实施方式
中,所述哺乳动物多能干细胞为非人哺乳动物多能干细胞。本申请也涉及Tcf 12 (Genbank ID :21406)在控制多能干细胞肝向分化中的应用。


图1中,(A)显示ES细胞肝向诱导分化的模式图,包括两个阶段由小鼠ES细胞分化为定型内胚层细胞;由定型内胚层细胞继续分化到早期肝细胞;(B)显示诱导第5天 (Day 5)细胞的典型形态(Scale bar,100 μ m) ; (C)显示 FACS 分析Day 5 细胞中 CXCR4+ECD+ 或CXCR4+c-kit+DE细胞的比例以及c-kit和胞内Foxa2共表达情况;(D)显示定量PCR分析从Day 0到Day 5细胞中谱系相关基因表达的动态变化(Mean士 SEM ;η = 3) ; (E)显示第 5天FACS分析的ESC和两个细胞群(CXCR4+E⑶+,CXCR4+EOT_)中DE细胞相关基因的表达情况,如转录物的QPCR分析所示(数据显示为Mean士SEM ;η = 3) ; (F)显示第5天FACS分析的ESC和三个细胞群(CXCR4+ECD+,CXCR4+EOT and CXCIT4ECD+)中DE细胞相关基因的表达情况,如转录子的QPCR分析所示(数据显示为Mean士SEM ;η = 3) ; (D)、(E)和(F)中,ESC 中的转录物水平归一化到1。图2显示DE细胞被诱导分化为早期肝细胞。(A)显示第7天对分化的细胞进行 Afp免疫染色的图像(下图),上图同一视野的相差图(Scale bar, 100 μ m) ; (B)显示第5和 7天的分化细胞中转录物的QPCR分析早期肝细胞标记物的表达(数据显示为Mean士SEM ; η = 3),第5天的转录物水平归一化为1 ; (C)显示第7天的分化细胞中胞内Afp和胞外的EpCAM的FACS分析,图中显示了 Afp+或EpCAM+细胞的百分比;⑶显示第5天的细胞经MACS分选为两种细胞(c-kit+细胞或c-kit_细胞)分化至第7天时的细胞形态学;(E) 分别显示4种细胞类型(第5天c-kit_细胞(D5c_)、第5天的c-kit+细胞(D5c+)、由第5 天的c_kit_细胞分化至第7天细胞(D7c_)和由第5天的c-kit+细胞分化至第7天细胞 (D7c+))中Afp和Ttr转录物的QPCR分析。D5c_细胞中的转录物水平归一化为1 (数据显示为 Mean士 SEM ;η = 3)。图3显示使用ChIP-Seq对第5天的DE细胞进行分析所得的R)xa2和GATA4结合位点的全基因组图谱。图中显示了相对于RefSeq基因的R)xa2 (A)和GATA(B)结合位点的分布,以及各位置的结合位点的百分比。图4显示了基序分析,显示了 R)xa(A)或GATA(B)结合位点内排在前三位的基序。图5显示R)xa2和GATA4结合的基因和他们的重叠部分。图中,Venn图显示R)xa2 和GATA结合的基因的重叠部分,包含了位于TSS的士31Λ内的结合峰。括号内的数值是Foxa2或GATA4结合的全部基因总和。图6显示了 R)xa2结合㈧、GATA4结合⑶以及两者都结合(C)的基因的GO分析。标尺代表排在前8位的GO分类的富集显著性P值。图7显示分化自Gata4_KD (A)、Foxa2_KD (B)或对照ESCs的分化至第5天的细胞中随机选择的10个靶基因的转录物水平的QPCR分析。分化自对照ESC的第5天细胞的转录物水平归一化为1 (数据显示为Mean士 SEM ;η = 3) *Ρ < 0. 05 ;< 0. 01。图8显示了对DE发育重要的R)xa2和GATA4共结合基因。UCSC基因组浏览器中分另Ij以紫色和绿色痕迹显示Foxa2和GATA4 ChiP-Seq数据集中Eomes (A)、Hhex(B)、 Sox 17 (C), Gsc (D), Gata4 (E), Foxa2 (F)基因座的wig形式测序读数。各图底部显示了 RefSeq基因的痕迹。Foxa2和GATA4ChiP_Seq数据集之间的重叠峰分别由红色盒表示。图9显示肝脏发育中Foxa2和GATA4共同结合的基因。UCSC基因组浏览器中分别以紫色和绿色痕迹显示!^0X32和GATA4ChiP-Seq数据集中Afp (A)、Ttr (B)、Timd2 (C) 和HdxI(D)基因座的wig形式测序读数。各图底部显示了 RefSeq基因的痕迹。Foxa2和 GATA4ChiP_Seq数据集之间的重叠峰分别由红色盒表示。图10显示R)xa2/GATA4基序两者中共同存在的峰以及ChiP-Seq数据中的非规范基序。其中,图(A)显示排在前3位的R)xa2或GATA4ChiP_Seq峰内的非R)xa2或非GATA-2 基序。图(B)和(C)显示Verm图谱,显示含前10个R)xa2(B)或GATA4(C)基序的峰与含前三个非R)xa2(B)或非GATA4(C)基序的峰的重叠。括号中的数值是含有各基序的峰的数量。图11显示Tcf 12而非Tcf3结合具有非典型的基序的选择位点。在第5天的细胞中使用抗Γ^οχε 、GATA4、Tcf3、Tcfl2的抗体进行ChIP试验,用IgG作为对照。采用QPCR 分析各因子对选自图9B所示的R)xa2ChIP-Seq重叠峰(A)或图9C所示的GATA4ChIP_Seq 重叠峰(B)中的位点的相对结合水平,并将其归一化至输入DNA(数据显示为Mean士SEM ;η =3)图12显示第5天的DE细胞中1Tcf 12于R)xa2和GATA4共结合所选择的位点。显示了对第5天细胞中三中不同的顺序(Foxa2-GATA4,Foxa2-Tcfl2和iTcf 12-GATA4)中的选定位点进行^q-ChIP试验的PCR结果,其中显示了扩增自inputDNA、第1次ChIP DNA和各 Seq-ChIP DNA 的产物,引物靶向位点 Traf3ipl, Mrpl 15 和 Sgpp2 (图 11)。
具体实施例方式本发明利用ChIP-Seq技术,在ESCs体外分化得到的DE细胞中定位了 GATA4和 R)xa2在全基因组范围的靶基因。分别得到6053个GATA4的靶基因(表2,表中的登陆号为各基因在Genbank中的ID)和3120个R)xa2的靶基因(表1,表中的登陆号为各基因在 Genbank中的ID)。有1721个基因(表3,表中的登陆号为各基因在Genbank中的ID)同时出现在两组靶基因列表中,统计学分析显示为极显著的重合,这说明GATA4和R)xa2在全基因组范围共有相当多的靶基因。对靶基因进行Gene Ontology(GO)分析,将得到的所有GO分类按照出现频率进行排序,GO分类中排在前8位的结果如下FoXa2靶基因的前8个GO中有4个是和发育或形态发生过程相关的,GATA4靶基因的GO中前6个都是和发育或形态发生过程相关的,而
5GATA4和R)xa2共有的靶基因的前8个GO全都是和发育或形态发生过程相关的。这说明在分化得到的DE细胞中,无论是GATA4还是R)xa2都主要调控发育相关的基因。而且,那些可能被GATA4和R)xa2共同调控的基因也绝大部分都是和发育过程相关的。通过GATA4或 Foxa2的Knockdown实验验证了 GATA4和R)xa2对靶基因的转录调控功能。选取一些DE发育和肝脏发生相关的关键基因,并在ChIP-Seq数据中查看了 GATA4 和R)xa2在其调控区上的峰分布(包含结合位置和结合强度的信息),结果发现在这些基因的调控区都存在毗邻的或重合的GATA4和R)xa2的peaks,说明两者在这些共有的靶基因上有紧邻的或共同的结合位点。在这些基因中,包括DE发育相关的关键基因,如Eomes, Hhex, Soxl7, Gsc, GATA4,Foxa20此外,还包括对于DE的肝向分化必需却还未在DE表达的基因,如 Afp,Ttr、Timd2。本发明首次揭示了肝向分化过程中转录因子R)xa2和GATA4在全基因组范围内的转录调控,这将为胚胎发育中的肝脏发生和ESC肝向分化两方面的研究提供非常有用的信息。例如,利用GATA4和Foxa2分别结合的基因信息以及两者共有的靶基因信息,用于制作基因芯片,利用基因芯片可高敏感地定量、定性检测基因表达水平研究,这将为研究肝脏发生和干细胞的肝向分化过程的基因表达分析带来极高的应用价值。因此,本申请提供一种基因芯片,所述基因芯片上包含有本发明表1、2或3所揭示的至少一条基因序列。该芯片可用于定量、定性检测基因表达水平,研究肝脏发生和肝多潜能干细胞的肝向分化过程中的基因表达情况。该基因芯片所列出的基因,大部分将在肝脏发生和多潜能干细胞的肝向分化过程中表达。通过检测待检测的样本,如果在该基因芯片上获得阳性结果,则表明多能干细胞发生了肝向分化。本申请提供一种检测基因表达水平的方法,该方法包括使生物学样品与本申请的基因芯片接触,以及检测感兴趣基因的表达。该生物学样品可来自,例如哺乳动物(如人、 小鼠等)的干细胞,例如来自分化过程中的干细胞。本申请不涉及人胚胎干细胞。本申请也包括所述基因芯片在定量、定性检测基因表达水平中的用途,以及在研究肝脏发生和肝细胞的肝向分化过程中的基因表达情况中的用途。可采用本领域周知的技术制备本发明的基因芯片。本申请的基因芯片上可含有至少一条表1、表2或表3所列出的核苷酸序列。在一个实施方式中,本申请的基因芯片上含有表1所列核苷酸序列中的至少8、9、 10、11、12、13、14、15或更多到3120条(以及这些范围内的任意整数)核苷酸序列。在一个实施方式中,本申请的基因芯片上含有表1所列核苷酸序列中的至少8、9、 10、11、12、13、14、15或更多到6053条(以及这些范围内的任意整数)核苷酸序列。在一个实施方式中,本申请的基因芯片上含有表1所列核苷酸序列中的至少8、9、 10、11、12、13、14、15或更多到1721条(以及这些范围内的任意整数)核苷酸序列。在一个具体实施方式
中,芯片上含有至少1500条、至少1800条、至少2000条、至少MOO条、至少观00条、至少四00条、至少四50条、至少3000条表1所列出的核苷酸序列。在另一个具体实施例中,芯片上含有表1所列出的全部3120条核苷酸序列。在一个具体实施方式
中,在另一个芯片上含有至少1500条、至少1800条、至少 2000条、至少MOO条、至少洲00条、至少3000条、至少4000条、至少5000条、至少5500 条、至少5800条、至少6000条表2所列出的核苷酸序列。在另一个具体实施例中,芯片上含有表2所列出的全部6053条核苷酸序列。在一个具体实施方式
中,在另一个芯片上含有至少500条、600、700、800、900、 1000、1100、1200、1300、1400、1500、1600、1650、1680、1700 条表 3 所列出的核苷酸序列。在
另一个具体实施例中,芯片上含有表3所列出的全部1721条核苷酸序列。应当理解,对于基因芯片上存在的表1、2或3中的任意一条核苷酸序列而言,该核苷酸序列可存在于芯片上的多个位点。例如,对于Afp基因,其在芯片上的多个位点中存在。应理解,虽然上文列出的一些具体的数值和范围,但是本申请的芯片可含有1 3120中任意整数数量的表1的核苷酸序列,1 6053中任意整数数量的表2的核苷酸序列, 或者1 1720中任意整数数量的表3的核苷酸序列。可采用本领域周知的技术对芯片上的核苷酸序列进行标记。本申请的芯片可用于各种分化的(例如分化中的)多能干细胞的检测。这些多能干细胞可来自各种哺乳动物,包括人、小鼠等。本申请的多能干细胞不包括人的胚胎干细胞。本申请的检测、鉴定、筛选方法中所使用到的试剂是本领域常用的试剂。在获得本申请的芯片之后,本领域技术人员可采用本领域的常规技术实施所述检测、鉴定或筛选。本申请也涉及Tcfl2在控制多能干细胞肝向分化中的应用。例如,通过调控Tcfl2 的表达,可调节多能干细胞的肝向分化。以下将以具体实施方式
的形式描述本申请。除非另有说明,所列出的试剂等都是市售可得的试剂。实验方法和材料1.1.1 细胞小鼠胚胎干细胞系E14. 1由中国科学院上海生物化学与细胞生物学研究所干细胞技术平台提供。Ell. 5天的小鼠胎肝细胞取自ICR品系。1.1.2培养基和生长因子Neurobasal 培养基,DMEM/F12 培养基,N2,B27, BSA solution 购自 hvitrogen 公司。MTG 购自 Sigma 公司。Gelatin 和 Enzyme-Free Solution 购自 Millipore 公司, collagen IV 购自 BD 公司。生长因子activin A、BMP4、bFGF购于R&D公司。生长因子LIF购于Millipore公司。1.1.3 抗体FACS实验的CXCR4、c_kit的抗体,同亚型对照IgG购于R&D公司。ChIP实验的 Foxa2、GATA4、iTcf 12、Tcf3 的抗体和对照 IgG 购于 Santa Cruz 公司。1.1.4 质粒pSIREN-RetroQ(Clontech)。1.1. 5试剂和试剂盒质粒提取用的Maxi-pi^pkit,总 RNA抽提用的 RNeasy kit,QPCR用的 QuantiiTect SYBR Green PCR Mastermix购自 Qiagen 公司。ChIP 实验用的Protein A magnetic beads,ProtenaseK和DTT购自hvitrogen公司,RNaseA购自Qiagen公司。其余试剂如无特别说明均购自Sigma公司。1. 2胚胎干细胞的培养和分化本文使用的是小鼠ES细胞系E14.1。诱导分化之前,用无酶溶液消化,传入1 1 混合的 Neurobasal 和 DMEM/F12 培养基(含有 Ν2(0· 5χ),Β27(0· 5χ),0· 05% BSA solution, 0. 15mM MTG, 10ng/ml ΒΜΡ4,1000U/ml LIF),铺在凝胶包被过的培养皿上。每天换液,如此传2-3代后,消化ESCs用上述培养基(撤去BMP4和LIF,另添加30ng/ml activin Α)重悬,并铺在小鼠胶原IV包被过的培养皿上培养5天,培养基隔天换液。做肝向分化时,分化到Day 5的细胞在相同培养基(另添加30ng/ml BMP4和lOng/ml bFGF)中继续培养2天。1. 3shRNA载体构建,逆转录病毒颗粒的包装及ESCs的感染shRNA oligos采用hvitrogen官方网站提供的BLOCK-iT在线软件设计 (https//rnaidesiRner. invitroRen. com/rnaiexpress/)。每对 oligos 退火后连接至Ij予页先酶切过的逆转录病毒的RNAi载体pSIREN-RetroQ(Clontech)。测序确定装入后,shRNA 质粒和helper质粒共转HEK 293细胞以包装逆转录病毒颗粒。Foxa2 的 shRNA 序列
Oligo 1SEQ ID NO:92: GATCCggagacLLLgggagagcLLLgTTCAAGAGACAMGCTCTCCCAAAGTCTCCTTTTTTGCTAGCGOligo 2SEQ ID N0:1 AATTCGCTAGCAAAAAAggagactttgggagagctttgTCTCTTGAACAAAGCTCTCCCAAAGTCTCCG
GATA4 的 shRNA 序列
Oligo 1SEQ ID N0:2 GATCCggttgtgtctacagcacaataTTCAAGAGATATTGTGCTGTAGACACAACCTTTTTTGCTAGCGOligo 2SEQ ID NO:3 AATTCGCTAGCAAAAAAggttgtgtctacagcacaataTCTCTTGAATATTGTGCTGTAGACACAACCG感染ESCs时,将ESCs和收到的经过滤的病毒上清孵育,并在30°C离心1. 5小时。 然后撤去病毒上清,换成新鲜的ESC培养基。M小时后加入Puromycin以筛选成功感染的细胞。1.4流式细胞分析消化细胞,预冷的PBS (0. 5 % BSA)洗2_3次,然后用抗小鼠CXCR4,抗小鼠c_kit 或相应的同亚型对照IgG作染色。1. 5总RNA的抽提,逆转录和实时定量PCR(QPCR)总RNA用RNeasy kit抽提并用随机引物逆转录成cDNA。QPCR仪器 Mx3000Pcycler (Stratagene),试剂QuantiTect SYBR Green PCR Mastermix0程序如下1)94°C,15 分钟2)扩增94°C,30 秒;60°C,30 秒;72°C,30 秒;循环 40 次
3)做溶解曲线以确定产物特异性。数据用MxftOsoftware(Mratagene)进行分析。基因表达水平都归-的水平。QPCR的引物序列如下Q_Foxa2_FCAGCGGCCAGCGAGTTAAAGTATG(SEQ ID NO 4)Q_Foxa2_RCGTTCATGTTGCTCACGGAAGAGT(SEQ ID NO 5)Q_Gata4_FGGGCCAACCCTGGAAGACA(SEQ ID NO 6)Q_Gata4_RCACAGGTAGTGTCCCGTCCCATC(SEQ ID NO 7)Q_Afp_FCGAGGAGAAATGGTCCGGCTGT(SEQ ID NO 8)Q_Afp_RCCAGAGTTCACAGGGCTTGCTTC(SEQ I D NO :9)Q_Ttr_FTCGTACTGGAAGACACTTGGCATTT(SEQ ID NO :10)Q_Ttr_RCTGCGATGGTGTAGTGGCGATG(SEQ ID NO 11)Q-Pdpn-FGTCCACCTCAGCAACCTCAGACC(SEQ ID NO 12)Q-Pdpn-RCAAGACGCCAACTATGATTCCAACC(SEQ ID NO 13)Q-Notum-FGGCAGTCGGCGGTGGTTACTCT(SEQ ID NO :14)Q-Notum-RCCAGTACCTGTGCGTGTGTGTGG(SEQ ID NO 15)Q-Apoe-FCGAGTGGCAAAGCAACCAACC(SEQ ID NO 16)Q-Apoe-RCTTCCGTCATAGTGTCCTCCATCAG(SEQ ID NO 17)Q-Bcllla-FCGCCGCAAGCAAGGCAAA(SEQ ID NO 18)Q-Bcllla-RGCCCACAGGTGAGAAGGTCGTG (SEQ ID NO 19)Q-TbcId2b-FATCCGCCCACACACTTCCAG(SEQ ID NO :20)Q-TbcId2b-RAGTCCTGCTGTCCCACTTCATCA(SEQ ID NO :21)Q-Ric8-FGGACCGCACAGAGGAGTTCCA(SEQ ID NO 22)Q-Ric8-RAGGGCCAGAAGCACATCCAAACA(SEQ ID NO 23)Q-Fermt2-FGGGTGATGCTGAAGTTGGTGGAA(SEQ ID NO 24)Q-Fermt2-RGCAGGCGGAGCAGTTTGTG(SEQ ID NO 25)
Q-Nek2-FACGTTTGTTGGCACACCCTATTACA(SEQ ID NO 26)Q-Nek2-RGCGCCTGAACCTCCCTTCC(SEQ ID NO 27)Q-Zscan12-FGGTGGTGACTGTGCTGGAGGATTT(SEQ ID NO :28)Q-Zscanl2-RCACGCTGGGTTTCTGCTCTGTTG(SEQ ID NO :29)Q-Kdm2a-FGGCATCCCTGGAGTGGTTTCTTT (SEQ ID NO :30)Q-Kdm2a-RATTTGTTGGTTTGGAGCTTCTCTTCC(SEQ ID NO 31)Q-Nrp2-FCCGCCCACCATCATCTCCTC(SEQ ID NO 32)Q-Nrp2-RTGGATACTTCTCTGGAAACCCTGGA(SEQ ID NO 33)Q-Epha2-FAGCTCCGGGCAGTCGGTTTC(SEQ ID NO 34)Q-Epha2-RGTTCTGCATCAGGTCCCACCCTTT(SEQ ID NO :35)Q-Add3-FGATGGAGCAGAGGAAGCGAGTCA(SEQ ID NO 36)Q-Add3-RCGAGGAGAAGCCCGAGAAGGAG(SEQ ID NO 37)Q-Mllt4-FGTTTGTTGCGTATGATGAGGAGGAG(SEQ ID NO 38)
“化到Gapdh
Q-Mllt4-R TGCCAGGTAAGTCTGCGTCTTGG(SEQ ID NO 39)Q-Mrp137-F GACCAGCTCCTTTACCGGCACTT(SEQ ID NO :40)Q-Mrp137-R AGTAGGGCACCAGGCTCCAGAAA(SEQ ID NO 41)Q-Cask-F TGCTCAGTGGCTGTTTGCCTTT(SEQ ID NO 42)Q-Cask-R CATGCGGCGTACTAGGTCTTTGG(SEQ ID NO 43)Q-Bai2-F CGAGGGCACAGGAGAGGAGGT(SEQ ID NO :44)Q-Bai2-R AGCAGAACCCGAGGCATTAGGG(SEQ ID NO 45)Q-Fadsl-F AACCCAGCTTTGAACCCACCAAG(SEQ ID NO 46)Q-Fadsl-R AGAGGATGAAGGGCACCAAGGAA(SEQ ID NO 47)Q-Dazapl-F CGACGAAATCGGGAAGCTCTTTG(SEQ ID NO 48)Q-Dazapl-R TGACACAATCCACAACCTCACCATAC(SEQ ID NO 49)1. 6染色质免疫共沉淀(ChIP)用分化到Day 5的細胞做ChIP吋,将约IO7个细胞在甲醛溶液中室温交联10 分钟。加入Glycine至终浓度为0.125M以终止交联。細胞用预冷的PBS清洗几次,在裂解 缓冲液中重悬并裂解,将细胞浸在冰水浴中通过超声将DNA打碎成200bp到500bp的短片 段。超声仪器=Misonix 4000Sonicatoro保留1/30的超声后全細胞裂解液用来抽提input DNA。剰余裂解液与预先和2. 5 ii g抗体或IgG孵育过的25 ill蛋白A磁珠悬液在4°C孵育 过夜。ChIP 抗体禾ロ IgG :anti-mFoxa2, anti_mGATA4,anti-mTcf3, anti_mTcfl2,正常山羊 /兔IgG。过夜后的珠先用RIPA溶液再用TE-NaCl溶液洗。然后加入洗脱液,并在65°C放 置15分钟。将洗脱的IP产物和预留的全細胞裂解液在65°C过夜解交联。用RNase A,蛋白 酶K和苯酚氯仿异戊醇先后纯化和抽提DNA。最后用乙醇沉淀法,并重悬于100 u 1 IOmM Tris-HCl。用胎肝細胞做ChIP实验时,在冰上分离并累积30-40个Ell. 5的小鼠胎肝组织。 收集到的组织在含甲醛的PBS中冰上勻浆并室温交联10分钟。之后步骤同上述細胞 ChIP。ChIP的PCR引物序列如下ChIP_Afp_F6. 2_-2. 2 gggctcaggaagtgacaaacagaa(SEQ ID NO 50)ChIP_Afp_R6. 2__2. 2 gccctctccgttatctgccaca(SEQ ID NO :51)ChIP_Foxa2_F3_-0. 1 aatgctttgggcaccttggattt(SEQ ID NO :52)ChIP_Foxa2_R3_-0. 1 cggcctggagagacccgtttag(SEQ ID NO :53)ChIP_Afp_F8_-5. 7tcctcacaagatgccagattcca(SEQ ID NO :54)ChIP_Afp_R8_-5. 7gactttatgccctcaaatgaatgacg(SEQ ID NO :55)ChIP_Foxa2_F5_+6. 3 GGCCCTTCTGGTGTCTTCCTCAC(SEQ ID NO 56)ChIP_Foxa2_R5_+6. 3 GCCGCTGCACCCAGCAAT (SEQ ID NO :57)ChIP_Gata4_Fl. 2_+5. 5 ATGGAGGTGCAGTTTGGATGGA(SEQ ID NO 58)ChIP_Gata4_Rl. 2_+5. 5 CCAGGGAGTGGCAAGGGATAGA(SEQ ID NO 59)ChIP_Eomes_Fl_+9 GGCATTCCTAAGATGGAGTGTCAG(SEQ ID NO 60)ChIP_Eomes_Rl_+9GCCGGGTTCCCAGACCTT (SEQ ID NO :61)ChIP_Hhex_F2. 2_+2. 9 TCCATTATGCCAGGGCTTCACAC (SEQ ID NO 62)ChIP_Hhex_R2. 2_+2. 9 TTACCCTTGAGTCCTGCCTGGTT(SEQ ID NO :63)
ChIP_Ttr_F2. 2_-16. 2 GTGAGATAACCGCCCCTCTTCC(SEQ ID NO 64)ChIP_Ttr_R2. 2_-16. 2 TCTGGAGCCATGTCAGCCACT(SEQ ID NO :65)ChIP_Timd2_Fl. 2_+22. 6 GGTGTCCATTAGCAAGCCAGCA(SEQ ID NO :66)ChIP_Timd2_Rl. 2_+22. 6 GGTGGATGGGAAAGTGCAAGG(SEQ ID NO :67)ChIP_Soxl7_FlTGCCAGCTAATTGTGTTTGTCTGTG(SEQ ID NO 68)ChIP_Soxl7_RlGCAGATATGAAGGACGGGAGATTG(SEQ ID NO 69)ChIP_Pbxl_FlAACCAAACCCAAAGGCACATTCA (SEQ ID NO 70)ChIP_Pbxl_RlCAGGAGCGACTCTGGAGCTGTGT(SEQ ID NO :71)ChIP_Spagl6_FCTTCCTCTGGCCTCTTGGCAGGT(SEQ ID NO :72)ChIP_Spagl6_RCCATTTATCTGTGCTGTTTGCATTTGT(SEQ ID NO :73)ChIP_Epha4_FAGCTCTGGCTGGCTGGGAAGTT(SEQ ID NO :74)ChIP_Epha4_RCCATCACTGTATCCTGCTGGCTTG(SEQ ID NO 75)ChIP_Traf3ipl_FGGTGTGTTTTAGCTCCACGGAAGA(SEQ ID NO 76)ChIP_Traf3ipl_RTGCAGAGACGTTGAAATCCGAAA(SEQ ID NO 77)ChIP_Adiporl_FGCTGATGGATTGCTTTCAACACC(SEQ ID NO 78)ChIP_Adiporl_RAGACTGCTTGCCACACACCACTT(SEQ ID NO :79)ChIP_Pfdn2_FACGAGACCAAACAAGGCGGTAAA(SEQ ID NO 80)ChIP_Pfdn2_RGGGCTCAAGGAAGTAGACTCAGATGG(SEQ ID NO 81)ChIP_Mrpll5_F GCCTGGGCTTCCATTAACTGTCTC (SEQ ID NO 82)ChIP_Mrpll5_R GGGGCATTCTTAACCTGCTTCC(SEQ ID NO 83)ChIP_Boll_F ACCACAGCAGGGAGGGAGGAGA(SEQ ID NO 84)ChIP_Boll_R GCGCTGCACACCTTGGCTCTATC(SEQ ID NO 85)ChIP_Sgpp2_F AGCCTGGGGATTTGTCCTGCT(SEQ ID NO 86)ChIP_Sgpp2_R TCCACACAGGGATGCTTTCTCTCC(SEQ ID NO 87)ChIP_Dis312_F CCAGATCCTTTACCTCCTGTGTGATG(SEQ ID NO 88)ChIP_Dis312_R AAGAGTGCAGCGACCAAACCAAA(SEQ ID NO 89)ChIP_Gbx2_F GCACAGCAGGCATTGTTTGTAGGA(SEQ ID NO 90)ChIP_Gbx2_R CCGCAGGAGAGCTGCCAAGATAG(SEQ ID NO 91)1. 7Sequential ChIP(Seq-ChIP)此实验分两步ChIP,第一歩ChIP同上,只是洗脱时用60iU IOmM DTT溶液,并在 37°C放置30分钟。50 u 1洗脱产物用裂解缓冲液稀释到1ml,用作第二步ChIP的起始样品, 第二步ChIP的抗体和珠准备同普通ChIP—致,洗脱时用普通ChIP的洗脱液。后续DNA纯 化和抽提同普通ChIP。1.8大规模平行测序(Massively Parallel Sequencing)以及数据分析ChIP-Seq文库是用 Illumina ChIP-Seq library preparation kit 并根据使用说 明构建的。简单概括,约1 5ng的DNA进行末端修复产生平端片断,然后用Klenow exo-和 dATP在3 ’端加上dA单链末端。随后,连接上11 luminaadaptors跑2 %琼脂糖胶以去除多余 的adaptors,并分离出目的长度的模板,以便产生最佳的聚类和测序。用跑胶纯化的片段作 为模板进行18个循环的PCR扩增以富集最终的测序文库。产生的文库用Illumina GenomeAnalyzer II 测序。序列读数用 SOAP[Li,R. ^,SOAP short oligonucleotide alignment program. Bioinformatics, 2008. 24(5) :ρ· 713-4.]定位到小鼠的基因组(mm9)上,允许最大4个错配。定位到独特基因组位点的读数被保留做进一步分析。算法TIR0E[Ho,L.等, An embryonic stem cell chromatin remodeling complex, esBAF, is an essential component of the core pluripotency transcriptional network. Proc Natl Acad Sci U S A,2009. 106(13) :p. 5187-91 ;Kallin, Ε. Μ.等 Genome—wide uH2A localization analysis highlights Bmil-dependent deposition of the mark at repressed genes. PLoS Genet, 2009. 5(6) :p. e 1000506.]被用来鉴定那些 P < 0. 01 的峰。为了确定 R)xa2 和GATA4的结合基因,峰被定位到基因启动子区(士31Λ TSS)。1.9基序分析基序分析用DME2 进行[Smith,A. D.等,Mining ChlP-chip data for transcription factor and cofactor binding sites. Bioinformatics,2005.21Suppl 1 :p. i403-12 ;Smith, A. D. , P. Sumazin 禾口 Μ· Q. Zhang, Identifying tissue-selective transcription factor binding sites invertebrate promoters. Proc Natl Acad Sci USA, 2005. 102 (5) :p. 1560-5.]。排在前 2000 名的 Foxa2 的结合位点和前 1500 名的GATA4结合位点及侧翼序列作为+和-序列被输入DME2。在运行DME2之前,简单重复(单一重复> 5碱基如CCCCCC,和双重复> 9碱基如ACACACACAC)被从+和-序列中移去。然后用默认参数运行DME2得到8个核苷酸长度的排在最前的基序。最终的基序 logos 用 WebLogo 生成[Crooks, G. Ε.等,WebLogo :a sequence logo generator. Genome Res, 2004. 14(6) :p. 1188-90.]。运行 STORM[Schones, D. E.,A. D. Smith,和 Μ. Q. Zhang, Statistical significance of cis-regulatory modules. BMC Bioinformatics,2007. 8 p. 19.]用基序 PWM 来搜索 TRANSFAC 数据库[Matys,V.等,TRANSFAC and its module TRANSCompel transcriptional gene regulation in eukaryotes. Nucleic Acids Res, 2006.34(Database issue) :p.D108—10.]。1.10统计分析进行两组之间比较的QPCR结果用Mudent's t test统计分析。两组基因之间重叠的经验 P-value 用 Monte Carlo 模拟来计算。Fisher,s exact test 的 P-values 也被计算并用 Benjamini 禾口 Hochberg correction[Benjamini, Y. and Y. Hochberg, Controlling the False Discovery Rate—a Practicaland Powerful Approach to Multiple Testing. Journal of the RoyalStatistical Society Series B-Methodological,1995.57 (1) p. 289-300.]为多次测验修正。2.结果1.建立胚胎干细胞肝向分化的技术系统,该系统将ES细胞的肝向诱导分化分成两个阶段由小鼠ES细胞分化为定型内胚层细胞;由定型内胚层细胞继续分化到早期肝细胞〔参见中国专利申请20081020M12. 8,本文将其全文以引用的方式纳入本文。〕1. 1由小鼠ES细胞到定型内胚层细胞分化模型的建立本发明人建立了一个单层培养条件下的无血清诱导分化体系,分两步将小鼠ESC 诱导成DE细胞,再接着诱导成早期肝细胞(图1A)。第一步,在activinA的作用下以大约 50 % 的效率定向分化得到 DE 细胞(C)(CR4+ECD+ 或C)(CR4+c-kit+)。CXCR4+ECD+ 或CXCR4+c_kit+是广泛用来表征DE细胞的两套分子标记组合。从ESC诱导5天后,培养体系中呈现一单层的上皮样贴壁细胞,细胞与细胞之间呈典型的紧密连接状(图1B)。本发明人用流式细胞术(Fluorescent Activated CellSorting, FACS)分析了分化得到的细胞中 CXCR4+ECD+或 CXCR4+c-kit+群体的比例,DE的诱导效率维持在50-60%的水平(图1C)。细胞表面与胞内的双染色FACS表明,DE重要的标记基因R)xa2的表达局限在表征DE的CXCR4+c-kit+群体中(图1C)。为了进一步证明分化得到的DE细胞的真实“身份”,本发明人接着观察了分化过程中整个细胞群体的基因动态表达情况。典型的DE标记基因如R)xa2、GATA4、Gsc, Soxl7等都呈现非常显著的上调(图1D)。与定型内胚层的前体细胞群体一一中内胚层 (mesendoderm)分化有关的几个基因如Brachyury、Eomes、Mixll等呈现上调又下调的动态表达特征(图1D)。这些都与DE在体内胚胎发育过程中的基因动态表达情况非常吻合。本发明人进一步确认了分化得到的CXCR4+E⑶+细胞的DE属性。通过FACS分选不同的细胞群体,再经RT-qPCR分析,本发明人观察到几个典型的DE标记基因如R)xa2、 GATA4、(isc和Sox 17的表达显著富集在CXCR4+E⑶+群体中(图1E)。与此相反,CXCR4+E⑶-群体呈现泛中胚层的标记基因Meoxl的高表达(图1F)。这些基因表达的特征与之前本领域的文献报道很吻合,即ESC体外分化得到的CXCR4+E⑶+和CXCR4+EOT_群体分别表征早期定型内胚层和中胚层群体。本发明人同时观察了在这一分化体系中,其他胚层细胞的产生情况。本发明人选取了 Rexl、Gatal、Sox7、Cdx2、Soxl 分别作为 ESC、造血中胚层(hematopoietic mesoderm)、 胚外内胚层(VE)、滋养外胚层(trophectoderm)和神经外胚层(neuroectoderm)细胞的分子标记,发现他们的表达大都没有显著的上调,基本维持在ESC本底的低表达水平(图1D)。 本发明人也注意到,造血中胚层标记基因fetal的表达水平在第5天发生了约15倍左右的上调。鉴于本发明人在第5天得到了一定数量的CXCR4+ECD—细胞群体,本发明人推测fetal 较低水平的上调可能由具备中胚层性质的CXCR4+ECD_细胞群体所贡献。但是相比DE标记基因表达水平上千倍的上调,本发明人仍然可以初步判断,本发明人建立的ESC体外诱导分化方法是针对DE细胞较为特异的。如上提到的,VE细胞的生成是对从ESC往DE细胞分化的极大干扰。本发明人通过QPCR检测了分化过程中VE的标记基因Sox7,没有发现它的表达水平较ESC本底的低水平发生变化(图1D)。但是本发明人也注意到,本发明的分化体系在第5天也同时生成了一个CXCR4_EOT+的细胞小群体,而CXCR4_EOT+之前曾被报道可以表征ESC体外分化体系中的 VE细胞。为了严格排除来自VE细胞的干扰,于是本发明人检测了这个CXCR4_ECD+群体的基因表达情况。代表VE的标记基因Sox7在其中的表达量甚至低于ES细胞本底的水平(图 1E),这意味着它不可能是VE细胞。有趣的是,本发明人反而观察到这个群体呈现出Nanog 和Brachyury的高表达,他们分别是从ESC到DE的中间态细胞一一上胚层(印iblast)和中内胚层的分子标记。这使得本发明人推断这可能是一个ESC在往DE细胞的分化过程中产生的未同步化的不显著的前体细胞群体。本发明人通过一系列的实验证据证明了在本发明得到的DE高效分化系统中严格杜绝了 VE细胞的生成,这无论对于本发明人接下来的由DE细胞起始的肝向分化,还是在DE 细胞中进行的ChIP实验,都创造了非常便利的条件。
1. 2由定型内胚层细胞继续分化到早期肝细胞模型的建立根据已有的肝脏胚胎发生的知识,来自胚胎中的心肌组织(cardiac mesoderm)的 FGF信号和来自横膈膜(s印turn transversum)的BMP信号对由DE往肝向分化起着至关重要的作用。本发明人在之前建立的ESC往DE的诱导培养系统的基础上,在第5天分化得到的DE细胞的培养液中添加这两个生长因子的重组蛋白,继续诱导2天。第7天时,细胞呈现类似肝细胞的更为典型且一致的上皮样形态(图2A)。同时本发明人也检测到了一些肝脏特异基因如Afp、Ttr、Timd2、Fabpl、Leap2的表达从第5天到第7天的显著上调(图2B)。 其中,Afp和Ttr两个分子标记的激活表达被广泛用于表征DE细胞分化来的肝向细胞命运的获得。除了 RNA水平的QPCR实验,本发明人也在蛋白水平上,通过细胞免疫荧光 (Immunocytofluorescence, ICF)和胞内 FACS(intracellular FACS)实验,确证了 Afp+细胞在第7天细胞中的比例超过60% (图2A&2C)。本发明人还用FACS技术检测了表达早期胎肝细胞的表面分子标记EpCAM的细胞在诱导第7天的整个细胞群体中的比例。本发明人发现EpCAM+细胞占40%以上(图2C)。这些指标都说明,本发明人的ESC体外诱导系统可以高效地分化得到早期肝细胞。为了证实本发明人的体外分化系统与体内胚胎发育的相关过程非常吻合,本发明人必须确证第7天产生的这些Afp+细胞是由DE而不是其它胚层细胞分化来的,因为其它胚层谱系来源的细胞也可能表达Afp,譬如VE。因此,本发明人利用磁珠分选(Magnetic Activated Cell Sorting,MACS)技术将分化第5天的细胞分离成c_kif和c_kit+两个群体。因为在本发明人的分化系统中,第5天的细胞>94%都是CXCR4+(图1C),所以可近似认为c-kit+细胞群体可以指代表征DE的CXCR4+c-kit+细胞群体。本发明人将c_kit_和 c-kit+两个群体的细胞分别在如上建立的肝向诱导条件下继续培养2天。第7天,两个群体的细胞呈现迥异的形态。由第5天的c-kit_群体分化得来的细胞在肝向诱导条件下,在第7天呈现散在分布的类间充质样形态(mesenchymal-like state)(图2D)。相反地,由指代DE细胞的第5天的c-kit+群体分化得来的细胞,在同样诱导条件下,在第7天则呈现成簇存在的上皮样形态(印ithelial state),这与早期肝细胞的形态非常类似(图2D)。除了形态,本发明人进一步检测了这两个细胞群体在第7天的基因表达情况。本发明人发现在由第5天的c-kit+群体分化得来的细胞中,早期肝脏标记基因Afp和Ttr的表达水平要远高于来自第5天的c-kit_群体的细胞中的表达水平(图2E)。这些结果都说明,本发明人在分化第7天的细胞中观察到的早期肝脏基因的表达,主要是由第5天的DE 细胞分化来的早期肝细胞贡献的。2.在ESC衍生的DE细胞中利用ChIP-Seq技术分别寻找GATA4和R)xa2在全基因组的结合位点2. 1GATA4和Foxa2的ChIP-Seq在体外分化的DE细胞中进行目前,对GATA4和R)xa2的转录调控机制的认识主要来自于胚胎发育中对少数基因如Albumin等的研究,为了更清楚地理解两者在胚胎发育过程中的下游基因和转录调控机制,需要通过高通量的技术手段找到更多的下游基因和在全基因组结合位点的信息。 染色质免疫共沉淀结合大规模测序技术(Chromatin Immunoprecipitation followed by massively parallel Sequencing,ChIP-Seq)是近年来兴起的用于研究转录因子等核蛋白
14与染色质DNA结合关系的一种新兴技术。已经有实验室通过此技术在成体肝细胞和肝癌细胞系中尝试寻找了 Foxa2的全基因组的靶基因。本文将采用此技术寻找DE向肝细胞分化过程中GATA4和R)xa2的在全基因组的下游基因。ESCs体外分化得到的DE细胞不仅和胚胎发育中的DE细胞在各方面性质上非常相似,而且细胞数量也很充足。因此,本发明人收获了足够数量的ESCs体外分化得到的DE细胞,并将其分为两组,分别进行GATA4的ChIP-Seq实验和R)xa2的ChIP-Seq实验,以寻找在Day 5的DE细胞中GATA4或R)xa2在全基因组的结合位点。2. 2GATA4和R)xa2的ChIP-Seq峰的数量和基因组位置ChIP-Seq实验的初步测序结果为:GATA4共测到6,100,000个reads (序列), Foxa2共测到4,200,000个reads (序列)。随后对其进一步分析,首先,将所有的reads定位到小鼠的基因组上;然后,经过筛选去掉重复的reads,只保留唯一的reads ;最后,将这些reads输入TIROE软件进行二次筛选和分析,得到可信的峰(包含基因组定位和出现频率的信息)。最终,分别得到75,867个GATA4的峰和32,056个R)xa2的峰(图3)。这些峰代表转录因子在全基因组的所有可信结合位点。按照相对于基因(Refseq gene)的位置将峰归为5类外显子,内含子,上游0-31Λ,上游3-101Λ,基因间的区域,并计算了每一类峰的百分比(图3)。R)xa和GATA4在全基因组上不仅结合在与基因表达和调控相关的前4 类位置上,还以相当高的比例结合在很多基因间的区域。2. 3GATA4 和 Foxa2 的 ChIP-Seq 峰的普通 ChIP 结合 PCR 验证为了验证ChIP-Seq这样高通量测序技术找到的结合位点的真实性,从i^oxa和 GATA4的各自的峰中随机挑选了一些结合位点进行普通ChIP结合PCR的验证,结果表明其阳性率约为93% :GATA4峰选择的15个中有14个可以在PCR产物中检测到,Foxa2峰选择的14个中有13个可以在PCR产物中检测到。由这个比较高的阳性率,可以认为ChIP-Seq 得到的结合位点有很高的可信度。2. 4GATA4和R)xa2结合DNA序列的基序分析根据以上的峰信息,可以进一步通过生物信息分析总结出GATA4或R)xa2结合DNA 序列的基序信息,从基序的信息可以反映转录因子结合的核心序列,两者各自得到一个基序的列表,本发明人按照出现频率和可信度等参数对这些基序进行排序,在这里,本发明人只列出了排在前3位的GATA4或R)xa2的基序(图4)。经过比较,大部分排序高的R)xa2 的基序都和文献报道地非常相似,而大部分排序高的GATA4的基序都含有已知的GATA家族转录因子的保守核心序列GATA (图4显示的是反义链),这又一次体现了 ChIP-Seq数据找到的结合位点的可靠性。此外,本文首次报道了 GATA4的基序,可以为预测GATA4的结合位点提供依据。2. 5GATA4和R)xa2在全基因组水平的各自靶基因和两者共有的靶基因随后,本文试图得到GATA4或R)xa2的靶基因列表,以总结出两者在此DE细胞中究竟结合哪些重要的基因。为了由结合位点的信息(峰)进一步提炼出靶基因的列表,将 ChIP-Seq数据的所有峰对应到RefSeq基因(来自NCBI基因库)的promoter区(本文对 promoter区的定义为转录起始位点上下游各31Λ,即TSS士31Λ),然后将promoter区出现峰的RefSeq基因汇总起来,得到GATA4或R)xa2的靶基因列表,分别得到6053个GATA4的靶基因和3120个R)xa2的靶基因(图5)。GATA4或R)xa2在DE细胞分化过程中的这些靶基因可能包含很多和分化过程相关的重要基因。之前在Alb基因上报道的GATA4和R)xa2的共结合与共调控现象,可能在其它一些肝脏发生相关的基因上也普遍存在,甚至有可能扩展到其它一些发育过程相关的基因上。为验证这一假设,本文首先比较了 GATA4和R)xa2各自的靶基因列表,发现两者确实有很大程度的重合,有多达1721个基因同时出现在两组靶基因列表中(图5),统计学分析显示这是极显著的重合(Fisher exacttest P < 2. 2e-16, empirical P <0.001),这说明 GATA4和R)xa2在全基因组范围共有相当多的靶基因。这一结果暗示,GATA4和R)xa2在这一特定的发育背景下可能在全基因组范围共结合甚至共调控很多基因。2. 6GATA4和Foxa2各自和共有的靴基因的Gene Ontology分析为了对GATA4和R)xa2各自的以及共有的靶基因有更明确的认识,需要对这些靶基因按照已知的功能进行分类。为此,对靶基因进行Gene Ontology(GO)分析,将得到的所有GO分类按照出现频率进行排序,在此,只显示GO分类中排在前8位的,结果如下F0Xa2 靶基因的前8个GO中有4个是和发育或形态发生过程相关的(图6A),GATA4靶基因的GO 中前6个都是和发育或形态发生过程相关的(图6B),而GATA4和R)xa2共有的靶基因的前8个GO全都是和发育或形态发生过程相关的(图6C)。这一结果说明,在分化得到的DE 细胞中,无论是GATA4还是R)xa2都主要调控发育相关的基因。而且,那些可能被GATA4和 R)xa2共同调控的基因也绝大部分都是和发育过程相关的。2. 7验证GATA4和R)xa2对靶基因的转录调控功能为了验证GATA4或R)xa2的物理结合与基因转录调控的生物学功能之间的关联, 即从ChIP-Seq数据找到的GATA4或R)xa2的靶基因有多少是真正受其调控的。本发明人从GATA4和R)xa2的靶基因中分别随机挑选了 10个,在分化到Day 5的fetta4-KD组或 Foxa2-KD组检测其RNA水平,假设这些基因是被GATA4或R)xa2所调控的,那么GATA4或 Foxa2的剔除就必然影响它们的表达。结果发现,与Control组相比,GATA4的10个结合基因中有5个的表达水平在Gata4被剔除后发生显著的变化(图7A),Foxa2的10个结合基因中有5个的表达水平在R)xa2被剔除后发生显著的变化(图7B)。这表明GATA4和 Foxa2对基因调控区的结合在很大程度上是和转录调控相关联的,因此,从GATA4和Foxa2 的ChIP-Seq数据中可以找到很多真正的下游基因。2. 8. GATA4和R)xa2在DE细胞中共结合靶基因Zaret等曾报道了在体内的DE细胞中GATA4和R)xa2共结合Alb上游的enhancer 序列并参与转录调控。而在上一节的ChIP-Seq数据分析中提到,GATA4和R)xa2在全基因组范围内有很多重合的靶基因。以上这些信息提示本发明人,GATA4和R)xa2在全基因组范围可能存在广泛的共结合甚至共调控关系。根据ChIP-Seq数据,GATA4和R)xa2共有的靶基因中包括很多发育相关的重要基因。本文从中选取了一些DE发育和肝脏发生相关的关键基因,并在ChIP-Seq数据中查看了 GATA4和R)xa2在其调控区上的峰分布(包含结合位置和结合强度的信息),结果发现在这些基因的调控区都存在毗邻的或重合的GATA4和R)xa2的峰,说明两者在这些共有的靶基因上有紧邻的或共同的结合位点。在这些基因中,包括DE发育相关的关键基因,如 Eomes (图 8A),Hhex (图 8B),Soxl7 (图 8C),Gsc (图 8D),GATA4 (图 8E),Foxa2 (图 8F)。 此外,还包括对于DE的肝向分化必需却还未在DE表达的基因,如Afp (图9A),Ttr (图9B),Timd2(图9C)。这些GATA4和R)xa2共有的靶基因上存在着如此紧邻的各自结合位点,这一现象提示本发明人,两者很有可能共结合这些靶基因,但是还必须排除另一种可能,就是两者在不同的细胞群体中各自结合相同的位点,因为实验中用到的Day 5的分化细胞不只包括DE细胞一个群体,而且GATA4在DE以外的细胞群体中也有微弱表达。因此,还需要更进一步的实验才能证明GATA4和R)xa2共结合这些发育相关的共有靶基因。3.在DE细胞中Tcf 12广泛参与R)xa2和GATA4对靶基因的结合3. lFoxa2和GATA4结合的某些DNA序列包含E蛋白转录因子的基序Foxa2和GATA4对靶基因的结合可能需要其它转录因子的参与,我们可以从基序分析得到一些信息,如果其中包含其它已知转录因子的基序,那么,就极有可能找到其它参与结合的转录因子。从ChIP-Seq数据的分析中,我们意外的发现,无论是GATA4还是R)xa2 的排序较高的基序中都有一些特殊的基序,与经典的GATA4或R)xa2的基序所含的核心序列截然不同,但相互之间又很相似,对其进行排序(图10A)。这些特殊基序包含如下的简并核心序列(仏/106(仏/106。将这一序列进行检索,发现很符合已被报道的E box家族转录因子的基序=CANNTG序列。这个序列的存在能够指示E蛋白转录因子包括Tcf3/E2A, Tcf4/E2-2和Tcfl2/HEB的结合。接着,根据ChIP-Seq数据初步分析了 E蛋白转录因子参与GATA4或R)xa2结合的可能性。首先,从R)xa2的ChIP-Seq数据中,分别找出所有包含前3位E box基序的峰和所有包含前10位经典的R)xa2基序的峰,计算这两类峰重合的部分,有多达4 个重合的峰,即有4 个峰同时包含E box和R)xa2的基序(图10B),统计学分析显示重合极为显著(Fisher exact test P < 2.加_16)。用同样的方法分析GATA4 的ChIP-Seq数据,分别找出所有包含前3位E box基序的峰和所有包含前10位经典的 GATA4基序的峰,计算这两类峰重合的部分,有多达560个重合的峰,即有560个峰同时包含E box和GATA4的基序(图10C),统计学分析显示重合极为显著(Fisher exact te st P < 2. 2e-16)。这些同时包含两类基序的峰所对应的基因组上的位点在被R)xa2或GATA4 结合的情况下,有可能同时被mx)x的转录因子结合,而上面的计算结果启示我们在全基因组范围内可能存在很多这样的位点。3. 2Tcfl2在DE细胞中广泛结合R)xa2和GATA4的靶基因为了验证上述重合峰所对应的位点是否同时被E box的转录因子结合,及鉴定E 蛋白是否参与了 GATA4或R)xa2的靶基因的转录调控,我们从同时包含E box和R)xa2的基序的峰(图10B的4 个重合峰)中选择了 5个,也从同时包含E box和GATA4的基序的峰(图10C的560个重合峰)中选择了 5个。针对这10个峰所对应的基因组上的位点, 在Day 5的DE细胞中,分别用R)xa2,GATA4,Tcf 12和I~Cf3的抗体,以及对照IgG进行了 ChIP-QPCR验证。E-box的转录因子有很多,这里验证了其中的两个成员Tcfl2和I~Cf3,因为这两个成员是基序分析中得分较高的,且根据已有的文献两者在很多发育过程中都有调控作用。另外,我们还注意到在同时包含E box和R)xa2的基序的峰对应的位点附近,也存在GATA4的基序;而同时包含GATA4和 ^Π2的基序的峰对应的位点附近,也存在R)xa2 的基序,因此,我们在每类位点上都同时验证了 3类转录因子的结合。在R)xa2的5个峰对应的位点上,Foxa2和Tcfl2都有很强的结合,而Tcf3不结合(图11A);在GATA4的5个峰对应的位点上,GATA4和Tcf 12都有很强的结合,而Tcf3不结合(图11B)。由此,我们可以得出推论在DE细胞中,E蛋白Tcfl2有可能广泛地参与了 Foxa2和GATA4各自对靶基因的结合。另外,我们还注意到在图IOA的Foxa2和Tcfl2都结合的5个位点上,GATA4 也有较强的结合;而在图IOB的GATA4和Tcf 12都结合的5个位点上,Foxa2也有较强的结合。这暗示,这些位点有可能被三者共结合。但是,由于Tcf 12的表达不只局限在DE细胞, 要证明以上的这些推论,还必需kq-ChIP实验的进一步证据。3. 3Tcfl2与R)xa2和GATA4在DE细胞中共结合靶基因的调控区为了证明Tcf 12能够参与R)xa2和GATA4共结合靶基因,我们又针对以上这10 个位点,在Day 5的DE细胞中做了 3种不同抗体顺序的sequential ChIP实验Foxa2抗体-GATA4抗体,Foxa2抗体-Tcfl2抗体,Tcfl2抗体-GATA4抗体,其中任何一种顺序都可以证明两者的共结合,而综合这三种顺序的结果可以为三者的共结合提供很强的证据。结果发现在这10个位点中有3个位点在3种不同抗体顺序的sequentialChIP产物中均能被检测到(图12第3,4,6列)。这一结果为证明R)xa2,GATA4和Tcf 12对靶基因的共结合提供了有力的证据。由此,可以推测,在DE细胞中,Tcfl2可以作为一个结合伙伴,与R)xa2 和GATA4 —起,三者共结合靶基因。以上已以具体实施方式
的形式对本发明做出了详细的描述。应理解,本申请的范围并不限于上述具体实施例。在不偏离本申请精神的情况下对本发明做出的改动和变动都在本申请的保护范围之内。
权利要求
1.一种基因芯片,其特征在于,该芯片包含至少一条表1、表2或表3所示的核苷酸序列。
2.如权利要求1所述的基因芯片,其特征在于,所述芯片含有表1、表2或表3所列核苷酸序列中的至少100条核苷酸序列。
3.如权利要求1所述的基因芯片,其特征在于,所述芯片含有表1、表2或表3所列核苷酸序列中的至少1000条核苷酸序列。
4.如权利要求1所述的基因芯片,其特征在于,所述芯片含有表3所列核苷酸序列中的至少1200条核苷酸序列。
5.如权利要求1所述的基因芯片,其特征在于,所述芯片含有表3所列核苷酸序列中的至少1600条核苷酸序列。
6.一种检测基因表达水平的方法,该方法包括使生物学样品与权利要求1 5中任一项所述的基因芯片接触,以及检测感兴趣基因的表达。
7.一种鉴定培养的多能干细胞是否发生了肝向分化的方法,其特征在于,该方法包括将所述培养的多能干细胞与权利要求1 5中任一项所述的基因芯片接触,以及检测感兴趣基因的表达,其中,如果在该基因芯片上获得阳性结果,表明该多能干细胞发生了肝向分化。
8.一种筛选发生了肝向分化的多能干细胞的方法,其特征在于,所述方法包括将所述多能干细胞与权利要求1 5中任一项所述的基因芯片接触,以及检测感兴趣基因的表达, 其中,如果在该基因芯片上获得阳性结果,表明该多能干细胞为肝向分化的多能干细胞。
9.如权利要求7或8所述的方法,其特征在于,所述多能干细胞为哺乳动物多能干细胞。
10.Tcfl2在控制多能干细胞肝向分化中的应用。
全文摘要
本发明涉及早期肝细胞的产生及其用途。具体而言,本发明涉及非人哺乳动物胚胎干细胞定向分化为肝细胞的系统、技术,包括含有本发明所列基因的基因芯片。本发明还涉及使用所述基因芯片进行检测、鉴定和筛选的方法。
文档编号C12N5/071GK102443622SQ201010297038
公开日2012年5月9日 申请日期2010年10月12日 优先权日2010年10月12日
发明者何志颖, 王欣 申请人:中国科学院上海生命科学研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1