器官基因的组蛋白h3k9三甲基化表达差异的分析方法与基因模型的制作方法

文档序号:457187阅读:564来源:国知局
器官基因的组蛋白h3k9三甲基化表达差异的分析方法与基因模型的制作方法
【专利摘要】本发明涉及一种器官基因的组蛋白H3K9三甲基化表达差异的分析方法与基因模型,分析方法包括以下步骤:提取冷冻保存的标本的组织样本,研磨匀浆并用质量百分数为1%的甲醛处理,裂解细胞得到全细胞裂解液;在全细胞裂解液加入三甲基化组蛋白H3K9的抗体和磁珠,在4℃进行孵育,提取DNA;构建DNA文库,进行染色质免疫沉淀测序分析,对有效数据进行产量统计,并与目的物种基因组序列进行比对,根据转录因子结合位点和组蛋白修饰富集区域,获取峰值相关基因;对所述峰值相关基因按照基因功能进行聚类分析,并选取组蛋白H3K9三甲基化表达差异显著的至少一基因。
【专利说明】器官基因的组蛋白H3K9三甲基化表达差异的分析方法与
基因模型
【【技术领域】】
[0001]本发明涉及组蛋白甲基化,尤其涉及一种器官基因的组蛋白H3K9三甲基化表达差异的分析方法与基因模型。
【【背景技术】】
[0002]在哺乳动物基因组中,组蛋白可以有很多修饰形式,包括组蛋白末端的乙酰化、甲基化、磷酸化、泛素化、ADP (二磷酸腺苷)核糖基化等等,这些修饰都会影响基因的转录活性。组蛋白修饰最重要的表观遗传机制是控制基因表达,因此其与细胞的增殖、发育和生存息息相关。对于组蛋白H3 (组蛋白H3的第9位赖氨酸残基)在不同的组织和生物中已广泛研究并证实组蛋白H3K9三甲基化(H3K9me3)与异染色质形成,基因的表达和转录伸长率具有关联性。
[0003]表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达和调控的可遗传变化的过程和机制。与遗传多态性不同,会发生非遗传部分和可逆的DNA修饰。
[0004]甲基化发生在位于氨基末端的组蛋白尾部的五个主要的赖氨酸残基(H3K4, H3K9, H3K27, H3K36, H4K20),以及一个球状蛋白结构域(H3K79)内的赖氨酸残基,这些赖氨酸可发生单甲基化、二甲基化和三甲基化。在各种不同的组蛋白赖氨酸甲基化模式中,由于H3K9的甲基化和抑制的染色质相关而备受关注。H3K9三甲基化(H3K9me3)是翻译后修饰,并且与异染色质的形成和转录抑制相关联,也是基因转录沉默的标志,具有重要的研究价值。
[0005]高通量技术具有高效的特点,其可用来分析基因组中大量的基因表达情况同时研究病理过程中复杂的分子机理。ChlP-seq (Chromatin Immunoprecipitation -sequencing,染色质免疫沉淀_测序)是染色质免疫共沉淀后并结合高通量测序的方法,它能够在全基因组中识别转录因子(TFs)和DNA结合蛋白的结合位点。随着高通量测序平台如Illumina公司的基因组分析以及SOLiD (使用连接法测序的一种高通量测序仪,Sequencing by Oligonucleotide Ligation and Detection)和芯片级别的抗体出现,ChlP-seq已成为用于确定基因组中的功能元件的最广泛使用的方法。与常用的ChIP_chip(Chromatin Immunoprecipitation-chip,染色质免疫共沉淀-芯片)相比,ChlP-seq 具有更高的信噪比,更便宜以及更少量的样本的优势。
[0006]目前,只有极少数研究比较分析哺乳动物或人体组织的H3K9me3。

【发明内容】

[0007]有鉴于此,有必要提出一种新的器官基因的组蛋白H3K9三甲基化表达差异的分析方法与基因模型。
[0008]本发明的一个技术方案是,器官基因的组蛋白H3K9三甲基化表达差异的分析方法,其包括以下步 骤:提取冷冻保存的标本的组织样本,研磨匀浆并用质量百分数为1%的甲醛处理,裂解细胞得到全细胞裂解液;在全细胞裂解液加入三甲基化组蛋白H3K9的抗体和磁珠,在4°C进行孵育,提取DNA ;构建DNA文库,进行染色质免疫沉淀测序分析,对有效数据进行产量统计,并与目的物种基因组序列进行比对,根据转录因子结合位点和组蛋白修饰富集区域,获取峰值相关基因;对所述峰值相关基因按照基因功能进行聚类分析,并选取组蛋白H3K9三甲基化表达差异显著的至少一基因。
[0009]优选的,所述分析方法中,所述标本为心脏和/或脾脏。
[0010]优选的,所述分析方法中,所述提取DNA后还进行纯化,然后再构建DNA文库。
[0011 ] 优选的,所述分析方法中,所述纯化采用快速PCR纯化试剂盒进行,纯化之后还采用实时定量基因扩增荧光检测系统进行验证。
[0012]优选的,所述分析方法中,所述比对中,允许不超过2个碱基的错配。 [0013]优选的,所述分析方法中,所述构建DNA文库中,对DNA片段末端修复,3'端加A碱基,连接测序接头,PCR扩增及选择DNA产物的片段大小,用于上机测序。
[0014]优选的,所述分析方法中,选择DNA产物的片段大小中,包括接头序列在内的片段大小为 100-300bp。
[0015]优选的,所述分析方法中,所述有效数据为去除接头和低质量读取后的下机数据,其中低质量读取为每条读取中碱基质量值S 20个数大于等于50%,或者N碱基个数大于等于 10% O
[0016]优选的,所述分析方法中,所述低质量读取为每条读取中碱基质量值S 18个数大于等于60%,或者N碱基个数大于等于15%。
[0017]本发明的又一技术方案是,一种基因模型,其包括采用上述任一分析方法所获得的组蛋白H3K9三甲基化表达差异显著的若干基因。
[0018]上述方案,通过分析器官H3K9三甲基化表达差异,从而确定出候选基因,这些基因与免疫,细胞信号转导,蛋白质转录和合成渠道和运输和细胞外基质等相关,能够作为中间结果的有效信息,为下一步的分析工作提供良好的信息支持和辅助数据;并且,H3K9me3具有作为一个潜在的生物标志物或表观遗传疾病治疗靶点的意义。
【【专利附图】

【附图说明】】
[0019]图1是一个实施例心脏的峰值在若干基因功能元件上的分布特征图;
[0020]图2是一个实施例脾脏的峰值在若干基因功能元件上的分布特征图;
[0021]图3是一个实施例的各样本间所共同包含的基因和各自具有的特有的基因示意图;
[0022]图4是心脏的基因相关各位点所占的比例示意图;
[0023]图5是脾脏的基因相关各位点所占的比例示意图;
[0024]图6是两个样本中所共同包含的峰值区域富集度示意图;
[0025]图7是一个实施例的流程示意图。
【【具体实施方式】】
[0026]下面结合附图,对本发明的【具体实施方式】进行详细描述。
[0027]本发明通过采用ChlP-seq的技术,比较分析人体器官心脏和脾脏之间在全基因组中H3K9me3的变化及差异情况,以便更好地认识组织间的表观遗传差异,建立基因模型,作为下一步分析的基础,并通过数据分析,全面的描述了组织特异性表达,功能及发展情况。
[0028]如图7所示,本发明的一个实施例是,器官基因的组蛋白H3K9三甲基化表达差异的分析方法,其包括以下步骤:提取冷冻保存的标本的组织样本,研磨匀浆并用质量百分数为1%的甲醛处理,裂解细胞得到全细胞裂解液;在全细胞裂解液加入三甲基化组蛋白H3K9的抗体和磁珠(Beads),在4°C进行孵育,提取DNA ;孵育时间不作限制,只需能够完成孵育,最后实现DNA提取机壳。然后构建DNA文库,进行染色质免疫沉淀测序分析,对有效数据进行产量统计,并与目的物种基因组序列进行比对,根据转录因子结合位点和组蛋白修饰富集区域,获取峰值相关基因;对所述峰值相关基因按照基因功能进行聚类分析,并选取组蛋白H3K9三甲基化表达差异显著的至少一基因。优选的,所述提取DNA后还进行纯化,然后再构建所述DNA文库。优选的,所述纯化采用快速PCR纯化试剂盒进行,纯化之后还采用实时定量基因扩增荧光检测系统进行验证。
[0029]优选的,所述分析方法中,所述标本为心脏或脾脏。关于下面相关实施例涉及样本的合法性说明如下:实验采用两组标本,包括两个心脏和两个脾脏,均来自中国广西桂林第一八一医院脑死亡患者自愿捐赠的器官。标本放置于_80°C保存。标本收集的方案与执行均获得广西代谢性疾病重点实验室和第一八一医院伦理委员会的批准。器官捐赠者均签署了知情同意书。 [0030]优选的,所述分析方法中,所述比对中,允许不超过2个碱基的错配。优选的,所述分析方法中,所述构建DNA文库中,对DNA片段末端修复,3 ^端加A碱基,连接测序接头,PCR扩增及选择DNA产物的片段大小,用于上机测序。优选的,所述分析方法中,选择DNA产物的片段大小中,包括接头序列在内的片段大小为100-300bp。
[0031]优选的,所述分析方法中,所述有效数据为去除接头和低质量读取后的下机数据,其中低质量读取为每条读取中碱基质量值20的个数大于等于50%,或者N碱基个数大于等于10%。优选的,所述分析方法中,所述低质量读取为每条读取中碱基质量值18的个数大于等于60%,或者N碱基个数大于等于15%。
[0032]例如,采用染色质免疫共沉淀方式,准备ChIP Sequencing建库。
[0033]首先,提取标本的组织样本,例如,从冰冻状态拿到O至4°C,注意不要拿到常温,待组织解冻后,参照BGI公布的程序进行ChlP-seq实验方案。简单的说,将组织样本先研磨匀衆并用质量百分数为1%的甲醒处理细胞,使DNA-protein的相互结合作用被交联固定,然后裂解细胞,得到全细胞裂解液,通过超声处理,将基因组DNA打断至100-500bp碎片,在细胞裂解液中加入特定的实验所需的三甲基化赖氨酸9的抗体和beads,并进行4°C孵育。采用合适的实验条件进行洗脱,并解交联,经过交联反转和蛋白酶K处理后,DNA被沉淀提取出,在构建DNA文库前,先用QIA快速PCR纯化试剂盒将DNA进一步纯化。通过qPCR(Real-time Quantitative PCR Detecting System,实时定量基因扩增突光检测系统)对ChIP结果进行验证,准备好的ChIP后的DNA样品可以用于ChIP Sequencing建库。
[0034]ChIP Sequencing文库构建流程说明如下:先对DNA片段末端进行修复,3'端加A喊基,连接测序接头,详细步骤可参考Illumina公司Paired-End DNA Sample Prep kit。然后进行PCR扩增及DNA产物的片段大小选择,优选为100-300bp,包括接头序列在内,合格的文库用于上机测序。优选的,DNA产物的片段大小为120至270bp。
[0035]然后进行ChlP-seq分析。
[0036]ChIP DNA末端修复,接头连接以及扩增等均按之前的进行。从琼脂糖凝胶中分离出大小约为49bp的片段,用Solexa/Illumina2G基因分析仪分析测序。与目的物种基因组序列进行比对,其中参考基因组版本为Hgl9,比对软件为S0AP2.21。比对过程中,允许不超过2个碱基的错配,优选的,仅允许I个碱基的错配;其中比对到基因组上唯一位置的reads (唯一比对reads)将用于后续的信息分析。ChIP Sequencing reads在全基因组的分布包括唯一比对Reads在Repeats区域的分布;唯一比对Reads在各基因功能元件上的分布;唯一比对Reads的全基因组覆盖深度。而全基因组Peak扫描,采用软件MACS1.4.0,将基因组上的候选peak区延伸,得到一定长度的建模区域,根据此区域中所有唯一比对reads的情况,使用Poisson分布模型进行检验,计算候选peak区域的p-value,若p_value〈l.00e-05,则认为该区域是一个peak。MACS的目的是从ChlP-seq的数据集中找出转录因子结合位点和组蛋白修饰富集区域,而且不需要正常对照。
[0037]Peak相关基因的GO分析,GO是一种整合性、统一化、动态开放实时更新的分类系统。其包括三大独立的本体(Ontology):基因参与的生命过程(biological process),所处的细胞组份和元件(cellular component)及发挥的分子生物学功能(molecularfunction)。这三个ontology下面又可以独立出不同的亚层次,层层向下构成一个ontologies的树型分支结构。通过GO功能富集分析,可以知道peak相关基因涉及到哪些生物学功能的改变。通过GO功能分析可以将Peak相关基因按照基因功能进行聚类分析。
[0038]数据处理与产出情况统计情况如下:测序完成后,对原始数据进行去污染,去接头及去除低质量数据处理,统计clean data (有效数据)产量,具体如下表1所示。
[0039]
【权利要求】
1.器官基因的组蛋白H3K9三甲基化表达差异的分析方法,其特征在于,包括以下步骤: 提取冷冻保存的标本的组织样本,研磨匀浆并用质量百分数为1%的甲醛处理,裂解细胞得到全细胞裂解液; 在全细胞裂解液加入三甲基化组蛋白H3K9的抗体和磁珠,在4°C进行孵育,提取DNA ;构建DNA文库,进行染色质免疫沉淀测序分析,对有效数据进行产量统计,并与目的物种基因组序列进行比对,根据转录因子结合位点和组蛋白修饰富集区域,获取峰值相关基因; 对所述峰值相关基因按照基因功能进行聚类分析,并选取组蛋白H3K9三甲基化表达差异显著的至少一基因。
2.根据权利要求1所述分析方法,其特征在于,所述标本为心脏和/或脾脏。
3.根据权利要求2所述分析方法,其特征在于,所述提取DNA后还进行纯化,然后再构建DNA文库。
4.根据权利要求3所述分析方法,其特征在于,所述纯化采用快速PCR纯化试剂盒进行,纯化之后还采用实时定量基因扩增荧光检测系统进行验证。
5.根据权利要求4所述分析方法,其特征在于,所述比对中,允许不超过2个碱基的错配。
6.根据权利要求5所述分析方法,其特征在于,所述构建DNA文库中,对DNA片段末端修复,3'端加A碱基,连接测`序接头,PCR扩增及选择DNA产物的片段大小,用于上机测序。
7.根据权利要求6所述分析方法,其特征在于,选择DNA产物的片段大小中,包括接头序列在内的片段大小为100-300bp。
8.根据权利要求7所述分析方法,其特征在于,所述有效数据为去除接头和低质量读取后的下机数据,其中低质量读取为每条读取中碱基质量值S 20个数大于等于50%,或者N碱基个数大于等于10%。
9.根据权利要求8所述分析方法,其特征在于,所述低质量读取为每条读取中碱基质量值=18个数大于等于60%,或者N碱基个数大于等于15%。
10.一种基因模型,其特征在于,包括采用如权利要求1至9任一所述分析方法所获得的组蛋白H3K9三甲基化表达差异显著的若干基因。
【文档编号】C12Q1/68GK103667455SQ201310585954
【公开日】2014年3月26日 申请日期:2013年11月19日 优先权日:2013年11月19日
【发明者】眭维国, 戴勇, 曹翠辉, 薛雯, 陈洁晶 申请人:眭维国, 戴勇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1