MIR135HG在调控心血管系统中的应用的制作方法

文档序号:13591028阅读:269来源:国知局
本发明涉及基因领域,特别涉及长链非编码rna(lncrna)领域。
背景技术
:长链非编码rna(longnon-codingrnas,lncrnas)是一类转录本长度超过200个核苷酸,几乎不具有编码蛋白质功能的rna分子。lncrna在多种层面上(表观遗传调控、转录调控以及转录后调控等),影响细胞的生长、发育、增殖、分化、代谢和凋亡等生理过程。最近几年,lncrna作为一种新的转录本已在基因组研究领域掀起广泛研究热潮。基因组学研究表明,哺乳动物基因中超过98%转录为非编码rna(non-codingrna,ncrna),只有不到2%转录为蛋白质。ncrna按其长度可以分为非编码小rna和长链非编码rna。研究已表明非编码小rna在心血管系统发育及心血管疾病的发生发展中起非常重要作用。相对于蛋白编码序列以及微小rna,lncrna的研究还处于起步阶段,尤其是在心血管疾病中的调控机制有待进一步阐明。目前研究表明lncrna主要从表观遗传学、转录调控及转录后调控等多个层面实现对基因表达的调控,参与调控机体的生长发育、细胞凋亡、增殖、分化等,并与许多疾病有着密切关系。lncrnas作为一种细胞内微细胞结构,可以入核转运、可变剪切、变形变构、生成小rna,参与染色体重组、基因修饰、表观遗传、mrna稳定性、转录和转录后调节,参与蛋白质生成、代谢和功能的调节。lncrnas将会成为rna世界的一个调节核心,一个最重要、最庞大、最复杂的人体基因和细胞、组织与功能的调节和管理体系。braveheart(bvht,ak143260)是boyer等人在2013年发表在《细胞》杂志(cell.2013january31;152(3):570–583.)新发现的一种lncrna,其在心脏的发育中起到重要作用。敲除小鼠ak143260将会导致胚胎干细胞分化而来的心肌细胞失去搏动能力,并使心脏关键转录因子(hand2、myocardin、nkx2-5、gata4、mef2c等)失活;但若将mesp1(mesodermposterior)表达,心肌细胞丧失的搏动能力及关键转录因子的失活会得到逆转。此发现有助于了解干细胞增殖分化为心肌细胞的分子机制,为先天性心肌病的治疗提供线索。miat(myocardialinfarction-associatedtranscript,miat),此lncrnas长约9kb,主要在循环系统中高表达,并且在视网膜细胞的生长分化中起调控作用,又称为rncr2(retinalnoncodingrna2)。其单核苷酸多态性(snps)分析显示,该基因第5外显子snp的变异增加miat的转录,并且是心肌梗死的敏感位点。这项研究提出snp所引起的miat表达水平的改变,对动脉粥样硬化性心脏病的发生有影响,但miat的功能目前尚不清楚,需进一步研究来阐明miat是如何参与动脉硬化性心脏病发病机制。德国汉诺威医学院的viereck等研究人员发现了一个新的lncrnachast(cardiachypertrophy-associatedtranscript),其过表达可使细胞尺寸变大,而沉默后则预防或缓解了小鼠的病理性心肌重构过程。而小鼠chast的序列和结构都与人的chast基因相似,也能促进心肌细胞肥大发生,这可能是人类治疗心血管疾病的一个新靶点。病理性心肌肥厚(pathologicalcardiachypertrophy)是心衰、脑卒中、冠心病的前期病变,也是猝死等心血管疾病的独立危险因素。其病理性过程涉及表观遗传诱导基因重编程。lncrna基因chaer(cardiac-hypertrophy-associatedepigeneticregulator),又称心肌肥厚相关表观遗传学调节因子,通过对与多梳抑制复合物2(prc2)的催化亚基直接相互作用,从而抑制了心肌肥厚相关基因启动子区上的组蛋白h3赖氨酸27甲基化。因此,抑制chaer在心脏的表达,可大幅度减轻心肌肥厚和功能障碍。anril(antisensenoncodingrnaintheink4locus,anril)即ink4基因座上的反义非编rna,位于染色体9p21区域;一项大规模的病例对照研究示anril基因携带者较非携带者显著增加心肌梗死的患病风险。anril转录本能在平滑肌细胞、内皮细胞、免疫细胞等多种细胞中检测到,并发现它在外周血单核细胞及动脉粥样斑块中高表达[32]。进一步研究anril的功能显示它可作为pcg(polycombgroup)复合物的骨架与prc1、prc2联系,通过表观顺式作用抑制了cdkn2a/b的表达。扩张性心肌病(dilatedcardiomyopathy,dcm)是一种心肌收缩期泵血功能障碍疾病。本病的特征为左或右心室或双侧心室扩大,并伴有心肌肥厚。dcm的年发病率为5/100000~8/100000人,并有不断增高的趋势,男性多于女性(2.5:1),平均发病年龄约40岁。在美国大约1/4的心力衰竭由dcm引起。多数患者病情呈进行性加重,死亡可发生于疾病的任何阶段。该病病因目前仍不明确,基本损伤机制主要包括家族性和基因因素、病毒性及其他细胞毒损伤、免疫异常等。尽管以上学说是目前主要发病说,但当中还有许多问题未弄清,有待进一步研究。随着基因组学及生物信息学的深入研究,科学家发现长非编码rna广泛地参与心脏发育及其稳态的维持过程。鉴于lncrnas是心血管发病机制和药理干预的一个新的靶标,是未来心血管研究和发现的热点。在人类基因组中心脏中胚层增强关联的长非编码rna基因carmn(又称mir135hg)就是对应小鼠bvht(ak143260)的版本,与扩张性心肌病(dcm)表观调控机制非常相关。lncrna已成为心血管基础和临床研究的一个新的热点和重点,它会成为心血管疾病不同表型和实现个体化治疗的一个重要分子基础,并将会产生新的发病机理、新的生物标记物、新的调控途径、新的靶分子和新的防治措施。技术实现要素:本发明的目的在于提供mir135hg在调控心血管系统中的应用。发明人新发现的长非编码基因mir135hg与myh11在心脏组织的相关性非常高,376个gtex国际项目的心脏组织rna-seq测序标本验证,pearson相关系数是0.6911,p-值=1.09e-54,显示出两个基因相关性有非常显著的统计学意义。通过检测mir135hg的表达情况,有望对心血管系统疾病进行筛查,指导心血管系统药物的开发及治疗。通过调降mir135hg的表达有望治疗或改善心血管系统疾病。心血管系统疾病包括但不限于扩张性心肌病、肥厚型心肌病、遗传性心脏病、心血管老年性退行性疾病、高血压病、冠心病、急性心肌梗死、心律失常、心脏瓣膜病、先天性心脏病、主动脉疾病、心力衰竭,特别是以下领域:1)应用于自然人群队列研究,获取心血管系统疾病阳性和阴性人群的差异数据,从而可以用于广泛自然人群的心血管系统疾病预测,作为心血管系统疾病筛查的重要指标及试剂;2)应用于心血管系统疾病的种族人群研究,分子生物实验室均可用本套试剂盒来检测不同种族人群mir135hg表达的大样本数据,同时获取相关的心血管系统疾病调控网络在不同种族人群的差异,从而丰富心血管系统疾病调控网络,为研究不同种族人群的心血管系统疾病网络提供重要依据及干预靶点。附图说明图1是长非编码mir135hg相关的共表达基因的蛋白互作网络;图2是mir135hg与myh11在心脏组织的相关性分析图。具体实施方式心血管发育的预后长非编码rna基因的鉴定与功能预测发明人下载整理六万张geo的affyu133plus2人类芯片表达量数据,通过挖掘共表达分析,找到人心血管发育相关的基因群。通过共表达分析,找出相关表达量相关的基因群:发明人通过对geoaffy芯片表达谱的进行共表达分析,就是将表达量与基因mir135hg有正相关的关系的基因,例如通过correlation函数,找出正调控相关(corr>0.40)的前32个基因,(表1)。表1内的基因名称,是genecardshttp://www.genecards.org/的标准人类基因名称。表1:mir135hg的共表达基因序号affy探针基因基因名称p-值01558828_s_atmir143hgmir143hostgene(non-proteincoding)01227183_atrp11-394o4.5n/a02231987_atmir143hgmir143hostgene(non-proteincoding)5.75e-2813243140_atacta2actin,alpha2,smoothmuscle,aorta7.88e-2424203951_atcnn1calponin14.69e-1915203766_s_atlmod1leiomodin12.75e-188644702_atsyde1synapsedefectiverhogtpasehomolog16.24e-1877226047_atmrvi1murineretrovirusintegrationsite1homolog4.73e-1828238204_atlmod1leiomodin11.23e-1789229218_atcol1a2collagentypeialpha2chain2.50e-17110226523_atap000892.6pcsk7-as;taglndownstream1.14e-17011221870_atehd2ehdomaincontaining26.51e-17012205525_atcald1caldesmon11.03e-16813202555_s_atmylkmyosinlightchainkinase2.04e-16814232544_atigfbp7insulinlikegrowthfactorbindingprotein76.79e-16815200974_atacta2actin,alpha2,smoothmuscle,aorta2.90e-16616202273_atpdgfrbplateletderivedgrowthfactorreceptorbeta1.61e-16017212494_attns2tensin21.23e-15918221814_atadgra2adhesiongprotein-coupledreceptora25.92e-15719205547_s_attaglntransgelin1.62e-15520201058_s_atmyl9myosinlightchain92.50e-15421235834_atcald1caldesmon15.03e-15422215418_atparvaparvinalpha2.59e-1502345297_atehd2ehdomaincontaining23.61e-15024209651_attgfb1i1transforminggrowthfactorbeta1inducedtranscript13.97e-150251566482_atmsrb3methioninesulfoxidereductaseb32.02e-14826232458_atmir1245amicrorna1245a2.99e-14827225241_atccdc80coiled-coildomaincontaining802.33e-14628215199_atcald1caldesmon12.73e-14429203812_atslit3slitguidanceligand31.70e-143301555724_s_attaglntransgelin9.58e-14331226522_atpodnpodocan1.18e-14132207961_x_atmyh11myosinheavychain118.01e-141基因共表达网络分析基因共表达网络分析(geneco-expressionnetworkanalysis)是基于基因间表达数据的相似性而构建的网络图,图1中的节点代表基因,具有相似表达谱的基因被连接起来形成网络。通过基因表达的相似性可分析基因产物可能的相互作用关系,从而了解基因间相互作用脉络及寻找核心基因,核心基因是重要的枢纽,在网络模块中器关键性作用。通过对mir135hg的共表达基因群(表1)做蛋白互作分析,发明人得到蛋白互作网络(protein-proteininteractionnetwork,ppi),发现mir135hg是核心基因。通过对affy人类表达谱基因芯片的共表达分析,确定了mir143hg(braveheart)靶基因通路,其中“心血管系统发育”(cardiovascularsystemdevelopment)通路的相关靶基因,整个通路的p-值是3.09e-29,有非常显著的统计学意义。开源的生物信息学在线软件david(databaseforannotation,visualizationandintegrationdiscovery)是生物信息学资源的工具,网站http://david.abcc.ncifcrf.gov提供来自基因组研究的大量基因列表的功能解释。使用david对mir135hg这个长非编码rna共表达基因进行go分析,结果如表2所示。表2:mir135hg的通路富集分析结果从表2可知,长非编码mir135hg相关通路富集分析显示其与循环系统发育,心脏发育及血管发育等相关的蛋白有密切相关性。下面结合实验,进一步说明本发明的技术方案。发明人通过rna-seq测序,在心血管标本中,验证了mir135hg高表达,而且相关的心血管蛋白,也同时高表达,相关性非常显著(p<0.0001)。具体的实验操作和结果如下:样品提取总rna后,要选择质量合格的totalrna作为mrna测序的建库起始样品,其质量要求通过agilent2100bioanalyzer检测结果rin≥7,28s和18s的rna的比值大于或等于1.5:1,起始量的要求范围是0.1∽1ug。用qubitrnaassaykit对起始的totalrna进行准确定量。对于真核生物,用带有oligo(dt)的磁珠富集mrna,向得到的mrna中加入fragmentationbuffer使其片断成为短片段,再以片断后的mrna为模板,用六碱基随机引物(randomhexamers)合成cdna第一链,并加入缓冲液、dntps、rnaseh和dnapolymerasei合成cdna第二链,经过qiaquickpcr试剂盒纯化并加eb缓冲液洗脱经末端修复、加碱基a,加测序接头,再经琼脂糖凝胶电泳回收目的大小片段,并进行pcr扩增,从而完成整个文库制备工作,构建好的文库用illuminahiseq进行测序。1)样品提取总rna后,过柱纯化,保留200nt以上的rna;2)富集mrna,并用二价阳离子高温加热的方法将mrna片断化;3)以mrna短片段为模板,用六碱基随机引物反转录合成双链cdna;4)经纯化、末端修复、加碱基a、加测序接头的步骤,根据测序长度和是否做对读测序,确定琼脂糖凝胶电泳回收片段的大小,并进行pcr扩增,完成测序文库的制备;5)构建好的文库经cbot扩增,用illuminahiseq进行测序。rna-seq测序实验表明mir135hg在心脏组织中高表达,本项目利用rna-seq测序与生物信息数据分析流程,利用基因表达量(fragmentperkilometer,fpkm)的计算方法,分析人体心血管组织标本的rna-seq高通量测序数据,其中长非编码rna基因mir135hg在心血管等相关组织内高表达。从rna-seq测序结果,发明人找出mir135hg相关的调控基因群,将表达量与mir135hg有正相关的关系的基因,通过correlation函数,发现mir143hg与myh11的在心脏组织的相关性高,376个gtex国际项目的心脏组织rna-seq测序标本验证,pearson相关系数是0.6911,p-值=1.09e-54,显示出两个基因相关性有非常显著的统计学意义(图2)。通过对这个基因群的go与kegg通路的富集分析,成功预测长非编码mir135hg相关的靶基因以及调控心血管蛋白网络的分子功能,建立了这个心血管基因群的长非编码mir135hg与相关基因群的蛋白调控网络。可以合理预见:通过定量mir135hg表达量,可以很好地对心血管系统疾病检测或筛查;调降mir135hg表达量对心血管系统疾病的治疗具有积极意义;抑制mir135hg表达产物活性的化合物或试剂对心血管系统疾病的治疗具有积极意义;心血管系统疾病包括但不限于扩张性心肌病、肥厚型心肌病、遗传性心脏病、心血管老年性退行性病变、高血压病、冠心病、急性心肌梗死、心律失常、心脏瓣膜病、先天性心脏病、主动脉疾病、心力衰竭。通过检测化合物对mir135hg或其同源基因、或表达产物表达量的影响,可以很好地减少心血管系统疾病,特别是扩张性心肌病、肥厚型心肌病、遗传性心脏病、心血管衰老性损伤、高血压病、冠心病、急性心肌梗死、心律失常、心脏瓣膜病、先天性心脏病、主动脉疾病、心力衰竭等心血管系统疾病药物筛选的工作量,大幅降低药物筛选的成本。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1