一种验证顺式作用基因表达数量性状基因座真实性的方法

文档序号:403725阅读:801来源:国知局
专利名称:一种验证顺式作用基因表达数量性状基因座真实性的方法
技术领域
本发明涉及遗传基因组学、生物信息学、分子生物学等多个领域,是一种顺式作用基因表达数量性状基因座真实性验证的方法。
背景技术
近年来,随着人类及一系列模式生物全基因组测序工作相继完成,阐明基因互作 网络、调控网络及代谢网络的生物学功能,成为后基因组时代(post genome era)的生物 学研究的重点及热点。一直以来,基因组学研究和经典数量遗传学的研究互不渗透,独立 进行,使用各自的研究设计方案、试验材料及分析工具。最近,有学者提出遗传基因组学 (genetical genomics)的概念,将数量性状基因座(quantitative trait loci,QTL)定位 和基因表达(expression)分析联合运用,即基因表达数量性状基因座(Expression QTL, eQTL)分析技术。通过定位基因组中控制某基因表达的基因座,寻找出控制某基因表达的 上游调控位点,挖掘受该基因调节的下游基因以及与该基因协同作用的其他基因,建立基 因表达调控网络,从而深入地揭示复杂性状的分子机理和调控网络。eQTL分析综合运用了 多门学科的研究方法,如分子生物学、生物信息学、生物统计学、基因组学与遗传学等。借 助eQTL分析,我们既可以通过基因芯片技术了解大多数基因表达的差异,同时又可以借助 于QTL定位技术找到控制这些基因表达差异的上游基因位点。这种方法的优点在于能同时 在某一时间、某一部位的两个层次上分析基因表达和控制基因表达的情况,达到系统了解 基因转录的上游调控机制,最终构架基因表达网络模型的目的。因此这一技术比以往研究 单个基因表达调控的效率高得多,能系统的反映基因表达及表达所受调控两个水平上的变 化。通过基因表达数量性状基因座定位的方法能对基因组的几万个转录子同时进行 eQTL分析,转录子与传统意义上的表型不同,每个转录子在基因组上的相应位置是已知的, 因此,可根据eQTL定位到的区间与转录子在染色体上的相对位置,将eQTL分为顺式作用 eQTL(cis-eQTL)和反式作用eQTL(trans_eQTL)若eQTL被定位到基因自身所在的区域 则为顺式作用,一般我们将定位在自身基因所在位置士 5Mb以内的eQTL称为cis-eQTL, cis-eQTL的候选基因即为基因自身,也就是说往往认为引起该表达变异的基因就是其本 身;反之,若被定位到基因自身所在基因组位置以外的其他区域,即不同染色体或相同染色 体的不同区间(通常大于20Mb),反式作用一般是通过改变基因的编码序列,从而引起蛋白 结构的改变,最终影响定位转录子的基因表达差异,反式作用也可能是转录因子通过其它 某种途径发挥的作用。基因芯片技术是目前获得大批量基因表达资料的主要手段,是遗传基因组学分析 中不可获缺的工具。探针与靶序列的特异性结合是基因芯片技术的核心,因而任何改变探 针杂交亲和力的因素都会对芯片检测结果产生较大的影响。有关探针靶序列的多态性改变 探针亲和力,降低检测信号的灵敏度和准确性,从而导致假阳性结果的产生的现象已引起 研究者的高度重视。Benovoy等人提出‘masking’ probes的方案,即剔除所有目的区含有已知多态性位点(HapMap phase II SNPs)的探针,应用其余探针进行表达量的检测。但这种做法在降低假阳性检出率的同时,以牺牲信息量为代价,‘masking’ probes后,会有部分 序列根本得不到检测。SNP在基因组中广泛存在,目前利用多种手段发现小鼠C57BL/6J和DBA/2J两个品 系之间存在1400多万个SNPs。在基因组DNA中,位于编码区内的SNP (coding SNP, cSNP) 比较少,因为外显子的变异率仅为其它序列的1/5,SNP更可能出现在非编码序列中,包括 启动子、内含子和基因间的序列。调控序列主要分布在非编码区域,因此这部分序列的变异 可能会造成表达的改变。但是如果序列的多态性(如SNP,INDEL)发生在探针序列上,则会 导致假阳性cis-eQTL的产生。为了研究SNP对eQTL分析,尤其是对cis-eQTL定位结果的 影响,我们对探针不同位置上的SNP引起的假阳性率进行了评估,结果表明在探针中心位 置的SNP对eQTL的定位影响远大于位于探针未端的SNP。有关如何大批量分析cis-eQTL 的真实性的方法,目前国内外还无相关报道,如何高效而准确地判断cis-eQTL的真假是本 发明的关键所在。

发明内容
本发明的目的在于提供一种高效而又准确地验证顺式作用基因表达数量性状基 因座真实性的方法。本发明的技术解决方案是一种验证顺式作用基因表达数量性状基因座真实性的方法,其特征是包括下列 步骤(1)结合基因表达资料和基因型数据,借助BXD的基因重组近交系小鼠进行基因 表达数量性状基因座定位的初步的分析,筛选出具有统计学意义的上游调控位点,并根据 所定位到的eQTL的位置进行初步判断,eQTL所在位置与基因自身所在位置相距5Mb范围 以内的被初步认定为顺式作用基因表达数量性状基因座;(2)通过RT-PCR实验或ABA原位杂交分析,验证基因芯片资料的准确性;(3)分析两亲本C57BL/6J(B6)和DBA/2J(D2)间的基因表达差异,剔除差异表达无 统计学意义的基因;(4)借助于Celera、Perlegen以及田纳西州大学SNP数据库,分析探针靶序列的 多态性,剔除靶序列上存在B6和D2间的多态性序列的基因;(5)进行等位基因特异性表达分析,检测Fl代小鼠(B6D2F1或D2B6F1)中两等位 基因(B和D)的表达差异,若两等位基因B和D表达具有显著差异则为真性cis-eQTL。步骤(2)的具体方法是应用基因芯片技术获取BXD基因重组近交系小鼠各部 分组织(如海马、中脑、前脑、眼、肝、肺等组织)的基因表达资料,并通过ABA原位杂交或者 RT-PCR的方法验证基因芯片资料的准确性。步骤⑴中基因型数据的获得方法是使用Mit(MicrosateIlites)及SNP(Single Nucleotide Polymorphism)分子遗传标志(geneticalmarkers)对BXD的基因重组近交系 小鼠进行全基因组扫描,获得BXD的基因重组近交系小鼠的基因型数据。本发明可以高效而又准确的验证cis-eQTL真实性。我们可借助于B6、D2互交系Fl代小鼠进行等位基因特异性表达(allelespecific expression difference, ASE)分析,即结合 RT-PCR 和 SNaPshot (Applied Biosystems)技术,分析B、D等位基因在B6D2F1 (或D2B6F1)中的表达差异,以判断所定 位到的cis-eQTL的真实性。我们知道,两亲本B6、D2小鼠都为近交系小鼠,因此检测等位 基因在Fl代中的表达就等同于同时检测其在两亲本中的表达量。理论上,如果某基因的 cis-eQTL为真性cis-eQTL,那么在相同遗传背景和环境因素影响下,其Fl代等位基因的表 达量的比值则应该偏离1 1 ;相应的,若某基因的eQTL为trans-eQTL,其Fl代等位基因 的表达量的比值则应该为1 1,因为在相同的遗传背景条件下,一个反式作用因子对两个 等位基因的作用应该是等同的。SNapshot是一种单碱基延伸技术,其开发的初衷主要是针 对中等通量的SNP分型的研究。在一个含有测序酶,四种荧光标记的ddNTP,紧挨多态位点 5’端 的不同长度延伸引物和PCR产物模板的反应体系中,引物延伸一个碱基即终止,经ABI 测序仪分析后,根据峰的颜色可知掺入的碱基种类,从而确定该样本的基因型。cis-eQTL真 实性的确定对后续研究如候选基因的挖掘、下游调控基因的筛选等工作具有很重要的意 义。下面结合实施例对本发明作进一步说明。
具体实施例方式一种验证顺式作用基因表达数量性状基因座真实性的方法,其特征是包括下列 步骤(1)结合基因表达资料和基因型数据,借助BXD的基因重组近交系小鼠 (Recombinant Inbred, RI)进行基因表达数量性状基因座定位的初步的分析,筛选出具有 统计学意义的上游调控位点,并根据所定位到的eQTL的位置进行初步判断,eQTL所在位置 与基因自身所在位置相距5Mb范围以内的被初步认定为顺式作用基因表达数量性状基因 座;(2)通过RT-PCR实验或ABA原位杂交分析,验证基因芯片资料的准确性;(3)分析两亲本C57BL/6J(B6)和DBA/2J(D2)间的基因表达差异,剔除差异表达无 统计学意义的基因;(4)借助于Celera、Perlegen以及田纳西州大学SNP数据库,分析探针靶序列的 多态性,剔除靶序列上存在B6和D2间的多态性序列的基因;(5)进行等位基因特异性表达分析,检测Fl代小鼠(B6D2F1或D2B6F1)中两等位 基因(B和D)的表达差异,若两等位基因B和D表达具有显著差异则为真性cis-eQTL。步骤(2)的具体方法是应用基因芯片技术获取BXD基因重组近交系小鼠各部 分组织(如海马、中脑、前脑、眼、肝、肺等组织)的基因表达资料,并通过ABA原位杂交或者 RT-PCR的方法验证基因芯片资料的准确性。步骤(1)中基因型数据的获得方法是使用Mit(MicrosateIlites)及SNP(Single Nucleotide Polymorphism)分子遗传标志(geneticalmarkers)对BXD的基因重组近交系 小鼠进行全基因组扫描,获得BXD的基因重组近交系小鼠的基因型数据。
权利要求
一种验证顺式作用基因表达数量性状基因座真实性的方法,其特征是包括下列步骤(1)结合基因表达资料和基因型数据,借助B×D的基因重组近交系小鼠进行基因表达数量性状基因座定位的初步的分析,筛选出具有统计学意义的上游调控位点,并根据所定位到的eQTL的位置进行初步判断,eQTL所在位置与基因自身所在位置相距5Mb范围以内的被初步认定为顺式作用基因表达数量性状基因座;(2)通过RT-PCR实验或ABA原位杂交分析,验证基因芯片资料的准确性;(3)分析两亲本间的表达差异,剔除差异表达无统计学意义的基因;(4)分析探针靶序列的多态性,剔除靶序列上存在B6和D2间的多态性序列的基因;(5)进行等位基因特异性表达分析,若两等位基因B和D表达具有显著差异则为真性cis-eQTL。
2.根据权利要求1所述的验证顺式作用基因表达数量性状基因座真实性的方法,其特 征是步骤(2)的具体方法是应用基因芯片技术获取BXD基因重组近交系小鼠各部分组 织的基因表达资料,并通过ABA原位杂交或者RT-PCR的方法验证基因芯片资料的准确性。
3.根据权利要求1或2所述的验证顺式作用基因表达数量性状基因座真实性的方法, 其特征是步骤(1)中基因型数据的获得方法是使用Mit及SNP分子遗传标志对BXD的 基因重组近交系小鼠进行全基因组扫描,获得BXD的基因重组近交系小鼠的基因型数据。
4.根据权利要求1或2所述的验证顺式作用基因表达数量性状基因座真实性的方法, 其特征是分析探针靶序列的多态性,是借助于CelenPerlegen以及田纳西州大学SNP数 据库,分析探针靶序列的多态性,剔除靶序列上存在B6和D2间的多态性序列的基因。
5.根据权利要求1或2所述的验证顺式作用基因表达数量性状基因座真实性的方法, 其特征是进行等位基因特异性表达分析是检测Fl代小鼠B6D2F1或D2B6F1中两等位基因 B和D的表达差异,若两等位基因B和D表达具有显著差异则为真性cis-eQTL。
全文摘要
本发明公开了一种高效而准确地验证顺式作用基因表达数量性状基因座真实性的方法。综合生物信息学分析和分子生物学技术,逐步剔除假阳性cis-eQTL剔除两亲本间表达差异无显著统计学基因的基因;剔除探针靶序列在B6和D2间存在多态性的基因;运用RT-PCR技术或ABA原位杂交分析的方法验证基因芯片资料的准确性;进行等位基因特异性表达分析,若两等位基因表达具有显著差异则认为是真性cis-eQTL。本发明可以高效而又准确的验证cis-eQTL真实性。
文档编号C12Q1/68GK101818201SQ20101015014
公开日2010年9月1日 申请日期2010年4月9日 优先权日2010年4月9日
发明者陆璐, 陈颖 申请人:南通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1