一种适用于基因芯片的倍数法差异基因筛选控制方法

文档序号:587546阅读:1298来源:国知局
专利名称:一种适用于基因芯片的倍数法差异基因筛选控制方法
技术领域
本发明属于生物技术领域,涉及基因芯片差异基因筛选控制方法。
背景技术
基因芯片,其基本原理是将指大量寡核苷酸分子固定于支持物上,然后与标记的 样品进行杂交,通过检测杂交信号的强弱进而判断样品中靶分子的数量。基因芯片集成了 探针固相原位合成技术、照相平板印刷技术、高分子合成技术、精密控制技术和激光共聚焦 显微技术,使得合成、固定高密度的数以万计的探针分子以及对杂交信号进行实时、灵敏、 准确的检测分析变得切实可行。基因芯片技术在分子生物学研究领域、医学临床检验领域、 生物制药领域和环境医学领域显示出了强大的生命力,其中关键就是基因芯片具有微型 化、集约化和标准化的特点,从而实现快速高通量基因检测的愿望。正如电子管电路向晶体 管电路和集成电路发展所经历的那样,核酸杂交技术的集成化也已经和正在使分子生物学 技术发生着一场革命。倍数法是筛选差异基因最为常用的方法。一般倍数大于2倍的基因就认为是差异 表达基因。然而倍数法缺乏统计学的支持。

发明内容
为了克服已有基于倍数法差异基因筛选方法的缺乏统计学支持、结果可靠性差、 假阳性率较高的不足,本发明提供一种利用概率原理、结构更加可靠、有效降低假阳性率的 用于基因芯片的倍数法差异基因筛选控制方法。本发明解决其技术问题所采用的技术方案是一种用于基因芯片的倍数法差异基因筛选控制方法,包括如下步骤步骤一获取基因表达谱数据;步骤二 计算每个基因的倍数差异值,如倍数差异值大于预设倍数,判定为差异基 因;步骤三对倍数值进行对数变换;步骤四进行正态变换,计算ζ值,其计算公式为
Ση Σ ^
Xi (χ-^L)2
°η\ η其中,Xi为第i个基因的表达值,η为芯片基因总数,μ为基因表达的平均值,δ 为标准差,Zi即是每个基因转换后的ζ值;步骤五对Zi值进行ζ检验,用标准正态分布的理论来推断差异发生的概率ρ,筛 选P < 0. 01的基因为差异表达基因,即该基因表达没有变化发生的概率小于0. 01。
其中,Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。 它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显
-frh-
者O作为优选的一种方案所述筛选控制方法还包括以下步骤步骤六对于感兴趣 的基因进行实验验证。进一步,所述步骤三中,取2为底的对数。再进一步,所述步骤五中,ζ检验的计算过程首先,将基因表达值Zi进行变换,使之符合正态分布,然后利用正态分布计算每个 基因表达没有变化的概率P,筛选P < 0. 01的基因为差异表达基因,即该基因表达没有变化 发生的概率小于0. 01,亦即基因有显著变化。更进一步,所述步骤六中,采用实时定量聚合酶链式反应对步骤五得出的差异基 因验证。当然,也可以选择其他验证方式。所述步骤二中,预设倍数为1. 5倍。当然,也可以选择其他倍数。本发明的技术构思为在倍数法的基础上进行改良,经过数据变换,最终使之符合 正态分布,然后根据概率原理筛选差异表达基因。本发明根据统计学原理,从基因表达谱的倍数值出发,进行数值变换和统计分析, 从而筛选差异表达基因的生物信息学方法,可直接用于筛选高可信度的筛选差异表达基 因,以便于进一步的生物学实验验证。本发明的有益效果主要表现在利用统计学方法对倍数法结果进行了修正,进行 差异基因筛选。与倍数法相比,差异基因筛选结果更为可靠,能有效地降低假阳性率,从而 有利于芯片后续的数据分析以及实验验证。


图1是用于基因芯片的倍数法差异基因筛选控制方法的流程图。图2是数据分析结果示意图,其中,圆圈标记的是ρ < 0. 01的基因,虚线表示的是 1. 5倍差异线)。图3是采用实时定量聚合酶链式反应(real-time RT-PCR)对差异基因进行的验 证结果示意图。
具体实施例方式下面结合附图对本发明作进一步描述。参照图1 图3,一种用于基因芯片的倍数法差异基因筛选控制方法,包括如下步 骤步骤一获取基因表达谱数据;步骤二 计算每个基因的倍数差异值,如倍数差异值大于预设倍数,判定为差异基 因;步骤三对倍数值进行对数变换;步骤四进行正态变换,计算ζ值,其计算公式为
权利要求
1. 一种用于基因芯片的倍数法差异基因筛选控制方法,包括如下步骤 步骤一获取基因表达谱数据;步骤二 计算每个基因的倍数差异值,如倍数差异值大于预设倍数,判定为差异基因; 其特征在于所述筛选控制方法还包括以下步骤 步骤三对倍数值进行对数变换; 步骤四进行正态变换,计算Z值,其计算公式为其中,Xi为第i个基因的表达值, 为芯片基因总数,μ为基因表达的平均值,δ为标准差,A即是每个基因转换后的ζ值;步骤五对6值进行ζ检验,用标准正态分布的理论来推断差异发生的概率P,筛选 Ρ<0. 01的基因为差异表达基因,即该基因表达没有变化发生的概率小于0. 01。
2.如权利要求1所述的用于基因芯片的倍数法差异基因筛选控制方法,其特征在于 所述筛选控制方法还包括以下步骤步骤六对于感兴趣的基因进行实验验证。
3.如权利要求1或2所述的用于基因芯片的倍数法差异基因筛选控制方法,其特征在 于所述步骤三中,取2为底的对数。
4.如权利要求1或2所述的用于基因芯片的倍数法差异基因筛选控制方法,其特征在 于所述步骤五中,ζ检验的计算过程首先,将基因表达值进行变换,使之符合正态分布,然后利用正态分布计算每个基因表达没有变化的概率P ;筛选Ρ<0. 01的基因为差异表达基因。
5.如权利要求2所述的用于基因芯片的倍数法差异基因筛选控制方法,其特征在于 所述步骤六中,采用实时定量聚合酶链式反应对步骤五得出的差异基因验证。
6.如权利要求1或2所述的用于基因芯片的倍数法差异基因筛选控制方法,其特征在 于所述步骤二中,预设倍数为1.5倍。
全文摘要
一种用于基因芯片的倍数法差异基因筛选控制方法,包括如下步骤步骤一获取基因表达谱数据;步骤二计算每个基因的倍数差异值,如倍数差异值大于预设倍数,判定为差异基因;步骤三对倍数值进行对数变换;步骤四进行正态变换,计算z值;步骤五对值进行z检验,用标准正态分布的理论来推断差异发生的概率p,筛选p<0.01的基因为差异表达基因。本发明利用概率原理、结构更加可靠、有效降低假阳性率。
文档编号C12Q1/68GK102080129SQ201010572058
公开日2011年6月1日 申请日期2010年12月1日 优先权日2010年12月1日
发明者吴剑丙, 王慧中, 钱永生, 陈喆 申请人:杭州师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1