一种筛选时间点芯片差异基因的方法

文档序号:584704阅读:499来源:国知局
专利名称:一种筛选时间点芯片差异基因的方法
技术领域
本发明属于生物技术领域,涉及一种筛选时间点芯片差异基因的方法
背景技术
基因芯片是一种固定有寡核苷酸、基因组DNA或互补DNA (脱氧核糖核酸)等的生物芯片,可用于生物学研究中对样品基因表达谱的生物学信息进行快速定性和定量分析。 随着人类基因组计划的成功完成以及生物学基因研究的迅猛发展,越来越多的动植物、微生物基因组序列得以测定,基因序列数据以前所未有的速度迅速增长,面对如此海量的数据,其处理和分析成为科研中的一大难题。基因芯片技术正是在这种科学发展要求下产生的,并为各种生物基因的研究提供了光辉的前景。基因芯片的原理是将大量(通常每平方厘米点阵密度高于400)探针分子固定于支持物上后与标记的样品分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息。在生物医学研究中,有一类常用的基因芯片叫做时间点芯片, 和其他基因芯片不同的是它的取样方法。时间点芯片一般将实验开始时的基因芯片(即时间点为0时的样本芯片)做为对照芯片,然后对样本进行处理后,在每个特定的时间点(如处理后5分钟、1小时、12小时、1天等)取一次样本,做为各个时间点的样本芯片。对各个样本芯片和对照芯片的数据进行处理后,便可得到所研究基因的时间点表达谱。时间点芯片数据图谱反映了样品中基因在不同时间时的表达情况,通过将不同时间点的样本芯片基因表达数据与对照芯片基因表达数据进行比较,筛选各个时间点表达数据有差异的基因,以此筛选出样品中差异表达的基因。根据样本的不同以及处理标准的不同,时间点芯片筛选差异基因的方法也不同, 本发明设计了一套方法,用于时间点芯片的差异基因的筛选中,以尽可能真实、准确地筛选出差异表达的基因。

发明内容
本发明专利所设计的方法适用于时间点基因芯片差异基因的筛选,为了方便而清楚的描述本方法,本方法将对时间点芯片实验及数据分析中的部分名词进行如下定义UP-call 基因芯片中某一个基因的表达信号值,可以代表该基因的的表达量。2、Ρ(Α、Μ)根据芯片中基因表达信号值的强弱可以对信号值进行分类,信号值高的记做P,即有效检测基因;信号值低的记做Α,即无效检测基因;少量居于中间的记为Μ。3, Fold change 在某个特定时间点,样本芯片的表达信号与对照芯片的表达信号的比值。用于判断该时间点时,基因表达是否有差异。本方法的基本实施流程为步骤1、对芯片数据进行预处理步骤2、设置差异基因筛选参数步骤3、应用步骤2中参数对基因芯片数据进行筛选
步骤4、差异基因的统计


图1、本发明专利所述方法的实施流程图实施方式本发明专利设计了一种针对于时间点芯片筛选差异基因的方法,下面介绍本方法的具体实施步骤步骤1、芯片数据预处理。这里的芯片数据可以来自于芯片实验的结果,运用R语言工具(http://cran.r-project.org)将基因的绝对表达值转换成与对照的比值。为了降低倍数失真,我们将小于100的绝对表达值被赋予100。步骤2、设置差异基因的筛选参数。对于同时满足以下两个条件的基因,本方法认为是差异基因。条件一、该基因的对照P-call值(即该基因位于0时间点时的表达值)为P,或者 N个时间点中有N/2个时间点的P-call值为P (N为时间点个数,N/2取整数值)。条件二、该基因N个时间点中至少有N/2个时间点的R)ld Change值大于1. 5或者小于0. 67。步骤3、利用R语言工具包,依据步骤2中设置的参数对步骤1中预处理好的芯片数据进行处理,筛选出差异表达基因,导出结果。步骤4、统计分析两类时间点芯片差异基因的筛选结果,整理成列表,以用作后续分析的依据。以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。
权利要求
1.本发明专利所述的一种筛选时间点芯片差异基因的方法,它对如下几个名词进行了定义(1)>P-call基因芯片中某一个基因的表达信号值,可以代表该基因的的表达量。(2)、Ρ(Α、Μ)根据芯片中基因表达信号值的强弱可以对信号值进行分类,信号值高的记做P,即有效检测基因;信号值低的记做Α,即无效检测基因;少量居于中间的记为Μ。(3),Foldchange 在某个特定时间点,样本芯片的表达信号与对照芯片的表达信号的比值。用于判断该时间点时,基因表达是否有差异。该方法包括如下几步主要步骤步骤1、对芯片数据进行预处理步骤2、设置差异基因筛选参数步骤3、应用步骤2中参数对基因芯片数据进行筛选步骤4、差异基因的统计。
全文摘要
本发明设计了一种筛选差异基因的方法,适用于时间点基因芯片的数据分析中。该方法尽可能真实、准确地筛选出差异表达基因,它包括几步主要步骤步骤1、对芯片数据进行预处理;步骤2、设置差异基因筛选参数;步骤3、应用步骤2中参数对基因芯片数据进行筛选;步骤4、差异基因的统计。
文档编号C12Q1/68GK102206700SQ20101022709
公开日2011年10月5日 申请日期2010年7月14日 优先权日2010年7月14日
发明者曾华宗 申请人:上海聚类生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1