植物抗旱基因模块发掘方法

文档序号:9524430阅读:347来源:国知局
植物抗旱基因模块发掘方法
【技术领域】
[0001] 本发明设及生物技术,尤其设及一种植物抗旱基因模块发掘方法。
【背景技术】
[0002] 植物在生长过程中会遭遇到各种各样的自然环境,其中有些自然灾害常造成作物 大量减产,如干旱、滞溃和病虫害等。运些环境胁迫给农业生产带来的危害是世界性的,尤 其是干旱造成的危害非常严重,可使作物减产50% -80%。因此提高作物对干旱缺水的耐 受性是农业科学技术研究的重要目标之一。当前一个重要的手段是利用抗旱相关基因对农 作物进行基因工程改造,W获得抗旱作物新品种。
[0003] 植物适应干旱环境的机制十分复杂,是众多基因/途径相互作用形成复杂网络综 合调控的结果。植物在遭受干旱胁迫后,通过信号感知与一系列复杂的信号转导并激活特 定转录调控因子,进而调控下游功能基因的表达,启动相应的生理生化等适应性反应来降 低或消除缺水给植物带来的危害。运些基因调控网络之间,既相互独立,又紧密联系,共同 组成了一个复杂的植物响应干旱胁迫的基因网络。为此,单一或少数几个抗旱相关基因的 功能解析,无法系统了解植物抗旱分子机制,况且利用单一抗旱相关基因对农作物进行基 因工程改造也被证明作用有限。

【发明内容】

[0004] 本发明的目的,就是为了解决上述问题,提供一种植物抗旱基因模块发掘方法。 阳〇化]为了达到上述目的,本发明采用了W下技术方案:一种植物抗旱基因模块发掘方 法,包括如下步骤:
[0006] 步骤1、从BioGRID、IntAct、DIP、MINT及STRING数据库中收集基因互作数据,并 分离目标植物的互作数据,建立相应的数据库。
[0007] 步骤2、采用马尔可夫模型的聚类算法MCL对基因网络进行模块化分析,利用Gene 化tology数据对MCL算法的不同inflation参数条件下模炔基因的功能相似性进行评估, 确定模炔基因功能相似性得分最高时的inflation参数。
[0008] 步骤 3、从NCBI(ht1:p://www.ncbi.nlm.nih.gov/)的GE0 数据库W及 邸I(ht1:p://www.ebi.ac.址/)的ArrayExpress数据库中下载获得目标植物受干旱胁迫 的基因忍片数据,用RMAExpress软件对忍片数据进行均一化,采用SAM软件包化ttp:// statweb.Stan化rd.e化/~tibs/SAM/)计算目标植物的干旱胁迫应答基因。利用采用累积 超几何分布对基因模块富含干旱胁迫应答基因进行显著性分析。具体计算公式如下:
[0009]
[0010] 其中,N为整个互作网络所包含基因数,Μ为互作网络所包含含干旱胁迫应答基因 数,κ为目标基因模块所包含基因数,X为目标基因模块所包含干旱胁迫应答基因数。
[0011] 步骤4、从Gramene(http: //www.gramene.org/)数据库下载与目标植物抗旱相关 的全基因组关联数据,而后对各材料的抗旱表型数据进行随机置换,用tassel软件的MLM 模型计算各SNP的P值,然后统计各基因模块中与抗旱性显著关联(p<0. 05)的SNP比例, 共进行9999次置换检验,分析基因模块与抗旱性之间的关联程度。
[0012] 步骤5、对基因模块富含干旱胁迫应答基因的概率由小到大进行排序。同样,对基 因模块与抗旱性之间的关联程度也由小到大进行排序。根据基因模块两类排名的几何平均 值计算基因模块的抗旱作用大小,并W此筛选关键抗旱基因模块。具体计算公式如下:
[0013]
[0014] 其中,Sde。为富含干旱胁迫应答基因的概率排名,S 为与抗旱性之间的关联程度 排名。
[0015] 本发明采用马尔可夫聚类算法对基因互作网络进行模块化分析,并利用基因忍片 与全基因组关联数据对基因模块的抗旱作用大小进行评估。根据各个基因模块的抗旱贡献 大小,筛选关键抗旱基因模块。与现有方法相比,本发明侧重于全新抗旱基因群的发现,极 大地提高了植物抗旱基因发掘的效率与准确性。
【附图说明】
[0016] 图1为本发明构建植物蛋白质互作网络方法的流程图。
[0017] 图2为基因模块与抗旱性之间的关联程度。
[0018] 图3为水稻关键抗旱基因模块的网络分布情况。
【具体实施方式】
[0019] 下面W水稻抗旱模块发掘为例,参照图1,具体说明本发明构建植物蛋白质互作网 络方法的具体实施步骤。
[0020] 步骤1、从BioGRID、IntAct、DIP、MINT及STRING数据库中收集基因互作数据,并 分离水稻基因互作数据,建立相应的数据库。
[0021] 步骤2、基因网络模块分析。采用马尔可夫模型的聚类算法MCL对基因网络进行 模块分析,该算法的inflation参数的选择对于基因网络的功能模块分析非常关键。利用 Gene化tology数据重新对不同inflation参数条件下基因的功能相似性进行评估,确定 inflation参数为1. 8时能最优好体现模块的生物学意义。
[0022] 步骤3、从NCBI(ht1:p://www.ncbi.nlm.nih.gov/)的GE0数据库W及邸I WWW.ebi.ac.址/)的ArrayExpress数据库中下载获得目标植物受干旱胁迫的基因忍片数 据,共12组实验,具体数据库登录号为GSE6901、GSE24048、G沈24048、GSE26280、G沈26280、 G沈26280、G沈26280、G沈26280、G沈26280、G沈23211U及E-MEXP-2401 与E-MEXP-2401, 用RMAExpress软件对忍片数据进行均一化,采用SAM软件包化ttp://statweb.stan化rd. e化/~tibs/SAM/)计算分别计算水稻干旱胁迫应答基因,共鉴定11,605基因在干旱条件 其表达水平发生了显著变化。
[0023] 利用采用累积超几何分布对步骤2中所获得28个基因模块(模块包含至少30个 节点基因)进行富含干旱胁迫应答基因分析。累积超几何分布公式如下:
[0024]
[00巧]其中,N为整个互作网络所包含基因数,Μ为互作网络所包含干旱胁迫应答基因 数,Κ为目标基因模块所包含基因数,X为目标基因模块所包含干旱胁迫应答基因数。
[0026] 步骤4、从Gramene(ht化://www.gramene.org/)数据库下载与水稻抗旱相关的全 基因组关联数据,而后对374个水稻材料的抗旱表型数据进行随机置换,用tassel软件的 MLM模型计算各SNP的P值,然后统计各基因模块中与抗旱性显著关联(p<0. 05)的SNP比 例,共进行9999次置换检验,分析步骤2中所获得28个基因模块(模块包含至少30个节 点基因)与抗旱性之间的关联程度,具体结果如图2所示。
[0027] 步骤5、对基因模块富含干旱胁迫应答基因的概率由小到大进行排序。同样,对 基因模块与抗旱性之间的关联程度也由小到大进行排序。根据基因模块两类排名的几何 平均值计算基因模块的抗旱作用大小,并W此筛选关键抗旱基因模块。计算公式如下:
Seet;为富含干旱胁迫应答基因的概率排名,为与抗旱性之间的关 联程度排名。通过计算,编号为7的基因模块为所发掘的水稻抗旱基因模块,该基因模块在 互作网路中的分布如图3所示。
[0028] W上分析步骤同样适用于其他植物基于基因网络的抗旱模块发掘。W上是对本发 明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。
【主权项】
1. 一种植物抗旱基因模块发掘方法,其特征在于:包括以下步骤: 一、 分离并建立目标植物的基因互作数据库; 二、 利用马尔可夫聚类算法对基因互作网络进行模块化分析,并对基因模块的生物学 意义进彳丁评估; 三、 利用基因芯片数据鉴定目标植物的干旱胁迫应答基因,采用累积超几何分布对基 因模块富含干旱胁迫应答基因进行显著性分析; 四、 利用全基因组关联数据分析基因模块与抗旱性之间的关联程度; 五、 根据基因模块两类排名的几何平均值计算基因模块的抗旱作用大小,并以此筛选 关键抗旱基因模块。2. 如权利要求1所述的植物抗旱基因模块发掘方法,其特征在于:步骤一的具体做法 是,从BioGRID、IntAct、DIP、MINT及STRING数据库中收集基因互作数据,并分离目标植物 的互作数据,建立相应的数据库。3. 如权利要求1所述的植物抗旱基因模块发掘方法,其特征在于:步骤二的具体做法 是,采用马尔可夫模型的聚类算法MCL对基因网络进行模块化分析,利用Gene Ontology数 据对MCL算法的不同inflation参数条件下模炔基因的功能相似性进行评估,确定模炔基 因功能相似性得分最高时的inflation参数。4. 如权利要求1所述的植物抗旱基因模块发掘方法,其特征在于:步骤三的具体做法 是,从NCBI的GE0数据库以及EBI的ArrayExpress数据库中下载获得目标植物受干旱胁 迫的基因芯片数据,用RMAExpress软件对芯片数据进行均一化,采用SAM软件包计算目标 植物的干旱胁迫应答基因;利用采用累积超几何分布对基因模块富含干旱胁迫应答基因进 行显著性分析;具体计算公式如下:其中,N为整个互作网络所包含基因数,Μ为互作网络所包含的干旱胁迫应答基因数,K 为目标基因模块所包含的基因数,X为目标基因模块所包含的干旱胁迫应答基因数。5. 如权利要求1所述的植物抗旱基因模块发掘方法,其特征在于:步骤四的具体做法 是,从Gramene数据库下载与目标植物抗旱相关的全基因组关联数据,而后对各材料的抗 旱表型数据进行随机置换,用tassel软件的MLM模型计算各SNP的p值,然后统计各基因 模块中与抗旱性显著关联的SNP比例,共进行9999次置换检验,分析基因模块与抗旱性之 间的关联程度。6. 如权利要求1所述的植物抗旱基因模块发掘方法,其特征在于:步骤五的具体做法 是,对基因模块富含干旱胁迫应答基因的概率由小到大进行排序。同样,对基因模块与抗旱 性之间的关联程度也由小到大进行排序。根据基因模块两类排名的几何平均值计算基因模 块的抗旱作用大小,并以此筛选关键抗旱基因模块。具体计算公式如下:其中,为富含干旱胁迫应答基因的概率排名,为与抗旱性之间的关联程度排名。7.如权利要求5所述的植物抗旱基因模块发掘方法,其特征在于:所述与抗旱性显著 关联是指P〈〇. 05。
【专利摘要】一种植物抗旱基因模块发掘方法,该方法基于基因相互作用网络,采用马尔可夫聚类算法对基因互作网络进行模块化分析,并利用基因芯片与全基因组关联数据对基因模块的抗旱作用大小进行评估。根据各个基因模块的抗旱贡献大小,筛选关键抗旱基因模块。与现有方法相比,该方法侧重于全新抗旱基因群的发现,极大地提高了植物抗旱基因发掘的效率与准确性。
【IPC分类】G06F19/18, G06F19/24
【公开号】CN105279396
【申请号】CN201510697716
【发明人】张利达, 刘奕慧, 刘诗薇
【申请人】上海交通大学
【公开日】2016年1月27日
【申请日】2015年10月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1