一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法与流程

文档序号:19422519发布日期:2019-12-14 01:42阅读:来源:国知局

技术特征:

1.一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,包括如下步骤:

s1,利用扩张、收缩、对称性检测三个阶段,将目标节点分为表型class节点和非class节点两种情况,通过条件互信息计算获取不同节点的马尔可夫毯;

s2,根据得到不同节点的马尔可夫毯,构建包括snp位点和表型class的网络,得到初始蜜源,即初始网络结构;

s3,在不生成环的前提下,基于初始蜜源网络个体,通过随机增加边、删除边、逆转边的操作生成新的网络个体,直到网络个体数量达到最大初始蜜源数目;

s4,在步骤3所得初始蜜源的基础上,通过人工蜂群优化算法的三种蜜蜂行为与贝叶斯网络的bic和mit两种打分函数,对包括snp位点和表型class的贝叶斯网络进行演化,得到较优的贝叶斯网络结构,从而准确快速地获取到影响表型性状的上位性基因位点,其中三种蜜蜂分别为采蜜蜂、观察蜂和侦察蜂。

2.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于:在所述s1步骤前,将基因型数据表示为0,1,2形式的数据,对于特定snp基因型数据,例如at,进行如下表示:aa用0表示,tt用2表示,at/ta用1表示,其中0表示纯合子常见基因型,1表示杂合子,2表示纯合子少见基因型,表型class取值为0或1,0表示为未患病,1表示为患病。

3.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s1步骤中,扩张阶段具体为:在构建非class节点的马尔可夫毯时,假设表型class节点已经加入到目标snp节点的马尔可夫毯中,计算任意一个snp节点与class在目标snp节点条件下的条件互信息,并将所述条件互信息小于阈值的snp位点加入目标节点的马尔可夫毯中;在构建class节点的马尔可夫毯时,假设任意一个snp节点已经加入表型class节点的马尔可夫毯中,计算另外任意一个snp节点与已加入马尔可夫毯的snp节点在class条件下的条件互信息,并将小于阈值的snp位点加入class节点的马尔可夫毯中。

4.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s1步骤中,收缩阶段具体为:去除多余节点;对于任意目标节点snp1或者class节点,计算在去除snp2的马尔可夫毯的条件下目标节点snp1与snp2的条件互信息,若所述条件互信息大于阈值,则删除snp2并更新节点snp1的马尔可夫毯。

5.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s1步骤中,对称性检测具体为:由于本发明中的方法是基于条件独立性检测,因此任意目标节点马尔可夫毯中的节点之间应该相互依赖,假设snp1存在于snp2的马尔可夫毯中,snp1与snp2应该相互依赖,与之对应,snp2应该存在于snp1的马尔可夫毯中,假如两个节点的马尔可夫毯并不对称,那么分别在两个节点的马尔可夫毯中删除另外一节点。

6.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s4步骤中,采蜜蜂阶段具体为:

s40,首先采蜜蜂对初始蜜源的邻域进行搜索,即通过加边、减边、逆转边三种操作对网络结构进行更新;

s41,然后利用bic和mit两种评分函数同时对新的网络结构进行打分,并与初始网络结构的分数进行比较,若新的网络结构优于初始网络结构,则将该网络结构进行保存,并记录该网络结构提高的分数;

s42,最后,根据提高的分数使用轮盘赌的方式随机选择新的网络结构,此时采蜜蜂对其进行采蜜;

以上的网络结构即蜜源。

7.如权利要求6所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于:在所述采蜜蜂阶段的方法中,使网络分数提高越大的操作被选择的概率越大,这不仅可以保证网络演变的正确性,又不至于陷入局部最优,假如轮盘赌方法选择放弃本次加边、减边或者逆转边操作,则说明该蜜源邻域已无更优网络结构,表示该网络结构已是最优的网络结构,此时采蜜蜂对其进行采蜜。

8.如权利要求6所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s4步骤中,观察蜂阶段具体为:观察蜂阶段和采蜜蜂阶段交替进行,每当采蜜蜂搜索一次邻域得到较优的网络结构之后,观察蜂便对采蜜蜂所在的蜜源进行考察,根据两种打分函数计算对应网络结构的适应度值,然后利用轮盘赌的方式随机选择一个蜜源网络结构,适应度越大的网络结构被认为邻域拥有更优网络结构的可能性越大,被选到的几率也就越大,采蜜蜂对选中网络结构的邻域进行搜索,重复采蜜蜂阶段的操作。

9.如权利要求8所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s4步骤中,侦察蜂阶段具体为:侦察蜂在采蜜蜂和观察蜂阶段中扮演监督员的角色,记录每个蜜源网络结构的采蜜次数以及最优蜜源网络结构,当某一蜜源网络结构达到最大采蜜次数,则放弃该蜜源,并通过步骤1重新生成新的蜜源网络结构,假如每只采蜜蜂均将对应蜜源开采至最大采蜜次数,则找到最优蜜源,即最优网络结构,此时算法结束。

10.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于:适应度函数是用于评判网络结构好坏的标准,因此采用bic与mit联合打分的方法对网络的优劣进行判断,同时,由于bic打分函数可以处理的父节点个数有限,因此采用可分解bic打分方法处理较多个数的父节点,进而可以处理规模较大的网络结构。


技术总结
本发明涉及生物信息技术领域,提供了一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,包括S1‑S4四个步骤。本发明的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,首先利用扩张、收缩、对称性检测三个阶段,通过条件互信息计算得到节点的马尔可夫毯,构建初始蜜源网络结构,然后,基于初始蜜源通过随机加边、减边、逆转边3种操作生成新的蜜源,直到达到最大初始蜜源数目,利用人工蜂群算法的三种操作(采蜜蜂、观察蜂和侦察蜂)与贝叶斯网络的BIC与MIT打分方法,对贝叶斯网络结构进行演化,找到最优的网络结构,快速准确的获取到影响表型性状的上位性基因位点,辅助基因功能挖掘。

技术研发人员:刘建晓;杨晨;高辉;杨轩;黄穗宇;阚裕隆
受保护的技术使用者:华中农业大学
技术研发日:2019.09.11
技术公布日:2019.12.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1