1.一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,包括如下步骤:
s1,利用扩张、收缩、对称性检测三个阶段,将目标节点分为表型class节点和非class节点两种情况,通过条件互信息计算获取不同节点的马尔可夫毯;
s2,根据得到不同节点的马尔可夫毯,构建包括snp位点和表型class的网络,得到初始蜜源,即初始网络结构;
s3,在不生成环的前提下,基于初始蜜源网络个体,通过随机增加边、删除边、逆转边的操作生成新的网络个体,直到网络个体数量达到最大初始蜜源数目;
s4,在步骤3所得初始蜜源的基础上,通过人工蜂群优化算法的三种蜜蜂行为与贝叶斯网络的bic和mit两种打分函数,对包括snp位点和表型class的贝叶斯网络进行演化,得到较优的贝叶斯网络结构,从而准确快速地获取到影响表型性状的上位性基因位点,其中三种蜜蜂分别为采蜜蜂、观察蜂和侦察蜂。
2.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于:在所述s1步骤前,将基因型数据表示为0,1,2形式的数据,对于特定snp基因型数据,例如at,进行如下表示:aa用0表示,tt用2表示,at/ta用1表示,其中0表示纯合子常见基因型,1表示杂合子,2表示纯合子少见基因型,表型class取值为0或1,0表示为未患病,1表示为患病。
3.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s1步骤中,扩张阶段具体为:在构建非class节点的马尔可夫毯时,假设表型class节点已经加入到目标snp节点的马尔可夫毯中,计算任意一个snp节点与class在目标snp节点条件下的条件互信息,并将所述条件互信息小于阈值的snp位点加入目标节点的马尔可夫毯中;在构建class节点的马尔可夫毯时,假设任意一个snp节点已经加入表型class节点的马尔可夫毯中,计算另外任意一个snp节点与已加入马尔可夫毯的snp节点在class条件下的条件互信息,并将小于阈值的snp位点加入class节点的马尔可夫毯中。
4.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s1步骤中,收缩阶段具体为:去除多余节点;对于任意目标节点snp1或者class节点,计算在去除snp2的马尔可夫毯的条件下目标节点snp1与snp2的条件互信息,若所述条件互信息大于阈值,则删除snp2并更新节点snp1的马尔可夫毯。
5.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s1步骤中,对称性检测具体为:由于本发明中的方法是基于条件独立性检测,因此任意目标节点马尔可夫毯中的节点之间应该相互依赖,假设snp1存在于snp2的马尔可夫毯中,snp1与snp2应该相互依赖,与之对应,snp2应该存在于snp1的马尔可夫毯中,假如两个节点的马尔可夫毯并不对称,那么分别在两个节点的马尔可夫毯中删除另外一节点。
6.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s4步骤中,采蜜蜂阶段具体为:
s40,首先采蜜蜂对初始蜜源的邻域进行搜索,即通过加边、减边、逆转边三种操作对网络结构进行更新;
s41,然后利用bic和mit两种评分函数同时对新的网络结构进行打分,并与初始网络结构的分数进行比较,若新的网络结构优于初始网络结构,则将该网络结构进行保存,并记录该网络结构提高的分数;
s42,最后,根据提高的分数使用轮盘赌的方式随机选择新的网络结构,此时采蜜蜂对其进行采蜜;
以上的网络结构即蜜源。
7.如权利要求6所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于:在所述采蜜蜂阶段的方法中,使网络分数提高越大的操作被选择的概率越大,这不仅可以保证网络演变的正确性,又不至于陷入局部最优,假如轮盘赌方法选择放弃本次加边、减边或者逆转边操作,则说明该蜜源邻域已无更优网络结构,表示该网络结构已是最优的网络结构,此时采蜜蜂对其进行采蜜。
8.如权利要求6所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s4步骤中,观察蜂阶段具体为:观察蜂阶段和采蜜蜂阶段交替进行,每当采蜜蜂搜索一次邻域得到较优的网络结构之后,观察蜂便对采蜜蜂所在的蜜源进行考察,根据两种打分函数计算对应网络结构的适应度值,然后利用轮盘赌的方式随机选择一个蜜源网络结构,适应度越大的网络结构被认为邻域拥有更优网络结构的可能性越大,被选到的几率也就越大,采蜜蜂对选中网络结构的邻域进行搜索,重复采蜜蜂阶段的操作。
9.如权利要求8所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于,在所述s4步骤中,侦察蜂阶段具体为:侦察蜂在采蜜蜂和观察蜂阶段中扮演监督员的角色,记录每个蜜源网络结构的采蜜次数以及最优蜜源网络结构,当某一蜜源网络结构达到最大采蜜次数,则放弃该蜜源,并通过步骤1重新生成新的蜜源网络结构,假如每只采蜜蜂均将对应蜜源开采至最大采蜜次数,则找到最优蜜源,即最优网络结构,此时算法结束。
10.如权利要求1所述的一种人工蜂群优化贝叶斯网络的上位性位点挖掘方法,其特征在于:适应度函数是用于评判网络结构好坏的标准,因此采用bic与mit联合打分的方法对网络的优劣进行判断,同时,由于bic打分函数可以处理的父节点个数有限,因此采用可分解bic打分方法处理较多个数的父节点,进而可以处理规模较大的网络结构。