基于多目标优化的复杂网络平衡聚类方法

文档序号:8943484阅读:566来源:国知局
基于多目标优化的复杂网络平衡聚类方法
【技术领域】
[0001] 本发明属于计算机技术领域,更进一步涉及数据挖掘技术领域中的一种基于多目 标优化的复杂网络平衡聚类方法。本发明以平衡信息为目标函数,通过聚类操作可为复杂 无向符号网络提供多种平衡结构。
【背景技术】
[0002] 复杂无向符号网络是一种典型的网络类型。基于该类型网络所代表的系统的实际 意义,网络中的每一个节点代表一个相关个体,个体之间存在着积极或消极的关系,抽象为 网络中节点之间的正边(积极)连接或负边(消极)连接,同时节点之间的关系具有对称 性。
[0003] 北京航空航天大学在其拥有的专利技术"基于节点核心影响力的复杂网络聚类方 法"(专利申请号201210002128. 2,授权公告号CN102571954B)中公开了一种基于节点核心 影响力的复杂网络聚类方法。该方法将复杂网络中的节点按照度的大小排序,初始各节点 均未确定所属社区,将当前未确定所属社区的最大度节点作为社区的核心节点,开始构建 该社区,依次确定该核心节点的相邻节点的社区归属,完成该社区的构建;对网络中尚未确 定社区归属的剩余节点重复上述步骤直至所有节点都确定了所属社区,得到最终的网络聚 类结构。该方法的不足之处是:只能得到单一聚类结果,在网络平衡转换的代价发生变化的 情况下,该方法不能满足寻找最优的聚类结果的需求。
[0004] 孙一翔、杜海峰、公茂果、马里佳、王善峰在其发表的论文"Fast computing global structural balance in signed networks based on memetic algorithm. " (《Physica A:Statistical Mechanics and its Application》,2014,pages 261-272)中提出了一种基于memetic算法的快速计算符号网络全局平衡的聚类方法(现 有技术Meme-SB)。该方法将符号网络平衡聚类问题看作是一个单目标问题,以Gius^pe Facchetti、Giovanni Iacono 和 Claudio Altafini 在其发表的论文 "Computing global structural balance in large-scale signed social networks',(〈〈Proceedings of the National Academy of Sciences》,2011,pages20953_20958)中提出的能量函数为目标函 数,通过memetic算法对该目标函数进行最小化。该方法的不足之处是:以强平衡理论为聚 类前提,因此只能将网络分为两个部分,而这样的聚类结果在大多数情况下不符合实际,容 易产生极化现象;对于拓扑结构复杂的网络,该方法得到的网络结构不平衡性高。

【发明内容】

[0005] 本发明的目的在于克服上述已有技术的不足,提出一种基于多目标优化的复杂网 络平衡聚类方法。
[0006] 本发明的技术方案是:将降低网络聚类的不平衡负连接边的数目和不平衡正连接 边的数目作为目标,采用一种多目标优化的复杂网络聚类方法,并引入针对平衡问题的局 部搜索方法,搜索目标网络的平衡结构,
[0007] 实现本发明目的的具体步骤如下:
[0008] (1)读入目标无向符号网络的数据集;
[0009] (2)初始化进化种群:
[0010] 采用正邻接点实数编码方法,生成含有200个解个体的初始进化种群,每个解个 体由m个基因位构成,m等于网络节点数;
[0011] (3)计算进化种群的适应度:
[0012] (3a)将计数标志e的初始值设置为1 ;
[0013] (3b)以计数标志e的值为序号,选取与该序号相对应的进化种群的解个体;
[0014] (3c)按照下式,计算所选取的进化种群的解个体的不平衡负连接边的数目:
[0015]
[0016] 其中,f\(X)表示所选取的进化种群的解个体的不平衡负连接边的数目,X表示所 选取的进化种群的解个体,Σ表示求和操作,k表示所选取的进化种群的解个体中所包含 的类的数目,k的取值由所选取的进化种群的解个体确定,N((;,(;)表示所选取的进化种群 的解个体中属于第 r类的所有节点之间的负连接边的数目,(;表示所选取的进化种群的解 个体中属于第r类的所有节点的集合;
[0017] (3d)按照下式,计算步骤(3b)中所选取的解个体的不平衡正连接边的数目:
[0018]
[0019] 其中,f2(X)表示所选取的进化种群的解个体的不平衡正连接边的数目,X表示所 选取的进化种群的解个体,Σ表示求和操作,k表示所选取的进化种群的解个体中所包含 的类的数目,k的取值由所选取的进化种群的解个体确定,P ((;,OJ表示所选取的进化种群 的解个体中属于第r类的所有节点与其他类中的节点之间的正连接边的数目,(;表示所选 取的进化种群的解个体中属于第r类的所有节点的集合,(^表示所选取的进化种群的解个 体中不属于第 r类的所有节点的集合;
[0020] (3e)判断计数标志e的值是否等于200,若是,则得到进化种群的适应度,执行步 骤(4),否则,将计数标志e的值加1,执行步骤(3b);
[0021] (4)初始化外部种群:
[0022] (4a)删除进化种群中所有重复的解个体;
[0023] (4b)从进化种群剩余的解个体中,选取所有非支配的解个体,构成初始的外部种 群;
[0024] (5)按照下式,初始化进化种群的参考点:
[0025] z = (Z1, Z2)
[0026] 其中,z表示进化种群的参考点,Z1表示进化种群中所有解个体的不平衡负连接边 的数目的最小值,4表示进化种群中所有解个体的不平衡正连接边的数目的最小值;
[0027] (6)更新种群:
[0028] (6a)设置进化种群中所有解个体的邻域;
[0029] (6b)将迭代计数标志iteration的初始值设置为1 ;
[0030] ^c)对进化种群中的每一个解个体执行遗传操作,更新进化种群;
[0031] (6d)更新进化种群的参考点;
[0032] (6e)更新外部种群;
[0033] (6f)更新进化种群中所有解个体对应的邻域;
[0034] (6g)判断迭代计数标志iteration的值是否等于200,若是,则完成更新进化种群 操作,执行步骤(7),否则,将迭代计数标志iteration的值加1,执行步骤(6c);
[0035] (7)局部搜索外部种群:
[0036] (7a)将计数标志si的初始值设置为1 ;
[0037] (7b)以计数标志si的值为序号,选取与该序号相对应的外部种群的解个体;
[0038] (7c)根据所选取的外部种群的解个体的各基因位的值,确定该解个体中所包含的 类的数目及与每个类对应的节点集合;
[0039] (7d)从所选取的外部种群的解个体中,任意选取一个类;
[0040] (7e)从所选取的外部种群的解个体中,找出与所选取的类之间仅有正连接边的所 有类,得到所选取的类的邻接类的集合;
[0041] (7f)从所选取的类的邻接类的集合中,找出与所选取的类之间正连接边的数目最 大的类,并将该类与所选取的类合并;
[0042] (7g)判断计数标志si的值是否等于外部种群中的解个体的数目,若是,则得到外 部种群,否则,将计数标志si的值加1,执行步骤(7b);
[0043] (8)确定最优的网络平衡结构:
[0044] (8a)将外部种群的每一个解个体的不平衡负连接边的数目与不平衡正连接边的 数目相加,得到外部种群的每一个解个体的不平衡度;
[0045] (8b)从外部种群的解个体中,选取不平衡度的值最小的解个体,将所选取的解个 体对应的网络结构作为最优的网络平衡结构。
[0046] 本发明与现有技术相比具有如下优点:
[0047] 第一,由于本发明采用正邻接点实数编码方法对进化种群进行初始化,将复杂无 向符号网络划分为多个类,克服了现有技术中存在的极化现象的不足,使得本发明所得到 的网络平衡结构更加符合实际需求。
[0048] 第二,由于本发明中所采用的适应度是进化种群的解个体的不平衡负连接边的数 目和不平衡正连接边的数目,两者与网络结构的不平衡性直接关联;此外,本发明采用了针 对平衡问题的局部搜索方法,从外部种群的解个体中任意选择一个类,将外部种群的解个 体中与所选取的类之间具有最大的正连接边的数目的类与所选取的类合并。本发明通过以 上两个操作,降低了外部种群中的解个体对应的网络结构的不平衡性,克服了现有技术对
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1