一种通信网络中关键节点的选取方法及系统与流程

文档序号:17984923发布日期:2019-06-22 00:20阅读:321来源:国知局
一种通信网络中关键节点的选取方法及系统与流程

本发明涉及网络管理领域,特别涉及一种通信网络中关键节点的选取方法及系统。



背景技术:

大量自然和人工系统的结构都可以抽象为由点和线组成的网络,包括食物链网络、社交网络等。这些网络具有相似的拓扑网络,其次这些网络也具有一些类似的动力学行为。信息传播和扩散是网络中常见的一种动力学行为,在网络中,信息以一定的概率从一个节点传递到另一个节点,传播概率一般存在一个临界阈值,如果传播概率高于该临界阈值,初始的少量信息会迅速扩散到整个网络;反之,信息在传递过程中会消亡。在网络的拓扑结构分析中发现少量的节点对整个网络的连通性具有重要影响,网络中的信息传递主要通过这些关键节点的转发进行。如果对网络中信息传播行为进行控制,只需要对网络中的关键节点进行控制或者保护即可,因此如何寻找高影响力节点是问题的关键,很多人致力于高影响力节点的研究。

传统的高影响力节点选取的算法,主要有两种方案:启发式算法和基于目标函数的优化算法。启发式算法一般根据节点的重要性进行选择,节点重要性可根据节点度、介数、聚类系数、pagerank指标进行确定。根据使用信息的差异,启发式算法可分为基于局部信息的重要性指标和基于全局拓扑信息的重要性指标。基于局部信息的方法确定节点的重要性时仅根据节点的邻居节点或次近邻节点确定,包括节点度、2-近邻、聚类系数等。而基于全局拓扑信息的方法计算节点的重要性时需要整个网络的拓扑信息,包括介数、pagerank、非回溯矩阵、随机游走等指标。

在启发式算法中存在不同指标对关键节点的选取方法,介绍如下:

节点度(hd,highdegree),该算法根据节点的度进行排序,依次选择度大的节点,通常为便于比较而对中心性指标作归一化处理,度为ki的节点的归一化的度中心性值定义为:

其中,n表示网络中节点的总数量。

节点介数(bw,betweenness),节点的介数定义为网络中所有最短路径中经过该节点的路径数量占最短路径总数的比例,该算法依次选择介数大的节点作为关键节点。具体地,节点i的介数定义为:

其中,gst为从节点s到节点t的最短路径的数目,为从节点s到节点t的gst条最短路径中经过节点i的最短路径的数目。

k-壳算法(k-shell),k-shell和k-core成对出现。网络中反复删除度小于k的节点,直至所有节点的度大于等于k为止,剩余的网络即为该网络的k-core。如果一个节点存在于k-core中而不存在于(k+1)-core中,则该节点位于k-shell中。该算法根据节点的k-shell依次选择k-shell大的节点。

传统算法中还有基于稀疏矩阵的综合影响力算法(ci),该算法基于边渗流理论,在忽略网络中环路的情况下,仅考虑网络为树状网络,可以推导出单个节点影响力为公式:

sm=(dm-1)∑j∈ball-2(dj-1)

其中,dm为节点m的度,ball-2是距离节点m为2的点集合,dj是与节点m距离为2的节点的度,该算法选择关键节点时根据单个节点的影响力进行排序,依次选择关键节点。

基于启发式算法结果和最优值差异较大,并且启发式算法仅根据单个节点的影响力进行选择,忽略了节点之间的耦合效应,例如在k-核算法中,单个高k-壳的节点影响力很大,但多个高k-壳的节点综合影响力较小,主要的原因是这些高影响力的节点之间具有相似的邻居,影响范围有较大的重叠。而基于矩阵的综合影响力算法在模型网络中可以达到最优值,在部分实际网络中效果较差,因为实际网络中的环路较多,具有复杂的内部结构,比如聚类特性、度相关性、富人俱乐部特征等,导致在实际网络中会形成局部稠密的子网络,忽略了网络中信息传递的环路特征,致使选取的关键节点之间的重叠影响力较大,而关键节点的综合影响力较小。



技术实现要素:

本发明的目的是提供一种通信网络中关键节点的选取方法及系统,以选取综合影响力大的关键节点。

为实现上述目的,本发明提供了如下方案:

本发明提供一种通信网络中关键节点的选取方法,所述选取方法包括如下步骤:

确定原始网络的邻接矩阵;

根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力;

选取影响力最大的节点作为关键节点,并将所述关键节点加入关键节点集合;

判断关键节点的个数是否小于预设阈值;

若关键节点的个数小于预设阈值,则删除所述原始网络中经过所述关键节点的边,得到更新后的原始网络,并根据所述更新后的原始网络,更新所述邻接矩阵;返回步骤“根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力”;

若关键节点的个数不小于预设阈值,则输出所述关键节点集合。

可选的,所述根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力,具体包括:

利用公式sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk,计算所述原始网络中每个节点的影响力,其中,sm表示节点m的影响力,dm、dj和dk分别表示节点m、节点j和节点k的度,amj、ajk、ajm和amk分别表示邻接矩阵中(m,j)、(j,k)、(j,m)和(m,k)位置的元素值。

可选的,所述选取影响力最大的节点作为关键节点,具体包括:

采用贪婪算法,选取影响力最大的节点作为关键节点。

可选的,所述若关键节点的个数不小于预设阈值,则输出所述关键节点集合,之后还包括:

将所述关键节点集合中的每个关键节点与所述原始通信网络索引对应,得到关键节点索引数组。

可选的,所述确定原始通信网络邻接矩阵,之前还包括:

删除所述原始网络中的有向带权图的方向和权重,并删除所述原始网络中的孤立节点和孤立簇。

一种通信网络中关键节点的选取系统,所述选取系统包括:

邻接矩阵确定模块,用于确定原始网络的邻接矩阵;

影响力计算模块,用于根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力;

关键点选取模块,用于选取影响力最大的节点作为关键节点,并将所述关键节点加入关键节点集合;

判断模块,用于判断关键节点的个数是否小于预设阈值;

第一判断结果处理模块,用于若关键节点的个数小于预设阈值,则删除所述原始网络中经过所述关键节点的边,得到更新后的原始网络,并根据所述更新后的原始网络,更新所述邻接矩阵;返回步骤“根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力”;

第二判断结果处理模块,用于若关键节点的个数不小于预设阈值,则输出所述关键节点集合。

可选的,所述影响力计算模块,具体包括:

影响力计算子模块,用于利用公式sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk,计算所述原始网络中每个节点的影响力,其中,sm表示节点m的影响力,dm、dj和dk分别表示节点m、节点j和节点k的度,amj、ajk、ajm和amk分别表示邻接矩阵中(m,j)、(j,k)、(j,m)和(m,k)位置的元素值。

可选的,所述关键点选取模块,具体包括:

关键点选取子模块,用于采用贪婪算法,选取影响力最大的节点作为关键节点。

可选的,所述选取系统,还包括:

索引对应模块,用于将所述关键节点集合中的每个关键节点与所述原始通信网络索引对应,得到关键节点索引数组。

可选的,所述选取系统,还包括:

原始网络预处理模块,用于删除所述原始网络中的有向带权图的方向和权重,并删除所述原始网络中的孤立节点和孤立簇。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明公开了一种通信网络中关键节点的选取方法及系统。本发明的选取方法基于瑞利熵的重叠影响力算法,计算关键节点间的影响力,提高了关键节点的综合影响力,同时由于网络中环路的情况,网络中信息的传递的情况混杂,本发明通过瑞利熵的重叠影响力算法刻画网络中信息的传递混杂行为,并且在实际网络中有较好的表现,并且本发明通过对关键节点移除,使整个网络将会散列成很多个互不连接的群体,在实际应用中,能较好的控制病毒或信息的传播。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为一种通信网络中关键节点的选取方法的流程图;

图2为一种通信网络中关键节点的选取方法的一个优选的实施方式的流程图;

图3为本发明提供的基于节点度和基于瑞利熵的关键节点的选取示意图;图(3a)为采用本发明的关键节点选取方法选取的关键节点示意图;图(3b)为采用节点度算法选取的关键节点示意图;图(3c)为本发明的关键节点选取方法刻画无序路径的示意图;

图4为本发明提供的在不同网络中,不同算法的剩余网络的最大特征值与关键节点数量比值的对比图,其中,图(4a)、图(4b)图(4c)和图(4d)分别为airtraffic网络、bitcoin网络、ca-hepth网络和reactome网络中不同算法的剩余网络的最大特征值与关键节点数量比值的对比图;

图5为本发明提供的在不同网络中,不同算法的剩余网络的最大连通子图占整个网络的比例的对比图,其中,图(5a)、图(5b)图(5c)和图(5d)分别为airtraffic网络、bitcoin网络、ca-hepth网络和reactome网络中不同算法的最大连通子图占整个网络的比例的对比图;

图6为本发明提供的在不同网络中,不同算法选取的关键节点之间的平均距离与关键节点比例的关系的对比图,其中,图(6a)、图(6b)图(6c)和图(6d)分别为airtraffic网络、bitcoin网络、ca-hepth网络和reactome网络中不同算法选取的关键节点之间的平均距离与关键节点比例的关系的对比图;

图7为本发明提供的一种通信网络中关键节点的选取系统的结构组成图。

具体实施方式

本发明的目的是提供一种通信网络中关键节点的选取方法及系统,以选取综合影响力大的关键节点。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对发明作进一步详细的说明。

实施例1

本发明实施例1提供一种通信网络中关键节点的选取方法。

如图1所示,所述选取方法包括如下步骤:

步骤101,确定原始网络的邻接矩阵;步骤102,根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力;步骤103,选取影响力最大的节点作为关键节点,并将所述关键节点加入关键节点集合;步骤104,判断关键节点的个数是否小于预设阈值;步骤105,若关键节点的个数小于预设阈值,则删除所述原始网络中经过所述关键节点的边,得到更新后的原始网络,并根据所述更新后的原始网络,更新所述邻接矩阵;返回步骤“根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力”;步骤106,若关键节点的个数不小于预设阈值,则输出所述关键节点集合。

实施例2

本发明实施例2提供一种通信网络中关键节点的选取方法的优选的实施方式,但是本发明的实施不限于本发明实施例2所限定的实施方式。

如图2所示,

首选对原始网络进行数据预处理,如果是有向带权图,则忽略边的方向和权重,由于在不同子图中的节点不会相互传递信息,所以同时删除网络中的孤立节点和孤立簇。

然后,所述确定原始网络的邻接矩阵,具体包括

将输入的原始网络,表示为邻接矩阵a={aij}n×n,其中,aij为邻接矩阵a(i,j)位置的元素值,表示节点i和节点j之间的权重,当i和j存在边时,aij=1,否则aij=0,n表示网络规模的大小。

利用公式sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk,计算所述原始网络中每个节点的影响力,其中,sm表示节点m的影响力,dm、dj和dk分别表示节点m、节点j和节点k的度,amj、ajk、ajm和amk为邻接矩阵中(m,j)、(j,k)、(j,m)和(m,k)位置的元素值,分别表示节点m和节点j之间、节点j和节点k之间、节点j和节点m之间和节点m和节点k之间的权重;

具体的,利用基于瑞利熵的重叠影响力算法对网络中的节点影响力进行计算,其中矩阵的瑞利熵定义为:

如果x为矩阵a最大特征值对应的特征向量,则r(a,x)=λa,否则r(a,x)<λa,其中,x为任意向量。则可以推出:

其中,a为向量x沿矩阵a最大特征向量的分量,x=[d1,d2,…,dn],其中d1,d2和dn分别为节点1,2和n的度,实际上x=a1,1为全1向量。在sis传播模型中,因为网络的传播临界阈值为因此寻找关键节点的行为变为如何最小化λa,即最小化xtax,k→∞。由于k太大时难以计算,这里设置k=2,这时

实际上表示网络中相邻的边-对数量(i和k可相等)。

一条边的影响力定义为删除该边后,xta2x下降的数量,x=a1。边eij的影响力为:

删除一个节点实际是删除所有从属该节点的所有边,所以单个节点的影响力定义为:

sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk。

通过贪婪算法,对节点重要性(影响力)排序,选择影响力最大的节点作为一个新的关键节点。

如果关键节点的个数小于预设阈值l,则删除所述原始网络中经过所述关键节点的边,得到更新后的原始网络,并根据所述更新后的原始网络,更新所述邻接矩阵,即从邻接矩阵删除关键节点所依附的边,并且返回步骤利用公式sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk,计算所述原始网络中每个节点的影响力。如果关键节点的个数达到l,则将选择的关键节点与原始网络的索引对应,即将所述关键节点集合中的每个关键节点与所述原始通信网络索引对应,得到关键节点索引数组。

实施例3

本发明实施例3提供一种通信网络中关键节点的选取方法的的有效性的验证方法。

以基于节点度的关键节点选取算法为例:

分别计算各个节点的度。

将各个节点的度进行排序。

选取前2个节点作为关键节点,如图3b根据该算法可知关键节点为4,6。

以基于瑞利熵的关键节点选取算法为例:

依据节点重要性公式sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk对各个节点的重要性进行计算。

选取节点重要性最高的节点并删除该节点所连接的边。

重复(1),(2),直至选取2个关键节点。如图3a根据该算法可知关键节点为1,6;

并且基于瑞利熵的关键节点选取算法能够刻画网络信息传播的混杂行为,在经典的渗流理论中忽略网络中的环路,节点影响力由公式sm=(dm-1)∑j∈ball-2(dj-1)刻画,而在存在环路的网络中,节点影响力有公式sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk刻画,实际信息传播过程中,以节点1作为传播源,信息沿着1->4->6传播,也可以反向沿着1->6->4传播,如图3c所示,当环路的数量继续增加时,信息传递方向是无序的,本发明提出的公式sm=dm∑j,kamjajkdk+j,kajmamkdjdk能够刻画这种无序行为,而公式sm=(dm-1)∑j∈ball-2(dj-1)是在忽略网络环路,即忽略无序传递信息情况下的简化形式。

本发明在实际系统中进行数据模拟与测试,并取得了可观的效果,本发明选择了四个真实网络:airteaffic,bitcoin,cahepth,reactome,其中,airtraffic是美国联邦航空管理局开放的航空信息数据,网络中的每个节点代表一个机场或者服务中心,每条边代表该中心推荐的服务关系。bitcoin是https://www.bitcoin-otc.com/网站上用户和用户之间的相互依赖关系网络,这是一个带权重的符号关系网络。cahepth是arxiv上的高能物理领域的作者合作关系网络。reactome是智人的蛋白质关系网络。实验中本发明将网络结构都看成是无权无向的,同时删除网络中的孤立节点和孤立簇,仅保留网络的最大连通子图。网络的结构属性包括节点数(v)、边数(e)、度异质性(h)、度结合性(r)、平均聚类系数(<c>)、稀疏性sparsity=2e/(|v|(|v|-1))和平均最短路径(<d>),如下表1所示:

表1

并且采用了节点度(hd,highdegree),节点介数(bw,betweenness),k-壳(k-shell),基于稀疏矩阵的综合影响力(ci,collectiveinfluence)和非回溯矩阵分析(nbm,non-backtrackingmatrix)五种基准算法。

图4首先分析剩余网络的最大特征值与关键节点的数量关系,δ=l/n,随着免疫关键节点数量的增加,剩余网络最大特征值逐渐下降(λa越小越好)。注意到本实验中ci方法效果较差,而在稀疏网络中效果很好,主要由于实际网络具有复杂的内部结构,比如聚类特征,度度相关性、富人俱乐部特征等,导致实际网络中会形成局部稠密的子网络,而在ci算法中忽略了网络中信息传递的环路特征,因此效果较差,而本发明考虑了环路信息的传递,因此整体的性能相比ci算法得到了提高。另外,注意到基于节点度的算法hd也有较好的实验结果,但基于节点度的方法仅在部分网络表现较好,随着网络结构的变化,该算法性能稳定性不高。同时在4个网络中基于介数的方法和k-壳算法重叠,这种重叠行为也会随着网络的变化而变化。注意到在图4c中本发明在δ<0.025时有很大降低,表明在一些特定结构下算法能够挖据出较好的关键节点,而在一般情况下该算法也具有较高的稳定性和较好的性能。

图5分析删除关键节点后剩余网络的最大连通子图占整个网络的比例,如图3所示,发现随着关键节点数量的增加,最大连通子图的比例逐渐下降(g(δ)越低越好)。在研究渗流问题时,尤其是在随机网络的渗流研究中,随着删除节点数量的增加,到某一临界值时,g(δ)会迅速下降至0附近,而在实际网络中这种相变现象没有出现,主要是由于实际网络复杂的结构能够保证剩余网络的连通性;另一方面,渗流问题研究时通常认为网络规模较大(趋于无穷),而实际网络规模有限,导致实际网络和模型分析略有差异。注意到,在图5中,本发明提出的算法具有最优的λa,但在图6中,新算法ec并没有超过经典算法,比如hd和k-shell,间接证明了实际网络中渗流的关键节点和sis模型中的关键节点差异较大,应该采用不同的标准进行衡量。

最后分析关键节点的特征,这里主要分析关键节点之间的平均距离,综合图4和图6发现基于非回溯矩阵的方法nbm选择的节点平均距离小,性能较差,在图5c中ci方法效果最差,同时在图6c中平均距离最小。表明关键节点之间的平均距离越小,综合影响力越低。因此为了提高多节点的综合影响力,应该适当增加传播源之间的距离。但是距离并不是越大越好,本发明ec在图4中具有最优的λa,在图6中平均距离并不是最大,因此在节点的平均距离和综合影响力之间需要合适的平衡机制,增加节点平均距离有助于降低重叠影响力,在考虑重叠影响力的同时也需要分析综合影响力。

由此可见,本发明的ec方法相对于传统方法确实有一定改善,所求出关键节点的综合影响力相较于传统方法有所提高,并且在各种网络中表现稳定。

本发明基于sis传播模型分析了传播的关键节点的选择策略,在瑞利熵基础上考虑网络邻接矩阵的高阶近似,分析了网络最优节点选择策略和瑞利熵的关系,边的影响力为:

节点的影响力为:

sm=dm∑j,kamjajkdk+∑j,kajmamkdjdk

基于节点影响力公式和重叠影响力分析,提出新算法选择传播过程中的关键节点,通过与经典方法比较,发现新算法优于经典方法,同时论证多节点的综合影响力小于单节点的影响力之和。

实施例4

本发明实施例4提供一种通信网络中关键节点的选取系统。

如图7所示,所述选取系统包括:邻接矩阵确定模块701,用于确定原始网络的邻接矩阵;影响力计算模块702,用于根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力;关键点选取模块703,用于选取影响力最大的节点作为关键节点,并将所述关键节点加入关键节点集合;判断模块704,用于判断关键节点的个数是否小于预设阈值;第一判断结果处理模块705,用于若关键节点的个数小于预设阈值,则删除所述原始网络中经过所述关键节点的边,得到更新后的原始网络,并根据所述更新后的原始网络,更新所述邻接矩阵;返回步骤“根据所述邻接矩阵,基于瑞利熵的重叠影响力算法,计算所述原始网络中每个节点的影响力”;第二判断结果处理模块706,用于若关键节点的个数不小于预设阈值,则输出所述关键节点集合。

实施例5

本发明实施例5提供一种通信网络中关键节点的选取系统的优选的实施方式,但是本发明的实施不限于本发明实施例5所限定的实施方式。

所述影响力计算模块702,具体包括:影响力计算子模块,用于利用公式sm=dm∑j,kamjajkdk+σj,kajmamkdjdk,计算所述原始网络中每个节点的影响力,其中,sm表示节点m的影响力,dm、dj和dk分别表示节点m、节点j和节点k的度,amj、ajk、ajm和amk分别表示邻接矩阵中(m,j)、(j,k)、(j,m)和(m,k)位置的元素值。

所述关键点选取模块703,具体包括:

关键点选取子模块,用于采用贪婪算法,选取影响力最大的节点作为关键节点。

所述选取系统,还包括:索引对应模块,用于将所述关键节点集合中的每个关键节点与所述原始通信网络索引对应,得到关键节点索引数组。原始网络预处理模块,用于删除所述原始网络中的有向带权图的方向和权重,并删除所述原始网络中的孤立节点和孤立簇。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明公开了一种通信网络中关键节点的选取方法及系统。本发明的选取方法基于瑞利熵的重叠影响力算法,计算关键节点间的影响力,提高了关键节点的综合影响力,同时由于网络中环路的情况,网络中信息的传递的情况混杂,本发明通过瑞利熵的重叠影响力算法刻画网络中信息的传递混杂行为,并且在实际网络中有较好的表现,并且本发明通过对关键节点移除,使整个网络将会散列成很多个互不连接的群体,在实际应用中,能较好的控制病毒或信息的传播。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1