一种基于熵变的复杂网络节点重要度的排序方法与流程

文档序号:15445765发布日期:2018-09-14 23:20阅读:1945来源:国知局

本发明涉及专门适用于复杂网络中重要节点排序技术领域,特别是涉及一种基于熵度量的系统级利用结构信息中的排序方法。



背景技术:

目前,伴随着信息技术的迅猛发展,人类社会活动日趋网络化,复杂网络为生物学、物理学和社会学的复杂系统提供了大量的有效模型。由于复杂网络的异构型决定了网络中每个节点的作用是完全不同的,因此对节点重要度的研究受到了人们的关注。复杂网络的许多机制,如传播动力学、级联反应和网络同步都受到所谓的重要节点的高度影响。确定最重要的节点或排名采用定量分析的方法,在大型网络中的节点的重要性是非常重要的,它可以让我们更好的控制和疾病传播的谣言,设计病毒营销策略,对科学家和刊物的声誉进行排名,优化有限的资源配置,保护关键地区免受攻击等等。

行业内人士在对复杂网络进行分析的过程中引入了网络熵的概念。网络熵通常用来表征网络结构中编码的信息量,并在图的层次上度量结构的复杂性。其中,熵可以作为局部级度量来度量节点重要性。本发明提出了一个熵度量:熵变。熵变用于定义节点重要性作为网络熵在其移除之前和之后的变化。因为在复杂网络中,一个更重要的节点的移除可能导致更多的结构变化。与其他最先进的节点重要性排序方法一样,本发明提出的熵度量也被用于利用结构信息,但本发明的熵度量用于系统级结构信息,而不是本地级结构信息。根据现实情况调研,本法明通过蛇形成语网络等著名的网络,证明了熵度量的优势,显著优于其他核心指标的确定的最重要的节点。

复杂网络一个重要的特性是其结构的复杂性。最近,业内人员开始注重利用熵在量化网络的复杂性,并提出了几个熵度量;网络的连通性,熵,循环熵,熵熵映射,黎曼几何熵。这些熵度量已被证明是非常成功的量化在网络结构特征编码的组织水平。但很少有熵度量来测量节点的重要性。最近的两个例子是相对熵和期望力。提出了相对熵作为节点重要性的综合评价方法,通过线性规划从不同的中心性指标生成最优解。因此,相对熵不能作为节点重要性排序的直接度量,而是作为综合现有节点重要性排序的一种混合方法。

本发明借用网络熵,即被定义为描绘在图一级的结构复杂性,用来在节点层次上表征节点的重要性。节点重要性被定义为网络信息熵的变化。与其他最先进的节点重要性排序方法一样,该方法也可以利用结构信息。然而,结构信息在系统水平、不完善。由于利用了更多的网络结构信息,这种新的熵度量优于其他国家最先进的确定top-k最重要节点指标方法。



技术实现要素:

本发明的目的是为了在一个受所属网络的拓扑结构影响的节点下采用一种熵度量,从而利用整个结构信息进行节点重要性评估。本发明通过设计一种用于描述图像层级结构复杂性的熵度量,从而定义节点重要性。

为了实现上述目的,本发明采用的分析方法可分为三个步骤:

步骤一、将熵变作为节点重要性的度量;

步骤二、top-k最重要节点的排序;

步骤三、性能评估;

本发明的优点在于:

1.本发明提出了一个熵度量——熵变量,它根据假设删除一个更重要的节点可能导致更多的结构变化,将网络熵在去除之前和之后的变化定义为网络熵,从而更好地分析每个节点在结构中的重要性。

2.本发明提出的熵度量用于系统级的利用结构信息,相较于本地级的利用结构信息更加优越、有效。

3.本发明在理论研究的基础上采用多种网络进行实证,在核心度、h指数、子图中心度、bonacichα中心、特征向量等方面有着超出预期的精度

附图说明

图1是本发明的整体技术路线示意图;

图2是本发明关于top-k最重要节点排序的流程图。

具体实施方式

下面结合附图和实施例对本发明进行详细说明。

本发明是一种基于熵度量的系统级利用结构信息中的排序方法,系统框图如图1所示,具体包括步骤如下:

步骤一、将熵变作为节点重要性的度量。

将一个有向图集g=(v,e)中的v称作一组节点(或顶点)元素,将其中一组有序的节点e称作边,其中如果(v,w)是边,v称为边的尾部,w称为边的头部。节点数|v|被称为图的顺序,边的数量|e|被称为图的大小。在此前提下重新定义香农熵,与此同时,将v的信息功能被定义为它的程度和中间性,前者是径向步行结构,后者是内侧步行结构。据此,可以根据入度、出度和全度计算有向图的计算熵。所提出的熵变的物理意义是:如果一个节点及其连接从网络中移除,则整个系统的熵的改变程度。因此,熵变可以被看作是节点对结构的影响,或者是代表节点重要性的度量。

步骤二、top-k最重要节点的排序。

通过利用熵变对节点重要性进行定义后,可以对图g中k个最重要节点排序。该算法的输入是一个图像g,输出top-k最重要节点及其相应的重要性序列。算法过程如图2所示:

1.计算图像g的熵;

2.对边集合v中的每一个变量:首先通过图像g除以变量v得到g1,然后计算g1的熵,最后设置节点v的重要性;

3.获得节点重要性序列和下降的重要性序列并返回。

该算法是一个两阶段过程。从步骤1到步骤2的第一部分是计算每个节点的重要性或熵变化,从而产生一个数值重要性序列,而后一部分是步骤3,其按照降序排列该序并获得顶级k节点。

步骤三、性能评估。

对于节点重要性排序方法的性能评估,有敏感性、鲁棒性和强连通性组件(scc)的大小几种方法,其中强连通组件是最为主流的标准。因此本发明采用强连通组件进行性能评估。首先,定义强连通组件,为了与其他先进方法相比较,本发明主要研究节点对网络连接的重要性。每种方法根据相应的重要度量标准给出节点的排序序列。然后,从排名最高的人中排除了一些节点,并计算了累计排除的大小。最终,本发明的性能指标将是前k节点去除后的结果减小没有去除scc的节点大小,从而获得最高的分数。

实施例一

为了更加详实地阐述本发明的具体实施方式,我们选用蛇成语网络作为实施例。

成语是中国文化的结晶。学习成语可以帮助中文学习者理解中国文化,培养中国人的思维,增强语言意识,促进日常沟通。以成语为外语学习高级阶段的重点,专家们还提出了多种教学方法来教授汉语成语,其中“蛇成语”在中国非常流行。

“蛇成语”是一种基于成语的连锁游戏,即前一个成语的最后一个字与下一个成语的第一个字相同。“蛇成语”的形式为:w1→w2→…→wp,其中wi的最后一个字符与wi+1的第一个字符相同,i∈n。在一些更困难的模式中,要求wp=w1,这意味着最后一个成语与第一个成语相同,例如:一飞冲天→天下第一→一飞冲天。

首先从商务印书馆出版的汉语成语词典中获得成语,共计4602项。由这些成语组成的成语链相互交织,每一个成语都可以是多个链中的节点,由此构成符合要求的复杂系统模型。将“蛇成语”网络定义为一个有向图集g=(v,e),其中v是成语集合的节点,e是成语集合的边界。

然后,对g中4234个最重要节点排序。计算g的熵,有368个孤立的节点不能链接,如爱才若渴、爱毛反裘和按图索骥。对边集合v中的每一个变量计算熵,并设置节点的重要性,得到网络密度为0.001175448,说明网络很稀疏。通过计算获得节点重要性序列和下降的重要性序列并返回,得到“蛇成语”网络的直径是16,平均路径长度为6.14,即只需要6步即可形成一个成语链。

最后通过强连通组件评估,设置的强连通组件有1907个成语,随机选择scc中的两个节点,总是存在从一个节点到另一个节点的路径,即通过节点重要度排序使得任选两个成语作为起点和终点总是可以通过scc相链接。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1