一种移动社交网络中基于K阶马尔科夫链的节点中心性预测方法与流程

文档序号:17374893发布日期:2019-04-12 23:11阅读:314来源:国知局
一种移动社交网络中基于K阶马尔科夫链的节点中心性预测方法与流程

本发明涉及移动社交网络中节点中心性的建模和预测技术领域,具体是一种移动社交网络中基于k阶马尔科夫链的节点中心性预测方法。



背景技术:

近年来,随着装备有wi-fi接口或者蓝牙接口的移动智能设备(如:智能手机、ipad等)的普及和流行,基于移动社交网络方面的应用得到了蓬勃的发展。虽然移动社交网络本质上是一个拓扑时变的动态连通网络,但是具有这种特性的网络中用户的活动并非无规律的移动。在移动社交网络中,节点的移动特性主要依赖于人的行为模式,而人类的个体或者群体的活动一般具备规律性、集聚性和社会性等特性。人类内在的活动规律性使人们的行为具有高预测性。若能对移动社交网络中的活动规律进行分析,并对网络中用户未来的行为作出准确预测,对移动网络的切换、数据传递及人们的日常生活都有着非常重要的作用,有很大的商业价值和社会意义。

社交网络分析(socialnetworkanalysis,sna)是一种对关系进行量化的社会学研究方法,通过对网络中的各种关系进行量化表示,来揭示网络的结构和属性特征,分析个人、群体乃至整个网络的特征,从而对某种社会现象进行解释。目前比较有代表性的分析角度包括:拓扑、社区和中心性等(参见gaow.,liq.,zhaob.,etal.multicastingindelaytolerantnetworks:asocialnetworkperspective[c],inproceedingsofacmmobihoc,2009.)。研究表明,移动社交网络中只要5%-10%的重要节点同时失效就将导致整个网络瘫痪(参见laiy.c.,mottera.e.,andnishikawat.attacksandcascadesincomplexnetworks[j].lecturenotesinphysics,2004,650(650):299-310.)。因此,准确评价移动社交网络中节点的重要性相当重要。

移动社交网络中已提出多种中心性指标来度量节点的重要程度,如度中心性、介数中心性、接近中心性、特征向量中心性等。目前应用较多的为前三种,即度中心性、介数中心性、接近中心性(参见freemanl.c..centralityinsocialnetworksconceptualclarification[j].socialnetworks,1978,1(3):215–239.)。虽然研究人员已经对移动社交网络中的中心性指标进行了广泛的研究,但主要集中在分析不随时间变化的静态网络,或一段时间内的静态聚合网络。然而,移动社交网络的本质是动态的,动态分析节点之间关系的功能非常重要。随着时间的推移,节点所属的网络结构,以及和其他节点之间的接触关系都会经常变动,即节点在网络中的中心性是时变的。因此,本发明考虑从暂态角度出发,对移动社交网络中节点的未来中心性进行预测。

目前,对于移动社交网络中节点中心性的建模和预测,已经取得一定的研究成果。kim,zhou等通过对真实数据中节点中心性进行分析,分别提出了几种直观和综合的中心性预测方法来预测节点未来的中心性值(参见kimh.,tangj.,andersonr.,etal..centralitypredictionindynamichumancontactnetworks[j].computernetworks,2012,56(3):983-996;zhouh.,leungvictorc.m.,zhuc.,xus.,andfanj..predictingtemporalsocialcontactpatternsfordataforwardinginopportunisticmobilenetworks,ieeetransactionsonvehiculartechnology,66(11):10372-10383,2017.)。但是,kim,zhou等提出的几种直观和综合的中心性预测方法在不同特点的数据集中预测方法的性能具有较大的差异。这是因为它们未能充分的利用离散时间序列信息,而马尔科夫过程是研究事物的状态及其转移概率的理论,它既适用于时间和空间序列,同时又能充分的表现随机性。



技术实现要素:

本发明提供一种移动社交网络中基于k阶马尔科夫链的节点中心性预测方法,考虑从暂态的角度利用马尔科夫链模型来对节点的未来中心性进行预测,其预测方法不仅可以提高预测的准确率,而且具有更强的普适性。

本发明采取的技术方案为:

一种移动社交网络中基于k阶马尔科夫链的节点中心性预测方法,针对具有n个移动节点的移动社交网络,其中i∈{1,2,...,n};在移动社交网络中,节点间的接触描述为网络连通图g(v,e),其中节点对i,j∈v之间的随机接触过程建模成连通图中的边eij∈e。假设观测的网络开始时间为ts=0,结束时间为te=t。

将过去的观测时间t按照窗口大小w划分为n=t/w个时间窗口,基于过去的n个时间窗口的数据来预测未来的第n+1个时间窗口的节点中心性值。

一种移动社交网络中基于k阶马尔科夫链的节点中心性预测方法,包括以下步骤:

步骤1:每个节点都利用自己的缓存记录和其它节点的历史接触,包括接触次数和接触时间间隔等。每个节点和其他节点接触时,不仅记录彼此的接触情况,而且交换彼此缓存中的历史接触记录,这样每个节点就可以得到整个网络中节点的历史接触情况。

步骤2:利用缓存中存储的接触历史记录,每个节点可以构建一个时间序列网络拓扑图。根据构建的时间序列网络拓扑图,每个节点计算在每个时间窗口内的中心性值。具体地,将过去的观测时间t按照窗口大小w划分为n=t/w个时间窗口,利用缓存中存储的接触历史记录构建时间序列网络拓扑图。对于网络中的每个节点,计算其在每个时间窗口中的中心性值,这样可以得到一系列的基于时间序列的中心性值,对于节点i可以表示为这里用节点i作为例子,来介绍如何计算节点i在某个时间窗口的度中心性(degreecentrality)计算方法,具体如下:

其中:n是网络中节点的数量,e(i,j)代表节点对i和j是否直接接触,如果e(i,j)=1代表节点对i和j直接接触。

步骤3:构建k阶状态转移矩阵:

基于k阶马尔科夫链的预测方法中,对节点中心性的预测是通过当前已知的历史状态信息计算其所有可能出现的状态的概率,其中概率最大的状态就是所求的状态,即为预测的中心性值。状态转移概率矩阵是由状态的概率组成,基于k阶马尔科夫链的中心性预测方法主要是对状态转移概率矩阵的求解。

在求解k阶状态概率转移矩阵m时,通过距离当前时间窗口的邻近的k个时间窗口中的中心性来预测下一个时间窗口中节点的中心性。在状态转移概率矩阵m中,矩阵元素表示从一个状态d,经过k个时间单位后到达状态e的概率,成为k步状态转移概率:

md,e=p(xn+1=e|x(n-k+1,n)=d)(2)

其中,d表示(d0,d1,...,dk-1)中任意连续的k个中心性值,e表示一个独立的中心性值。

状态转移矩阵m的求解是由节点的大量中心性的历史数据而得到的,可以用节点中心性值出现过的频率来近似其概率:

式中:n(d)表示的是历史数据序列中某一状态d出现的次数,即k个中心性值连续出现的次数,n(e,d)表示的是历史数据序列中经过状态d以后,下一个状态为e的次数。

步骤4:预测方法。对第步骤2中得到的节点i的中心性值序列进行离散化,可以得到一个有限的状态空间,表示为s。k阶状态转移概率的马尔可夫链可用来估计对于所有a∈s和b∈s,其中b=(b1,b2,...,bk)。记nba为状态b在序列中跟在值a后的次数。记nb为状态b在序列中出现的次数,pb,a表示从状态b到状态(b2,...,bk,a)的状态转移概率的估计。基于构建的k阶状态转移矩阵,k阶马尔科夫链的最大似然估计量的状态转移概率为:

具体地,记bi表示节点i在k阶马尔科夫链中的当前状态。节点i在下一时间窗口的中心性值可以计算为:

本发明一种移动社交网络中基于k阶马尔科夫链的节点中心性预测方法,有益效果如下:

1)、本发明所提出的基于k阶马尔科夫链的预测方法不仅可以有效地提高预测的准确率,而且具有更强的普适性。

2)、本发明所提出的基于k阶马尔科夫链的预测方法相比已有的四种预测方法(最近时窗发,最近时窗平均法,最近时窗加权平均法,周期时窗平均法)(参见文献zhouh.,leungvictorc.m.,zhuc.,xus.,andfanj..predictingtemporalsocialcontactpatternsfordataforwardinginopportunisticmobilenetworks,ieeetransactionsonvehiculartechnology,66(11):10372-10383,2017.),在不同的中心性指标和真实数据中,均取得了较高的预测准确率。

3)、本发明所提出的分布式的预测方法算法简单,易于实现。

附图说明

下面结合附图和实施例对本发明作进一步说明:

图1为时间窗口划分说明示意图。

图2为时间序列网络拓扑结构示意图。

图3(a)为infocom06真实数据集中本发明所提出的预测方法在k=1,2,3条件下度中心性值的预测误差比较示意图。

图3(b)为mitreality真实数据集中本发明所提出的预测方法在k=1,2,3条件下度中心性值的预测误差比较示意图。

图4(a)为mitreality真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图一。

图4(b)为mitreality真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图二。

图4(c)为mitreality真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图三。

图5(a)为infocom06真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图一。

图5(b)为infocom06真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图二。

图5(c)为infocom06真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图三。

具体实施方式

本发明一种移动社交网络中基于k阶马尔科夫链的节点中心性预测方法,考虑从暂态的角度利用马尔科夫链模型来对节点的未来中心性进行预测。由于事物的发展具有持续性的特性,这使得相邻近的变量之间必定存在着十分紧密的联系,所以一阶马尔科夫模型还是存在着一定的局限性。为了使马尔科夫模型不仅能表现真实情况,还能使预测效果较好,本发明采用了bartlett(参见bartlettm.s.:thefrequencygoodnessoffittestforprobabilitychains.mathematicalproceedingsofthecambridgephilosophicalsociety47(1),86–95,1951.)提出的高阶马尔科夫链模型的概念。事实上,在移动社交网络中,节点由于自身的社会属性,节点状态会有一定的持续性,使节点中心性具有很强的相关性,即前一时段对后一时段的节点中心性有影响,与马尔科夫性质类似。因此,本发明针对移动社交网络的特性,提出了一种分布式的基于k阶马尔科夫链的预测方法来对节点的未来中心性进行预测。本发明提出基于k阶马尔科夫链的预测方法不仅可以提高预测的准确率,而且具有更强的普适性。

本发明主要针对具有n个移动节点的移动社交网络,其中i∈{1,2,...,n}。在移动社交网络中,节点间的接触可以描述为网络连通图g(v,e),其中节点对i,j∈v之间的随机接触过程可以建模成连通图中的边eij∈e。假设观测的网络开始时间为ts=0,结束时间为te=t。由于移动社交网络拓扑结构变化很快,为了方便建模,本发明将时间信息转换为一系列网络“快照”来研究动态网络的特征。如图1所示,本发明将过去的观测时间t按照窗口大小w划分为n=t/w个时间窗口,本发明的目标是基于过去的n个时间窗口的数据来预测未来的第n+1个时间窗口的节点中心性值。

具体而言,本发明所提出的预测方法,主要包括四个步骤:

1):每个节点都利用自己的缓存记录和其它节点的历史接触,包括接触次数和接触时间间隔等。每个节点和其他节点接触时,不仅记录彼此的接触情况,而且交换彼此缓存中的历史接触记录,这样每个节点就可以得到整个网络中节点的历史接触情况。

2):利用缓存中存储的接触历史记录,每个节点可以构建一个时间序列网络拓扑图。根据构建的时间序列网络拓扑图,每个节点计算在每个时间窗口内的中心性值。具体地,将过去的观测时间t按照窗口大小w划分为n=t/w个时间窗口,利用缓存中存储的接触历史记录构建时间序列网络拓扑图。对于网络中的每个节点,计算其在每个时间窗口中的中心性值,这样可以得到一系列的基于时间序列的中心性值,对于节点i可以表示为这里用节点i作为例子,来介绍如何计算节点i在某个时间窗口的度中心性(degreecentrality)计算方法,具体如下:

其中:n是网络中节点的数量,e(i,j)代表节点对i和j是否直接接触,如果e(i,j)=1代表节点对i和j直接接触。

3):构建k阶状态转移矩阵。基于k阶马尔科夫链的预测方法中,对节点中心性的预测是通过当前已知的历史状态信息计算其所有可能出现的状态的概率,其中概率最大的状态就是所求的状态,即为预测的中心性值。状态转移概率矩阵是由状态的概率组成,基于k阶马尔科夫链的中心性预测方法主要是对状态转移概率矩阵的求解。

在求解k阶状态概率转移矩阵m时,通过距离当前时间窗口的邻近的k个时间窗口中的中心性来预测下一个时间窗口中节点的中心性。在状态转移概率矩阵m中,矩阵元素表示从一个状态d,经过k个时间单位后到达状态e的概率,成为k步状态转移概率:

md,e=p(xn+1=e|x(n-k+1,n)=d)(2)

其中,d表示(d0,d1,...,dk-1)中任意连续的k个中心性值,e表示一个独立的中心性值。

状态转移矩阵m的求解是由节点的大量中心性的历史数据而得到的,可以用节点中心性值出现过的频率来近似其概率:

式中:n(d)表示的是历史数据序列中某一状态d出现的次数,即k个中心性值连续出现的次数,n(e,d)表示的是历史数据序列中经过状态d以后,下一个状态为e的次数。

4):预测方法。对第2步中得到的节点i的中心性值序列进行离散化,可以得到一个有限的状态空间,表示为s。k阶状态转移概率的马尔可夫外链可用来估计对于所有a∈s和b∈s,其中b=(b1,b2,...,bk)。记nba为状态b在序列中跟在值a后的次数。记nb为状态b在序列中出现的次数,pb,a表示从状态b到状态(b2,...,bk,a)的状态转移概率的估计。基于构建的k阶状态转移矩阵,k阶马尔科夫链的最大似然估计量的状态转移概率为:

具体地,记bi表示节点i在k阶马尔科夫链中的当前状态。节点i在下一时间窗口的中心性值可以计算为:

在预测节点未来中心性的过程中,有两个参数对计算精度至关重要,即马尔科夫模型的阶数和用于训练模型的历史数据长度。对于具有已知状态集的马尔科夫链模型,简单增大k不一定适用于时间序列中包含相关性的情况,马尔可夫链的阶数可以通过熵信息测试评估。

实施例:

图1给出了一个时间窗口划分的例子。假设观测的网络开始时间为ts=0,结束时间为te=t。由于移动社交网络拓扑结构变化很快,为了方便建模,本发明将时间信息转换为一系列网络“快照”来研究动态网络的特征。如图1所示,本发明将过去的观测时间t按照窗口大小w划分为n=t/w个时间窗口,本发明的目标是基于过去的n个时间窗口的数据来预测未来的第n+1个时间窗口的节点中心性值。具体做法为,先利用缓存中存储的接触历史记录,每个节点构建一个时间序列网络拓扑图。

如图2所示,假设观测时长为3个时间窗口,节点a根据缓存中存储的接触历史记录,构建一个时间序列网络拓扑结构图。基于构建的时间序列网络拓扑图,节点a计算在每个时间窗口内的中心性值,从而构建k阶状态转移矩阵,并利用公式(5)对未来的节点中心性值进行预测。同理,其他节点也采用节点a相同的方法来进行预测。

图3(a)、图3(b)给出了不同真实数据集中,本发明所提出的预测方法在k=1,2,3条件下度中心性值的预测误差比较示意图。所示,当阶数k=1时,度中心性值的预测误测具有较大的起伏和波动性,性能不稳定,预测效果不好。当阶数k=2时,基于马尔科夫链的预测方法预测性能相比k=3时的预测性能,虽然预测误差相对增大,但是波动性较小,预测结果相对稳定。从图中可以得到,基于k阶马尔科夫链的预测方法中,当k=2时在各个数据集中虽不能达到绝对最优解,但却是从算法的计算复杂度和误差两方面综合考虑的可行解。因此采用阶数为k=2阶马尔科夫链对移动社交网络中的节点中心性值的进行预测。

图4(a)、图4(b)、图4(c)给出了mitreality真实数据集中本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图。在对三种中心性指标进行预测时,基于k=2阶马尔科夫链的预测方法明显优于其他的四种预测方法,不仅在预测误差方面,在预测稳定性方面也具有较大的优势。当与最佳性能的最近时窗加权平均方法相比较时,在对度中心性的预测时,预测误差相差不大,而在对暂态介数中心性和暂态接近中心性的预测中,它们的预测误差基本持平。同时,可以看出基于k=2阶马尔科夫链的预测方法的波动性较小。

图5(a)、图5(b)、图5(c)给出了infocom06真实数据集中,本发明所提出的预测方法(markovk=2)和已有的预测方法lastmethod(最近时窗发),recentuniformaveragemethod(最近时窗平均法),recentweightedaveragemethod(最近时窗加权平均法)和periodicalaveragemethod(周期时窗平均法)在不同中心性指标下的预测误差比较示意图。,和在mitreality数据集中的实验结果类似,在对三种中心性指标进行预测时,基于k=2阶马尔科夫链的预测方法明显优于其他的四种预测方法,不仅在预测误差方面,在预测稳定性方面也具有较大的优势。当与最佳性能的最近时窗加权平均方法相比较时,在对度中心性和介数中心性进行预测时,预测误差基本持平,而在对接近中心性的预测中,基于k=2阶马尔科夫链的预测方法明显优于最近时窗加权平均方法。

上述具体实施例用来解释本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1