针对在线社交网络数据提取后的稳定性判别方法与流程

文档序号:17082226发布日期:2019-03-09 00:24阅读:213来源:国知局
针对在线社交网络数据提取后的稳定性判别方法与流程

本发明涉及大数据分析领域,尤其涉及一种。针对在线社交网络数据提取后的稳定性判别方法。



背景技术:

随着移动互联网的发展、5g时代的来临,在线社交网络越来越流行,人们的日常工作和生活已经离不开这些社交网络,随之产生的大量信息也充斥着网络,无论是谣言还是商品广告信息等都会在网络上蔓延,因而了解信息背后的传播机理能够帮助人们更好地管理和控制网络上信息的传播。

在线社交网络上的信息传播在诸多因素的影响下进行演化,既包括传播速度和扩散范围的演化也包括信息自身内容的演化。影响因素有很多,但归结起来不外乎信息自身特征、传播信息的网络用户的特征与行为、承载信息传播的社交网络的拓扑结构,以及信息传播的宏观环境。此外,社交媒体上信息传播有时还受到社会媒体服务所提供的信息推送功能的影响,比如facebook的newsfeed、新浪微博的即时推、腾讯视频的消息推荐等。这几个方面是在线社交网络中信息传播的关键因素,它们共同决定了信息传播与演化的行为与模式。

基于传染病的多信息建模方法是从用户的角度出发,认为用户以一定概率传播事件信息,传染病模型是信息传播领域公认比较成熟的模型,传统模型有si、sir、sis,其中sir模型是将人群分为易感者s状态、感染者i状态和治愈者r状态,信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定态。sis和sir模型产生了很多变体,如sirs、sidr和sair。但是这些模型均无法反映s状态节点转化为i状态节点之前有一个潜伏期的事实,为此将潜伏状态引入sir模型,产生了seir模型。在此基础上,为了刻画信息传播中广泛存在的点到群的传播模式,提出了e-seir模型。随着研究工作的不断深入,传染病模型在许多实际应用领域得到了进一步的发展,例如,研究新产品在社交网络中扩散的bass-sir模型,恢复时间是幂律分布的sir生命动力学模型,基于情感交流的hit-scir模型和具有两个时滞和垂直转移的seirs模型。

当模型建立之后数据提取的准确率无法保证,对于相应模型的稳定性无法预知其工作效率,这就亟需本领域技术人员解决相应的技术问题。



技术实现要素:

本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种针对在线社交网络数据提取后的稳定性判别方法。

为了实现本发明的上述目的,本发明提供了一种针对在线社交网络数据提取后的稳定性判别方法,包括如下步骤:

当在线社交网络数据通过概率模型进行收集整理后,通过设置平衡点公式e=(s,ia,ib)t,求解得到方程组的三个解e0,en,et,这三个解都是cisir传播模型的平衡点,e0,en,et的具体表示分别为:

s1,e0=(1,0,0)t,初始状态,无在线社交网络数据信息传播时的平衡点;

s2,终止状态,在线社交网络数据信息已经传遍整个网络后的平衡点;

s3,在前提下,在线社交网络数据信息在竞争传播过程中,达到暂时稳定状态的平衡点其中c为常数,

为了描述的方便,对

中的部分表达式进行变量替换,令

其中,μ1为a信息传播率与在线社交网络的度分布函数的乘积,μ2为b信息传播率与在线社交网络的度分布函数的乘积,v1为a信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,v2为b信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,

然后再对

的每个变量求偏导数,得到方程组的对应矩阵:

通过三个平衡点的约束条件进行数据稳定性判断,将通过概率模型形成的在线社交网络数据稳定性判别之后,传输到远程终端。

所述的针对在线社交网络数据提取后的稳定性判别方法,优选的,所述s1包括:

当r0<1时,平衡点e0=(1,0,0)t是全局渐近稳定的。

在平衡点e0=(1,0,0)t处,平衡点矩阵j(e0)为

设矩阵的特征多项式为

m3r3+m2r2+m1r+m0=0

r是特征值,m3、m2、m1、m0分别是特征多项式系数,

求解j(e0)的特征多项式,

解得

其中i为单位矩阵,

由此构造出在平衡点e0处的routh阵列表

只有当阵列表中第一列系数均为正实数,计算结果才稳定,即

经整理得,

因此,当时,e0平衡点才是稳定的,a信息和b信息所覆盖的节点数量均为零;为了使信息能够在网络上传播扩散,将参数设定必须满足条件,那么a信息和b信息才会在网络上传播,系统最终达到一个非零平衡点,使网络重新达到稳定态;

所述的针对在线社交网络数据提取后的稳定性判别方法,优选的,所述s2包括:在平衡点处,j(en)为

同理得,j(en)的特征多项式为

解得

由此构造出在en点处的routh阵列表

由表3第三行与第四行的第一列系数不可能同时为正数,因此,根据routh-hurwitz稳定性判据,该状态平衡点en处是不稳定的;说明当信息传遍整个网络后,网络同时存在信息a和信息b是不稳定的,受随机性影响,两种类型信息之间的替代行为会出波动,只有当其中一种类型信息完成抑制和替代了另一种类型信息之后,系统才会回到稳定状态,即en=(0,0,n)t或en=(0,n,0)t的情况;

所述的针对在线社交网络数据提取后的稳定性判别方法,优选的,所述s3包括:

在平衡点et处,

考察系统在平衡点处,j(et)为

同理可得,j(et)的特征多项式为

|ri-j(et)|=0

解得

由此构造出在et点处的routh阵列表

由routh-hurwitz稳定性判据和表4可知,当系统满足下式约束条件时,系统在平衡点en处是局部稳定的。

上式看出,这是一个非常强的约束条件,一般情况下难以满足,说明网络上信息一旦开始传播,不借助外力干预很难立即停止信息的传播扩散行为。

如果网络上同时传播两种类型信息,其中一种类型信息对另一种类型信息形成完全压制之势,比如b信息在竞争中处于绝对优势,那么b信息被a信息替代的概率几乎为零,可认为是零概率事件,即置换率θ2=0,此时上述约束简化为

系统稳定性条件更难满足,说明网络上两种类型信息竞争过程中,如果其中一种类型信息取得了传播主导地位,那么该信息会更加迅速的进行传播扩散和替代另一种类型信息。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

建立的概率模型以及传播模型受到的扰动作用消除后,经过一段过渡过程以后能够回到原来的平衡状态,并且足够准确地返回到之前的平衡态,上述数据模型能够恢复到此前的平衡状态使数据扰动消失,形成的数据结果偏差变小,将在线社交数据提取之后,能够快速的进行数据匹配,形成数据趋势预判,为在线社交网络数据的发展提供有益帮助,抓取准确的数据信息发送到远程终端。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是本发明数据结构节点状态转换示意图;

图2是本发明节点状态转化过程图;

图3是本发明单一信息传播阶段的节点状态转换关系图;

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

本发明是基于在线社交网络的竞争性信息传播宏观模型cisir(competitiveinformationsusceptibleinfectedrecovered)提出的技术方案。

假设在竞争性信息传播模型中,网络上同时存在a信息和b信息两种不同类型的信息,随着时间的变化进行竞争性传播。按信息传播过程中网络节点所处的状态,可将节点划分为四类,分别为未传播任何信息节点(s状态)、已经收到a信息并积极传播的节点(ia状态)、已经收到b信息并积极传播的节点(ib状态)、已失去信息传播兴趣对所有信息持抵制态度的遗弃状态节点(r状态)。

如图1所示,λ1和λ2分别表示a信息和b信息的信息传播概率,刻画一个未传播任何信息状态下的节点对某种类型信息的响应程度,传播率越高,表示该节点有更高的可能性去选择传播该条信息。δ1和δ2分别表示对a信息和b信息的遗弃率,随着时间的推移,节点会逐渐对传播过的信息失去兴趣,在沉寂中慢慢遗忘。θ1和θ2分别表示a信息和b信息的置换率,即相互影响力,θ1越大,则表示b信息的吸引力更大,能把传播a信息的节点状态转化为传播b信息;反之,θ2越大,则表示a信息的吸引力更大,能把传播b信息的节点状态转化为传播a信息。

由上述转化规则可知,网络节点的状态空间c={s,ia,ib,r},每一个节点的状态转换是一个相对随机的过程,下一时刻的状态与该节点的历史状态无关,只与当前状态有关,也就是说节点的“将来”不依赖于“过去”,仅由“现在”决定,整个传播过程可以看成一个马尔可夫随机过程。因此,可用分布函数来描述节点状态转换的马尔可夫性,用x表示节点状态转换的随机变量,随机过程{x(t),t∈t}的状态空间为c,t为离散的时间序列集合,在条件x(ti)=xi,xi∈c下,x(tn)的条件分布函数恰等于在条件x(tn-1)=xn-1下x(tn)的条件分布函数,即

因此,竞争性信息传播过程本质上是每一个网络节点在状态空间c中不断进行状态转换的马尔可夫链。节点从状态u迁移到状态v的转移概率记为pij。

pij=p{x(tn)=v|x(tn-1)=u}(14)

由此可获得转移概率矩阵p。

将竞争性信息传播模型的节点状态规则代入(15)式,则转移概率矩阵p可简化为

在竞争性信息传播过程,一个节点从s状态x(ts)=s出发,在ti时刻转化为ia状态x(ti)=ia或ib状态x(ti)=ib,再经过若干个时间步的竞争,最后在tn时刻转化为r状态x(tn)=r,从此退出竞争而节点状态不再改变,直至传播过程结束,如图3所示。

在t∈(ti,tn)期间,由于a信息和b信息相互竞争,一个ia状态节点可能转化为ib状态,或者一个ib状态节点可能转化为ia状态。在这个随机过程中,转移概率矩阵p只与节点状态和时间t有关,因此,竞争性信息传播过程是齐次的马尔可夫链,根据c-k方程(chapman-kolmogorovequation)可知,节点状态的n步转移概率矩阵p(n)为p(n)=pn

也就是说,竞争性信息传播过程中,n步转移概率矩阵p(n)是一步转移概率矩阵p的n次方。从而可知,竞争性信息传播过程中网络节点状态的分布可由初始分布与一步转移概率完全确定。

宏观传播模型就是用统计的方法从系统层面去构建cisir信息传播过程的模型。传播初始状态是网络中所有节点均处于未传播任何信息状态,即s状态;在某时刻由外部事件引发的a信息和b信息同时注入网络,随即在网络上分别沿各自的传播路径进行扩散传播,被a信息覆盖的节点处于ia状态,被b信息覆盖的节点处于ib状态,当两种类型的信息在ia状态或ib状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触心理并逐渐遗忘,转化为r状态,最终,网络系统将处于一个稳定状态。在整个信息传播过程中,两种类型信息之间相互博弈、对抗竞争和持续影响。容易看出,这种传播方式本质上属于竞争性信息同步传播模式。

在现实环境中,更多的情况属于竞争性信息异步传播模式,在t1时刻a信息出现在网络上并迅速扩散传播,被a信息覆盖的节点处于ia状态;在某一时刻ti,b信息也在网络上传播,被b信息覆盖的节点处于ib状态,b信息会抑制a信息的进一步蔓延,甚至有可能会取代a信息,即能够使ia状态节点转化为ib状态,当然,竞争过程中也存在ib状态节点转化为ia状态的情形;随着时间的推移,节点逐渐转化为r状态,最终,网络系统会达到一个稳定状态。

从竞争性信息异步传播模式可以看出,信息传播过程被划分为两个阶段,第一阶段是网络上只有a信息的单一信息传播阶段,第二阶段是网络同时存在a信息和b信息的信息竞争传播阶段。在单一信息传播阶段,cisir模型退化为普通sir模型,此时网络节点的状态转换关系如图3所示为单一信息传播阶段的节点状态转换关系。

在传播过程的第二阶段,即信息竞争传播阶段,传播行为与竞争性信息同步传播模式相同。

假设在线社交网络是一个封闭网络,信息在网络中产生,而且仅在该网络中传播,期间网络上节点总量为n是稳定的,每个时刻变化的是网络中各种状态类型节点所占的比例。t时刻网络中s,ia,ib,r状态节点的数量分别为s(t),ia(t),ib(t),r(t)。用表示一个节点在某一时刻的状态,对于整个网络则有

其中,s(t)+ia(t)+ib(t)+r(t)=n。

根据平均场理论,cisir信息传播宏观模型在在线社交网络中传播演化过程可表示成微分方程组所示:

λ1,λ2分别表示a信息、b信息的传播率;θ1,θ2分别表示a信息、b信息被对方信息取代的置换率;δ1和δ2分别表示节点对a信息、b信息的遗弃率。

容易看出,宏观cisir概率模型揭示了内在传播规律和演化机制。

形成模型稳定性分析方法,在受到的在线社交网络数据扰动作用消除后,经过一段过渡过程以后能否回到原来的平衡状态或足够准确地返回到之前的平衡态。如果系统能够恢复到此前的平衡状态,那么称该系统是稳定的;若扰动消失后系统不能恢复到原来的平衡状态,反而偏差变得更大,则称该系统是不稳定的。

其中步骤3包括:s3-1,对于cisir信息传播模型微分方程组,将四个方程两端分别相加,得

从而使模型满足

s(t)+ia(t)+ib(t)+r(t)=n,其中n为常数,

根据不含r状态下的计算方法,得到如下公式:

假设在t时刻网络达到平衡点,那么网络将处于平衡态,因此有

优选的,s3-2,用p(k)表示在线社交网络的度分布函数,该分布函数表示选定一个在线社交网络数据信息节点,其度值恰好为k的概率,也就是该节点恰有k条边连接的概率,即公式:

设平衡点e=(s,ia,ib)t,求解上式得到方程组的三个解e0,en,et,这三个解都是cisir传播模型的平衡点,e0,en,et的具体表示分别为:

s-a,e0=(1,0,0)t,初始状态,无信息传播时的平衡点;

s-b,终止状态,信息已经传遍整个网络后的平衡点;

s-c,在前提下,表示信息在竞争传播过程中,系统达到暂时稳定状态的平衡点;

为了描述的方便,对

中的部分表达式进行变量替换,令

其中,μ1为a信息传播率与在线社交网络的度分布函数的乘积,μ2为b信息传播率与在线社交网络的度分布函数的乘积,v1为a信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,v2为b信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,

然后再对

的每个变量求偏导数,得到方程组的对应矩阵:

对于s-a,当r0<1时,平衡点e0=(1,0,0)t是全局渐近稳定的。

在平衡点e0=(1,0,0)t处,平衡点矩阵j(e0)为

设矩阵的特征多项式为

m3r3+m2r2+m1r+m0=0

求解j(e0)的特征多项式,

解得

由此构造出在平衡点e0处的routh阵列表

只有当阵列表中第一列系数均为正实数,计算结果才稳定,即

经整理得,

因此,当时,e0平衡点才是稳定的,a信息和b信息所覆盖的节点数量均为零;为了使信息能够在网络上传播扩散,将参数设定必须满足条件,那么a信息和b信息才会在网络上传播,系统最终达到一个非零平衡点,使网络重新达到稳定态;

s-b,在平衡点处,

j(en)为

同理得,j(en)的特征多项式为

解得

由此构造出在en点处的routh阵列表

由表3第三行与第四行的第一列系数不可能同时为正数,因此,根据routh-hurwitz稳定性判据,系统在平衡点en处是不稳定的;说明当信息传遍整个网络后,网络同时存在信息a和信息b是不稳定的,受随机性影响,两种类型信息之间的替代行为会出波动,只有当其中一种类型信息完成抑制和替代了另一种类型信息之后,系统才会回到稳定状态,即en=(0,0,n)t或en=(0,n,0)t的情况;

s-c,在平衡点et处,

考察系统在平衡点处,j(et)为

同理可得,j(et)的特征多项式为

|ri-j(et)|=0

解得

由此可构造出在et点处的routh阵列表

由routh-hurwitz稳定性判据和表4可知,当系统满足下式约束条件时,系统在平衡点en处是局部稳定的。

上式看出,这是一个非常强的约束条件,一般情况下难以满足,说明网络上信息一旦开始传播,不借助外力干预很难立即停止信息的传播扩散行为。

如果网络上同时传播两种类型信息,其中一种类型信息对另一种类型信息形成完全压制之势,比如b信息在竞争中处于绝对优势,那么b信息被a信息替代的概率几乎为零,可认为是零概率事件,即置换率θ2=0,此时上式约束简化为

系统稳定性条件更难满足,说明网络上两种类型信息竞争过程中,如果其中一种类型信息取得了传播主导地位,那么该信息会更加迅速的进行传播扩散和替代另一种类型信息。通过三个平衡点的约束条件进行数据稳定性判断,将通过概率模型形成的在线社交网络数据稳定性判别之后,传输到远程终端,将根据数据的稳定性强弱进行排序。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1