一种基于时变阻尼运动的在线社交网络信息传播分析方法与流程

文档序号:17608242发布日期:2019-05-07 20:53阅读:136来源:国知局
一种基于时变阻尼运动的在线社交网络信息传播分析方法与流程
本发明涉及在线社交信息网络
技术领域
,特别是涉及一种基于时变阻尼运动的在线社交网络信息传播分析方法。
背景技术
:随着移动互联网技术不断地发展和5g通信时代的来临,以twitter、facebook、微博为代表的在线社交网络迅猛发展,发展成为人类社会中社会关系维系和信息传播的重要渠道与载体。在线社交网络的蓬勃发展,一方面极大地改变了人们的生活方式,由简单信息搜索和网页浏览转向网上社会关系的构建与维护、基于社会关系的信息创造、交流和共享;另一方面,也给社会带来了负面影响,例如,信息传播、虚假信息、网络诈骗等。因此,开展在线社交网络分析及网络信息传播的基础理论研究,有着重要的应用价值和社会意义。目前,针对在线社交网络的研究成为当前国内外的研究热点。主要包括网络结构特征、信息传播机理、群体行为演化等方面,涉及计算机科学、社会学、传播学、心理学、管理学等多个学科领域的交叉研究课题,而且社交网络用户规模庞大、网络结构复杂、用户行为多样,发布的信息具有海量性和异构性,具有“大数据”特征,导致传统的网络演化分析方法已无法满足要求,迫切需要面向大规模社交网络的新型模型与分析方法。大规模在线社交网络一个重要研究方向是从微观上对社交网络的用户进行建模,通过仿真用户间的相对关系变化和信息交互行为来研究社交网络宏观上的网络结构,以及中观上的网络群体和聚类特征的演化规律和内在机理,揭示社交网络中的用户关系结构、网络社区群体、网络空间信息之间的复杂交互关系和互动规律,为社交网络演化分析提供新的认识和理论支撑,对网络信息的合理利用,用户行为的正确引导,以及信息网络的有效管理起到重要的指导作用。从大量研究结论可知,建立在线社交网络信息传播模型是研究信息传播问题的必要方法和可行手段,通过建立合理的信息传播模型可以更真实、准确地描述在线社交网络中信息传播的复杂动态过程和传播规律,并且能较好地预测信息传播结果及其造成的影响,具有颇为重要的实际工作意义。技术实现要素:本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于时变阻尼运动的在线社交网络信息传播分析方法。为了实现本发明的上述目的,本发明提供了一种基于时变阻尼运动的在线社交网络信息传播分析方法,包括以下步骤:s1,将在线社交信息传播模型转换为信息传播时变模型;s2,对信息传播时变模型中的参数进行赋值展现;s3,任意选取节点数为n的在线社交信息网络中的一个节点作为种子节点,将初始信息能量为e的信息在t=0时刻注入种子节点,随即在网络上扩散传播,统计社交网络状态;s4,收集相应的在线社交媒体传播数据,与模型仿真结果数据进行比对;s5,将步骤s1~s4之一或者任意组合的数据结果发送到远程终端。在本发明的一种优选实施方式中,步骤s1中,将在线社交信息传播模型转化为信息传播时变模型的方法包括以下步骤:s11,在线社交信息传播模型为:其中,mi为用户i的节点质量,为用户i的受力速度;ni为用户i每天在线小时数,为用户i的信息初始能量,si为用户i的分享系数,ri为用户i的声誉系数;mj为用户j的节点质量;wi,j为用户i、用户j之间的亲密度权重,n1为关于此信息在社交网络上发表评论意见或进行信息转发的政府部门或媒体节点的总数量;为政府部门或媒体σl的节点质量和对应的影响因子;t为信息传播时间;为用户i的上线时差;sgn(d)为符号函数,d表示媒体所持的观点和意见,根据支持、中立、反对的意见决定其力的作用方向,其定义为:函数r(t)为斜坡函数,表示节点在一个周期内解读信息的时间越长,对信息理解越深刻,之后评论和转发的信息越权威,信息传播距离也就越远;r(t)在最小正周期内的定义为:函数u(t)为阶跃函数,在最小正周期内定义为:s12,假设用户i所对应的节点为信息发送节点,用户j所对应的节点为信息接收节点,令则转换为:ek=f1(i)f2(i,j)f3(i,t)e0i,s13,再令z(i,j,t)=f1(i)f2(i,j)f3(i,t),两个节点间的信息传播实际上就是一个非线性时变能量转换模型,表达式为:e(j,t+1)=z(i,j,t)e(i,t)。在本发明的一种优选实施方式中,步骤s2中,对信息传播时变模型中的参数进行赋值展现包括以下步骤:s21,分别取在线时长期望值u(n)的α1倍的样本值作为参变量输入系统,然后以n2sr为横坐标、f1(i)的概率p为纵坐标,绘制概率密图;所述α1为正数;s22,分别取在线时长方差值σ2(n)的α2倍的样本作为参变量输入系统,以n2sr为横坐标、f1(i)的概率p为纵坐标,绘制概率密图;所述α2为正数;s23,令社会舆论场力用户间的亲密度权重w服从指数分布,即w~e(λ),分别取用户间的亲密度期望值α3的样本值作为参变量输入系统,以w为横坐标、f2(i)的概率p为纵坐标,绘制概率密图;s24,对f3(i,t)进行复合函数分解,绘制每一个分量的变化规律,然后再将各分量进行叠加合成,得到f3(i,t)的变化趋势图。在本发明的一种优选实施方式中,步骤s3中,统计社交网络状态包括以下步骤:s31,统计社交网络上信息转发情况以及社交网络中的信息覆盖情况;s32,在信息传播过程中,统计信息传播路径;s33,信息传播结束后,统计各节点的信息能量;s34,将处于不同数量媒体情况下的信息转发效果和覆盖效果绘制成图表。在本发明的一种优选实施方式中,步骤s4中,收集相应的在线社交媒体传播数据,与模型仿真结果数据进行比对分析包括以下步骤:s41,对信息传播监测统计数据作为实证数据,以模型演化结果作为仿真数据,将二者进行归一化处理后,以时间序列为横坐标、以信息阅读量为纵坐标,绘制成图表进行对比;s42,将步骤s41中的数据逐点取出,计算余弦相似性、相关系数和误差峰值之一或者任意组合;s43,以时间序列为横坐标、以真实数据与仿真数据的差值为纵坐标,绘制误差波动曲线。在本发明的一种优选实施方式中,步骤s42中,余弦相似性、相关系数和误差峰值的计算方法为:余弦相似性similarity的计算方法为:其中,yi表示实证数据取值,yi'表示仿真数据取值;n2表示数据维度;相关系数ρ的计算方法为:其中,为实证数据取值的平均值,为仿真数据取值的平均值;误差峰值deviation的计算方法为:其中,max是表示取最大值。综上所述,由于采用了上述技术方案,本发明能够对在线网络事件进行热点预测,通过数值分析、仿真实验和经验数据分析,验证了预测系统的合理性和有效性。本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本发明seir模型状态转移示意图。图2是本发明特征提取示意图。图3是本发明上线时差影响示意图。图4是本发明单路径上信息示意图。图5是本发明信息受力分析示意图。图6是本发明信息能量转化示意图。图7是本发明节点信息传递算法流程示意图。图8是本发明信息传播过程示意图。图9是本发明信息传播路径分析示意图。图10是本发明信息传播时变系统示意图。图11是本发明n2sr概率分布示意图。图12是本发明随机变量n,s,r数学期望变化影响效果示意图。图13是本发明随机变量n,s,r方差变化影响效果示意图。图14是本发明随机变量w数学期望、方差变化影响效果示意图。图15是本发明信号合成示意图。图16是本发明网络节点度分布示意图。图17是本发明信息传播趋势示意图。图18是本发明信息传播路径统计示意图。图19是本发明信息能量分布示意图。图20是本发明媒体影响效果示意图。图21是本发明仿真与实证数据对比示意图。图22是本发明仿真与实证数据误差示意图。具体实施方式下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。首先给出以下现有的计算模型:模型1:基于传染病模型是信息传播领域公认比较成熟的模型,将人群分为易感者、感染者和治愈者,信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定态。传统模型有si、sir、sis,这些模型均无法反映易感者转化为感染者之前有一个潜伏期的事实,为此将潜伏状态引入sir模型,产生了seir模型。seir模型中,假如某用户发布一条内容后,其好友以一定的概率接收到信息,若该好友对内容感兴趣则以一定概率转发即传播该内容,若不感兴趣则忽略。模型中网络节点被划分为四类:未知者i(未接受过信息的节点)、潜伏者e(接受过但对信息持保留态度的节点)、传播者s(相信并传播信息的节点)、免疫者r(接受过但对信息不感兴趣或不相信信息的节点)。节点间的转换遵循以下规则:1)未知者i遇潜伏者e时,以概率p1受影响成为潜伏者e。2)未知者i遇传播者s时,以概率p2受影响成为潜伏者e,且可假定p2>p1。3)潜伏者e以概率α变为传播者s。4)传播者s以概率β变为免疫者r。seir模型的状态转移图如图1所示。根据传播规则,可得到seir信息传播模型的动力学方程为由式(1)可知,该网络中节点数量为一常量,则可假定i(t)+e(t)+s(t)+r(t)≡n。其中i(t),e(t),s(t),r(t)分别指t时刻各类节点占传播网络结点总数量n的比例。该类模型发展过程中,根据应用场景的不同出现许多变种,例如,研究新产品在社交网络中扩散的bass-sir模型,恢复时间是幂律分布的sir生命动力学模型,基于情感交流的hit-scir模型和具有两个时滞和垂直转移的seirs模型。模型2:基于博弈模型描述了网络上各节点在寻求自身利益最大化的交互过程中相互制约、相互渗透,寻找一个平衡点的过程,节点通过观点交互形成和更新自身观点。在社交演化博弈中,每个个体都有两个关注点,即短期效用和长期声誉,相对应存在着两种更新机制,即为了获得更好效用的策略更新和更好声誉环境的社交关系更新。社交演化博弈可表示为在一个带属性的三元组g=(v,e,i;u,r),其中v={i|1≤i≤n}表示个体集合,e={eij|i∈v,j∈v,1≤i≤n,1≤j≤n}是个体间的关系集合,i是个体间的交互集,表示个体间的交互依赖与个体间的关系,u为个体的效用函数集合,r为个体的声誉函数集合。在博弈过程中,个体i的效用是指在每回合博弈中个体i从对手中获得的收益之和,它指导个体与其他个体进行策略博弈,通过模仿其他成功个体的策略来不断改善自身的效用。个体i的声誉是其他个体对合作者行为策略历史的印象,它是个体的长期关注点,指导个体更新其社会关系,通过与高声誉个体建立社交关系并断开与低声誉个体的社交关系来改善自身所处的社交环境。在t时刻,个体i的声誉ri(t)可表示为ri(t)=σri(t-1)+δri(t)(2)式(2)中,δri(t)是时刻t的声誉增加值,σ是声誉的记忆衰减率。博弈设置中,个体有两种交互策略{c,d},策略c表示合作行为,使用该策略需要付出一定的成本,但是能够使其他个体以及自己获得收益,策略d表示非合作行为,使用该策略不需要付出任何成本,只是单纯地获得收益。运用囚徒困境、猎鹿博弈、雪堆博弈和公共品博弈建模。每一轮博弈后,个体i会更新自己的策略,个体i依fermi函数确定的概率w模仿个体j的策略,概率表达式如下:式(3)中,si,sj分别为节点i,j的策略集;ui,uj分别为节点i,j在此轮博弈中所获得的收益;β为模仿噪声,即个体模仿其他个体的意愿程度,当β→0时,表示趋向于随机模拟,当β→∞时则表示趋向于确定性模仿。模型3:基于物理系统模型是分析在线社交网络用户特征和网络属性,借用物理学中有关理论和方法,模拟在线社交网络中社交力量对信息传播的推动过程,最终探索出在线社交网络中信息传播行为的形成机理。基于人类动力学的社交网络信息传播模型,通过对网络浏览、手机短信通讯、网络通信、在线服务和在线社交网络活动等大量工作、娱乐中的人类活动实证研究表明,人类行为都具有阵发性、记忆性和异质性,表现为长时间的静默与短时间的高频率爆发。且对应的行为时间间隔分布和等待时间间隔分布具有明显的重尾特性,即时间异质性、非均匀性,能够很好地用幂律的行为时间间隔分布n2sr(τ表示连续两次行为的时间间隔)和等待时间间隔分布n,s,r(τw表示等待时间间隔)来描述。基于社交影响力和平均场理论的信息传播动力学模型,通过量化影响力强度和分析用户影响力对信息接收程度的影响,并利用平均场理论挖掘信息传播态势。基于引力势的在线社交网络中的信息传播模型采用社会物理学中的引力势理论来研究在线社交网络中信息在用户之间的传递过程。将社交网络看作一个引力场,处于社交网络的中的用户看作相互作用的质点,用无向图g'=(v,e)来表示一个在线社交网络,v={i|1≤i≤n}是用户质点集合,e是质点之间边的集合,ki为用户vi在社交网络中的节点度。假定每个用户节点都有一个质量mi=(m1,m2,…,mn),根据引力势理论,设粒子的质量为mj,位移为xj,它对位于xi处的粒子会产生引力,让r=|xi-xj|,x=(x1,x2)∈r2则在xi处受到的相互作用力与距离r成反比,则引力势的函数φ(t)可表示为根据在线社交网络中用户行为方式不同,定义了4种传播方式:1)浏览方式,阅读信息的数量记为n1。2)评论方式,评论信息的数量记为n2,网络中所传播的信息的时效性衰减系数为λi。3)生产方式,以传播者身份发布信息,复制传播数量为n3。4)传递方式,朋友圈对信息进行分享,这种人际传播数量记为n4。结合用户行为和引力势理论,得到在线社交网络中的用户之间在进行信息传播时的微观动力学工程如式(5)所示。式(5)中,t0为信息发布时的时间;v0为信息发布时的初始信息价值;α,β,γ,δ∈[0,1],满足α+β+γ+δ=1,表示网络用户的用户属性以及环境变化影响用户传播行为的影响因子,其值表示网络中不同类型的用户节点在参与信息传播时表现的信息传播形式。基于传染病模型属于宏观层面建模,忽略用户个体特征,不关注具体用户行为,只能反映信息传播的大致趋势,模型精度并不高。博弈论模型重视个体间交互行为,注重用户在互动中的动机,具体采用的策略简单划分为背叛与合作,相应带来不同的收益,这种划分过于武断,而且人的行为具有不确定性,模型较难准确模拟真实传播过程。基于物理系统的模型是在深入研究社会物理现象后,借鉴经典物理理论和方法,构建出信息传播模型,它能较为真实地反映信息传播的客观规律和作用机制。但是,目前基于物理运行系统对在线社交网络上的研究中,信息传播过程中特征提取过于简单,忽略很多比较重要的因素,而且从物理动力学来讲,人类社会信息传播一定是非线性的动力学,所以不能简单照搬经典物理理论。鉴于以上问题,本文在深入分析在线社交网络上信息传播现象的基础上,首先从时间、空间、行为人和信息四个维度进行特征提取,并进行量化和归一化处理,然后借鉴运动学、动力学和系统论知识,对信息传播过程进行分析和诠释,最后构建出基于时变阻尼运动的信息传播动力学模型tvdm。本发明提供了一种基于时变阻尼运动的在线社交网络信息传播分析方法,包括以下步骤:s1,将在线社交信息传播模型转换为信息传播时变模型;s2,对信息传播时变模型中的参数进行赋值展现;s3,任意选取节点数为n的在线社交信息网络中的一个节点作为种子节点,将初始信息能量为e的信息在t=0时刻注入种子节点,随即在网络上扩散传播,统计社交网络状态;s4,收集相应的在线社交媒体传播数据,与模型仿真结果数据进行比对;s5,将步骤s1~s4之一或者任意组合的数据结果发送到远程终端。在本发明的一种优选实施方式中,步骤s1中,将在线社交信息传播模型转化为信息传播时变模型的方法包括以下步骤:s11,在线社交信息传播模型为:其中,mi为用户i的节点质量,为用户i的受力速度;ni为用户i每天在线小时数,为用户i的信息初始能量,si为用户i的分享系数,ri为用户i的声誉系数;mj为用户j的节点质量;wi,j为用户i、用户j之间的亲密度权重,n1为关于此信息在社交网络上发表评论意见或进行信息转发的政府部门或媒体节点的总数量;为政府部门或媒体σl的节点质量和对应的影响因子;t为信息传播时间;为用户i的上线时差;sgn(d)为符号函数,d表示媒体所持的观点和意见,根据支持、中立、反对的意见决定其力的作用方向,其定义为:函数r(t)为斜坡函数,表示节点在一个周期内解读信息的时间越长,对信息理解越深刻,之后评论和转发的信息越权威,信息传播距离也就越远;r(t)在最小正周期内的定义为:函数u(t)为阶跃函数,在最小正周期内定义为:s12,假设用户i所对应的节点为信息发送节点,用户j所对应的节点为信息接收节点,令则转换为:s13,再令z(i,j,t)=f1(i)f2(i,j)f3(i,t),两个节点间的信息传播实际上就是一个非线性时变能量转换模型,表达式为:e(j,t+1)=z(i,j,t)e(i,t)。在本发明的一种优选实施方式中,步骤s2中,对信息传播时变模型中的参数进行赋值展现包括以下步骤:s21,分别取在线时长期望值u(n)的α1倍的样本值作为参变量输入系统,然后以n2sr为横坐标、f1(i)的概率p为纵坐标,绘制概率密图;所述α1为正数;s22,分别取在线时长方差值σ2(n)的α2倍的样本作为参变量输入系统,以n2sr为横坐标、f1(i)的概率p为纵坐标,绘制概率密图;所述α2为正数;s23,令社会舆论场力用户间的亲密度权重w服从指数分布,即w~e(λ),分别取用户间的亲密度期望值α3的样本值作为参变量输入系统,以w为横坐标、f2(i)的概率p为纵坐标,绘制概率密图;s24,对f3(i,t)进行复合函数分解,绘制每一个分量的变化规律,然后再将各分量进行叠加合成,得到f3(i,t)的变化趋势图。在本发明的一种优选实施方式中,步骤s3中,统计社交网络状态包括以下步骤:s31,统计社交网络上信息转发情况以及社交网络中的信息覆盖情况;s32,在信息传播过程中,统计信息传播路径;s33,信息传播结束后,统计各节点的信息能量;s34,将处于不同数量媒体情况下的信息转发效果和覆盖效果绘制成图表。在本发明的一种优选实施方式中,步骤s4中,收集相应的在线社交媒体传播数据,与模型仿真结果数据进行比对分析包括以下步骤:s41,对信息传播监测统计数据作为实证数据,以模型演化结果作为仿真数据,将二者进行归一化处理后,以时间序列为横坐标、以信息阅读量为纵坐标,绘制成图表进行对比;s42,将步骤s41中的数据逐点取出,计算余弦相似性、相关系数和误差峰值之一或者任意组合;s43,以时间序列为横坐标、以真实数据与仿真数据的差值为纵坐标,绘制误差波动曲线。在本发明的一种优选实施方式中,步骤s42中,余弦相似性、相关系数和误差峰值的计算方法为:余弦相似性similarity的计算方法为:其中,yi表示实证数据取值,yi'表示仿真数据取值;n2表示数据维度;相关系数ρ的计算方法为:其中,为实证数据取值的平均值,为仿真数据取值的平均值;误差峰值deviation的计算方法为:其中,max是表示取最大值。a、提出的基于时变阻尼运动的信息传播动力学模型tvdm1、个体特征分析根据传播理论,信息传播由传播者、受众、信息、媒介、反馈几个要素构成,信息传播过程可视作劝服性过程,认为传播的传播者试图影响接受者,并且总能取得一定效果。在在线社交网络上,虽然与人际传播非常类似,但是也呈现出许多独特的特征,它缩短了传播时间,压缩了传播空间,降低了信息维度等等。其中最为重要的是大幅度降低了信息传播的费用,减小社会运行成本,进而推动了大数据的发展,使得人们发现知识和获取知识更加便捷。根据传播学和复杂网络理论对在线社交网络进行分析,从时间、空间、行为人和信息四个维度提取出影响信息传播的基本特征,如图2所示。下面逐一对每个特征进行解释和描述。1)在线频率。表征用户登录在线社交网络的时间行为习惯,用在线角频率ω定量刻画。如果用户每天有n小时在线,那么在线角频率可表示为2)上线时差。表征用户登录在线社交网络的时间先后关系,用初相位表示。它反映用户接收信息和转发信息的时延,通常与地球时区与用户作息习惯有关。比如正在西方国家传播的信息,一般需要半天后才能在中国流传开来。在图3中,用户a(usera)、用户b(userb)都向用户c(userc)转发一条相同的信息,但是从时间序列上看,用户c与用户a同相,与用户b反相,以至于用户c能及时收到用户a发来的信息,而用户b的信息被忽略。3)社交关系。表示用户在社交网络中的全局重要性程度,用节点质量m进行度量。由用户在社交网络中关联其他用户数量的多少而决定,即网络图中节点度的大小。由于网络上节点度数差异巨大,为了避免小度数节点被忽略,因此对节点度数据进行对数平滑处理。即m=lg(1+ψ)(7)式(7)中,ψ为节点度。4)亲密程度。表示用户在社交关系网中的局部重要性程度,反映在线社交网络的群体特性。在信息传播中,人们倾向于相信亲朋好友的信息,而对陌生人的信息往往持观望态度或质疑态度。用亲密度权重w来刻画两个用户之间的这种信息取信程度,在社交网络上,绝大多数用户间的亲密度很低,w在(0,1)上服从参数为λ的指数分布,即w~e(λ)。5)分享意愿。描述用户面向其他用户进行信息发布、信息转发的主观能动性大小,用分享系数s予以刻画。它表示用户间一对多的群体交互信息行为,具有方向性。s受到许多相互独立的随机因素的影响,比如用户的性格、忙闲状态、心情等,总的影响可以看作是服从正态分布的,即6)社会声誉。一个用户的社会声誉是指其它用户对该用户的综合评价,社交网络中具有良好声誉的用户总是会受到其他用户的欢迎,进而成为拥有大量粉丝和高影响力的关键节点用户。用声誉系数r进行表示,社交网络上声誉很高和声誉很差的用户都占极少数,大多处于中等水平,整体上r服从正态分布,即7)信息能量e。信息之所以能够在网络上传播,是因为它具有能量,能量又可分为信息势能ep和信息动能ek两种。某一时期人类社会的认知水平和意识形态形成一个比较稳定的社会舆论场,可视为零势能面,只有与零势能面形成相对势能差的信息才能在社交网络上传播,这种相对势能差就是信息势能。信息动能是指信息传播过程中所具有的能量,它导致信息传播过程中会对接收者产生冲击,带来益处或伤害。在数值上,信息能量等于信息势能与信息动能之和,即e=ep+ek(8)为了方便阅读和理解,将上述七个特征描述与符号表示进行汇总,如表1所示。表1特征描述表2、信息传播运动分析在线社交网络上,信息传播往往是间歇性、阵发性、跳跃式地向前传播。同时,信息具有无限复制性,信息的复制不像具体物体的复制,一条信息可复制成上千万条,而成本非常低廉。一个节点出发多路径上信息的传播可看成是单路径上的线性叠加,因此,重点研究单一路径上的传播过程。在一条传播路径上,每个用户上线后获知上一用户传递而来的信息,进行解读后转发给下一用户,此过程依次迭代进行,形成一条传播链,后面用户获知信息的时延取决于前面用户的在线频率和上线时差。如图4所示,假若存在a、b、c、d四个用户,具有相同的特征,用户a(usera)转发一条信息能量为e的信息,它究竟能传播多远?为了解释信息能够传播多远的问题,引入信息传播距离的概念。信息传播距离x,指在单一传播路径上,各个节点具有相同的物理属性和个体特征,信息能够顺利到达后继节点的个数。如在图4中,用户a发布的信息,经用户b(usera)、用户c(userc)传播到用户d(userd)后终止,那么传播距离等于3。为了简化问题,先考察一种最简单的情况,忽略受众对信息的排斥作用和媒体的宏观引导作用。那么,传播距离仅与传播者个体属性、网络结构和信息本身有关,结合式(6)可将传播距离表示为式(9)中,x为传播距离;e为信息初始能量;s为分享系数;r为声誉系数;ω为在线频率;t为信息传播时间;n为每天在线小时数,为上线时差。函数r(t)为斜坡函数,表示节点在一个周期内解读信息的时间越长,对信息理解越深刻,之后评论和转发的信息越权威,信息传播距离也就越远。r(t)在最小正周期内的定义为将式(9)对时间求一阶导数,可得到信息传播的速度v为式(11)中,函数u(t)为阶跃函数,在最小正周期内定义为再将式(9)对时间求二阶导数,可得到信息传播的加速度a为式(13)中,函数δ(t)为单位冲激函数,其定义为如下3、信息传播受力分析在在线社交网络上,信息的传播会同时受到多个力的作用,它们的合力共同决定信息能否向前传播。如图5所示,用户a(usera)向用户b(userb)发送一条信息m,m受到三个力的作用,分别为如下。1)传播驱动力f1,描述传播者传递信息能力的大小,传播驱动力在数值上等于传播者节点质量m1与传播加速度a的乘积,即式(15)中,m1为用户a的节点质量。2)受众理性排斥力f2,描述信息受众对信息进行甄别的能力大小,它与自身和发送者节点的节点质量、亲密度权重及传播驱动力f1有关,受众理性排斥力f2可表示为式(16)中,m1,m2分别为用户a、用户b的节点质量;w为用户a、用户b之间的亲密度权重;f1为信息传播驱动力。3)社会舆论场力f3,政府权威部门或社会媒体机构对在线社交网络全局上施加的影响力,可作用于整个舆论场。舆论场力在方向上可正可负,当为正时,加速信息的传播,比如传播社会正能量、推送商品广告等;反之,当为负时,抑制信息的传播,比如政府出台法律约束信息传播、社会事件辟谣等。舆论场力大小与政府部门或媒体的节点质量和影响因子及信息传播驱动力有关,关系表达式为式(17)中,n1为关于此信息在社交网络上发表评论意见或进行信息转发的政府部门或媒体节点的总数量;为政府部门或媒体σl的节点质量和对应的影响因子。sgn(d)为符号函数,d表示媒体所持的观点和意见,根据支持、中立、反对的意见决定其力的作用方向,其定义为如下由以上讨论可知,合力f可表示为在合力f作用下,信息传播的加速度af和速度vf分别为4、信息传播演化过程在在线社交网络上,信息的传播扩散其实质就是信息能量在不同节点间的传递与转换。根据能量守恒原则,能量既不会凭空产生,也不会凭空消失,只能从网络中一个节点传递到另一个节点,而且能量的形式也可以互相转换,总是以信息动能和信息势能形式而存在。在信息传播过程中,根据信息所处位置和运动状态的不同,对应的能量表现形式也不同。1)信息在节点上,信息处于静止的状态,此时信息动能ek=0,信息能量表示为e=ep+ek=ep(22)2)信息在两节点之间,处于传播运动状态,此时信息势能ep=0,信息能量表示为e=ep+ek=ek(23)当某一节点拥有一条信息势能ep≠0的信息,由于势能差的影响,必将向邻居节点进行传播,使信息进入运动传播状态。在传播过程中,信息能量全部转化为信息动能ek,转化关系如式(24)所示。当信息到达接收节点后,信息进入静止状态,信息动能全部转化为信息势能ep。两节点间信息传递过程中,为了克服接收节点受众理性排斥力和社会舆论场力的作用,需要消耗一定的信息能量,从而能量逐渐衰减,随着传播路径的不断延长,信息能量衰减越严重,当信息能量小到不足以传播时,信息传播过程自然终结,传播活动停止。两个用户之间信息传递和信息能量转换的关系如图6所示。由以上推导可得出两个节点之间的信息传递算法,算法流程图如图7所示。对于整个网络系统而言,信息传递算法其实就是在在线社交网络图上执行广度优先遍历算法。从发布信息的初始节点开始,即种子节点,初始信息能量为e0,执行节点信息传递算法,将信息传播给这些后继节点。然后,再次选中种子节点的后继节点,再次执行节点信息传递算法,将信息传播给后继的后继节点。依次迭代,信息被不断向各个方向上传播,形成一个信息覆盖面。传播过程中,为了克服受众理性排斥力和社会舆论场力的作用,需要消耗一定的信息能量,随着传播链的不断延长,信息能量e逐渐减小,当各条传播路径上信息能量都衰减到足够小(趋于零)时,信息传播活动停止。整个信息传播过程如图8所示。在图8中,t0时刻,1号节点发布信息;t1时刻,1号节点执行节点信息传递算法,将信息传播给2、10号节点;t2时刻,2号节点将信息转发给3号节点,10号节点将信息转发给9、11号节点;t3时刻,信息由3号节点转发给4号节点,9节点转发给7号节点,11节点转发给5、12号节点,此时,由于4条传播路径上的信息能量衰减到非常小,趋于零值,因而传播行为结束。网络中6、8号节点一直未接收到信息,最终信息覆盖率达到83%(10/12)。整个信息传播过程构成一棵信息传播生成树,如图9所示。由图8和图9可见,虽然1号节点与8号节点相邻,在t1时刻也有足够的信息能量将信息传递给8号节点,但是因为1号节点与8号节点在线频率和在线时差不相同,没有同时在线,导致未能收到信息。6号节点虽然与5、7、12号节点相邻,但因这几个节点的信息能量非常低,无法将信息传递给6号节点。b、仿真分析1、数值模拟由信息传播演化过程和节点信息传递算法可见,信息传播的关键在于按式(22)、(23)、(24)进行信息能量的转化。假设用户i所对应节点为信息发送节点,用户j所对应的节点为信息接收节点,令则式(24)可改写为ek=f1(i)f2(i,j)f3(i,t)e(28)再令z(i,j,t)=f1(i)f2(i,j)f3(i,t)(29)e(j,t+1)=eke(i,t)=e结合式(23)易知,两个节点间的信息传播实际上就是一个非线性时变能量转换系统,系统表达式为e(j,t+1)=z(i,j,t)e(i,t)(30)系统特性示意图如图6所示。在f1(i)中,节点质量m1取决于网络拓扑结构,而在线时长n、分享系数s、声誉系数r由个体行为特征所决定,也就是说,f1(i)随个体行为习惯改变而改变。根据questmobile中国移动互联网2018半年大报告,中国移动互联网用户人均单日使用时长289.7分钟,即4.83小时,而且用户习惯一般服从正态分布,结合正态分布的“3σ”法则,可推断出目前国内在线社交网络上用户在线时长服从分布n~n(4.83,(4.83/3)2)。分享系数、声誉系数在不同的社会时期有不同的定义和不同的水平,根据传播学从众原则,可认为服从正态分布s~n(1,1/3),r~n(1,1/3)。虽然n,s,r均服从正态分布,但经过系统函数z变换后,输出值的分布情况将改变,服从概率密度如图11所示的分布。为了进一步考察输入随机变量n,s,r,w的特性变化对信息能量输出值的影响,下面逐一考察随机变量不同的变化情况。考察f1(i)随在线时长n的期望值的变化关系,分别取在线时长期望值u(n)的0.6,0.8,1.0,1.2,1.4倍的样本值作为参变量输入系统,然后以n2sr为横坐标、f1(i)的概率p为纵坐标,绘制概率密图,如图12(a)所示。由图中可看出,f1(i)的概率密度随着u(n)的增大明显右移,数学期望和方差同时增大,说明用户平均在线时间越长,信息传播时,传递给后继节点的信息能量越大,传播路径越长,信息覆盖面越大。用同样的方法观察分享系数、声誉系数期望值u(s)u(r)变化情况,结果如图12(b)所示,对f1(i)的概率分布并无显著影响,说明社会上分享系数、声誉系数平均水平在一定范围内变化对信息传播没有太大影响。考察f1(i)随在线时长n的方差的变化关系,分别取在线时长方差值σ2(n)的0.6,0.8,1.0,1.2,1.4倍的样本作为参变量输入系统,以n2sr为横坐标、f1(i)的概率p为纵坐标,绘制概率密图,如图13(a)所示。由图中可看出,f1(i)的概率密度随着σ2(n)的改变没有太大变化,说明信息传播与人们上线时长是否完全相等无关,只取决于大家的平均时长。用同样的方法观察分享系数、声誉系数方差σ2(s)σ2(r)的变化,如13(b)所示,发现对f1(i)的概率分布影响显著,概率密度曲线随着参变量样本离散程度的增长向右平移,f1(i)的数学期望和方差均有增加。说明社会上个人分享意愿、声誉水平差别较大时,人们的认知水平也较大,信息传播中容易形成舆论场,提高信息势能差,促使信息快速传播。为了简化问题的分析,暂时忽略社会媒体的影响,即令社会舆论场力f3=0,考察f2(i)随亲密度w的变化关系,w服从指数分布,即w~e(λ),分别取亲密度期望值λ=0.1,0.2,0.3,0.4,0.5的样本值作为参变量输入系统,以w为横坐标、f2(i)的概率p为纵坐标,绘制概率密图,如图14所示。由图中可看出,个体之间亲密度系数w≤0.85时,w分布的改变对f2(i)的概率分布并无影响;但当w>0.85时,对f2(i)的概率分布影响显著,而且这种影响力随着w的继续增长呈几何级数增长。说明在现实社会中,人与人之间的关系亲密程度并不是线性增长的,只有当亲密程度足够高时,比如朋友关系、亲人关系等,才会影响人的行为,进而影响信息传播。如果只是听说过某人、曾经见过某人,其实对信息传播的影响微乎其微。在在线社交网络上,每个人都有自己的上网习惯,这种习惯对信息传播的影响呈周期性变化,图15显示了f3(i,t)随时间t的变化规律,首先对f3(i,t)进行复合函数分解,绘制了每一个分量的变化规律,如图15中由上至下前四条曲线分别依次为第一曲线、第二曲线、第三曲线和第四曲线,然后再将各分量进行叠加合成,得到f3(i,t)的变化趋势,如图15中第五曲线。网络节点只有处于第五曲线上凸部分的时域内,才能向后继节点传播信息和辐射信息能量。说明用户在在线社交网络上的信息传播行为是间歇性和阵发性的,只有在整个周期中那一小段上凸部分时域内才能收到信息,才能向其他用户转发信息;否则,必须等待下一个周期的到来,同时由于信息具有时效性,如果未能及时将信息转发给自身的邻居节点,那么邻居节点很有可能已从其它路径获悉信息,导致该用户在下一周期内转发的信息被忽略,最终信息传播失败。2、仿真分析将基于时变阻尼运动的信息传播动力学模型tvdm应用于网络节点总数为n=10000的无标度网络上开展仿真实验,网络节点度分布服从γ=3的p(k)~k-γ幂律分布,分布图如图16所示。任意选取一个节点作为种子节点,将初始信息能量e0=20的信息在t=0时刻注入网络,随即在网络上扩散传播,信息传播效果如图17所示。图17(a)反映了网络上信息转发情况,即信息转发率随时间t的变化关系,传播初期信息转发率呈指数级增长,在t=5时达到峰值,瞬时转发率达到0.27。之后由于传播过程中信息能量的衰减,部分路径上的传播行为终止,导致转发率逐渐下降,在t=8时低至0.01。最后在t≥9的周期上,网络趋于稳定,只有极少数节点存在信息转发行为。图17(b)反映了网络中的信息覆盖情况,即信息覆盖率随时间t的变化关系,整体上呈现出”s”形曲线变化规律,起初阶段大致是按指数增长,然后开始变得饱和,增加变慢,最后在t=9时增加停止,最终稳定在0.91。传播过程结束后,网络中仍有9%的节点,即900个节点,未收到信息,说明在在线社交网络中,一条信息的传播,无法让所有的用户都能接收到。在信息传播过程中,对信息传播路径进行了统计,共形成传播路径6493条,以路径长度为横坐标、所占比例为纵坐标绘成图表,如图18所示。由图18可知,网络中最长路径等于11,路径长度等于6的路径数量最多,占0.43,即2775条。仿真结果与“六度分隔”理论高度吻合,再次说明在线社交网络具有无标度特性。网络中信息能否传播,主要取决于各节点的信息能量,信息传播结束后,统计各节点的信息能量,结果如图19所示。由图中可见,信息能量呈幂律分布,网络具有异质性,只有少数节点信息能量较高,绝大多数节点信息能量很低,信息能量高的节点一般处于信息覆盖区的中心地带,能量低的节点则处于边缘地带。信息传播还受到社会舆论场力的影响,对一般突发公共事件来说,媒体引导使人们趋于理性,不要盲目转发信息,因此施加了负的舆论场力,在一定程度上抑制了信息的传播。在实验网络中媒体节点数量分别取media=0,10,20,30,40,50,60进行仿真,将处于不同数量媒体情况下的信息转发效果和覆盖效果绘制成图表,如图20所示。随着媒体节点数量的增加,信息转发活动增长变慢,转发峰值时刻来得较晚,图20(a)所示。同时,信息覆盖面的增长也比较慢,但最终都能覆盖网络的大部分,如图20(b)所示。说明媒体的理性评论只会延缓信息传播的速度,而对信息覆盖面没有太大影响。3、实证对比分析为了进一步验证传播模型的有效性和可靠性,根据2018年12月份发生的热点事件,选取六条不同领域事件的典型信息,收集相应的在线社交媒体传播数据,与模型仿真结果数据进行比对分析,开展实证对比实验。详细的事件信息名称、类别及峰值阅读量如表2所示。表2典型热点事件信息表编号类别名称峰值阅读量a外交中美同意不再加征新关税1,159,691b军事美国撤军叙利亚314,462c政治在庆祝****40周年大会上的讲话4,462,115d科技要求微信支付赎金的勒索病毒1,829,246e体育柯洁击败韩国选手286,674f民生乐清男孩走失事件3,783,792表2中,信息a“中美同意不再加征新关税”,12月1日,中美就经贸问题达成共识,决定停止升级关税等贸易限制措施。信息b“美国从叙利亚撤军”,12月19日,美国白宫发言人桑德斯宣布,美国开始从叙利亚撤军。信息c“在庆祝****40周年大会上的讲话”,12月18日,中国****在庆祝****40周年大会上发表重要讲话,引起热烈的反响。信息d“要求微信支付赎金的勒索病毒”,12月1日,中国国内首次出现了要求微信支付赎金的勒索病毒,通过加密电脑上的常用文件,然后利用微信支付二维码进行勒索赎金,并且能窃取用户各类账号密码。信息e“柯洁击败韩国选手”,12月5日,第23届三星杯世界围棋公开赛决赛在韩国举行,柯洁击败韩国选手夺冠,加冕史上最年轻六冠王。信息f“乐清男孩走失事件”,浙江省乐清市黄某放学回家途中失联,该事件是走失男孩的母亲陈某故意制造的虚假警情。以“新榜”数据平台(www.newrank.cn)对上述信息传播监测统计数据作为实证数据,以模型演化结果作为仿真数据,将二者进行归一化处理后,以时间序列为横坐标、以信息阅读量为纵坐标,绘制成图表进行对比分析,如图21所示。图21中,(a)~(f)为不同事件的真实统计数据与仿真数据的对比,带圈曲线为网络上信息传播的真实统计数据,带星曲线为实验仿真运行结果的数据,可直观看到,两者变化趋势基本一致,拟合度好。接下来,再进一步进行定量对比分析,用yi表示实证数据取值、yi'表示仿真数据取值,将两组数据逐点取出,用式(31)、(32)、(33)分别计算每一组传播过程数据的余弦相似性、相关系数和误差峰值指标。为实证数据取值的平均值,为仿真数据取值的平均值,max是表示取最大值;如max(1,4,9)=9。余弦相似性是采用统计方法计算两组数据归一化后的相近程度;相关系数是考察这两组数据之间的相互关系、相关方向及线性相关程度;误差峰值是度量两组数据之间局部最坏情况下的离散程度。这三项指标计算结果如表3所示。表3对比实验结果数据表事件信息名称相似度相关系数误差峰值中美同意不再加征新关税0.90640.91170.1509美国撤军叙利亚0.92710.91310.1636在庆祝****40周年大会上的讲话0.93900.92580.1393要求微信支付赎金的勒索病毒0.95010.94880.1056柯洁击败韩国选手0.94520.94430.1444乐清男孩走失事件0.98550.98150.0693为了更进一步观察真实统计数据与仿真结果数据之间的偏离程度,以时间序列为横坐标、以真实数据与仿真数据的差值为纵坐标,绘制了六条信息的误差波动曲线,如图22所示,(a)~(f)为不同事件的误差波动曲线。如图22所见,数据偏差范围一般在正负0.1以内,最大值不超过正负0.2,偏差主要发生在信息大规模转发的阶段,此时系统受外界影响比较大,一个较小的扰动都会引起较大的变化,比如信息当事人的澄清、相关人员的信息补充等。从实证对比的结果来看,仿真结果与真实数据的吻合程度高,相似度达0.90以上、相关系数达0.91以上、误差峰值在0.2的范围以内。说明模型体现了信息传播的关键因素,反映了信息传播过程的客观规律,模型是准确的、有效的。本发明(1)借鉴运动学、动力学和系统论知识,在osn上提出了基于时变阻尼运动的信息传播动力学模型tvdm。(2)深入分析在线社交网络上信息传播现象,从时间、空间、行为人和信息四个维度提取关键特征,并进行定量刻画。(3)社交网络上信息传播具有时变特性,网络节点本质上就是一个时变系统,信息的接收和转发就是具有时滞的输入输出信号在系统中的变换,从而揭示出信息传递的本质规律。(4)信息传播过程抽象为在传播路径上带阻尼的简谐运动,实质上属于具有振幅、频率、初相的正弦波运动,信息以波动方式在传播路径上不断地向前传递。(5)信息之所以能够传播,是因为自身具有信息能量,而且以信息势能和信息动量两种形式存在,信息在节点间的传递和在节点上的处理本质就是两种形式能量间的不断转化。(6)信息传播过程受多种内外因素的影响,对此进行受力分析,揭示了信息传播过程是受到传播驱动力、受众理性排斥力、社会舆论场力综合作用的结果。(7)通过数值分析、仿真实验和经验数据分析,验证了该方法的合理性和有效性。尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1