一种微博舆情传播范围预测的方法

文档序号:9687589阅读:1299来源:国知局
一种微博舆情传播范围预测的方法
【技术领域】
[0001] 本发明设及社会网络建模与分析领域,具体设及一种微博舆情传播范围预测的方 法。
【背景技术】
[0002] 微博已经成为现代社会最重要的新媒体平台之一,与传统媒体相比,具有及时、碎 片化、自由开放和大众性等特征。但是任何人都可W利用微博发布不良观点和评论,而且经 过众人的转发和评论后会迅速扩散到整个社会网络中。一些欺骗性的言论能够造成社会安 全的破坏、严重的会引发社会群体事件。因此政府相关部口必须对微博中的舆情信息进行 分析、监控和预测,为进一步的管理和控制做出准备。
[0003] 现有的互联网舆情信息监控和分析主要是关注两个问题:一是解决对海量信息的 人工化处理的难题,提出一些利用计算机的文本分析和机器学习的方法设计而成的自动舆 情分析系统,W此减少网络舆情监控过程中的人工劳动;二是尝试解决网络舆情发现精确 度的难题,通过改善和优化文本分析、聚类算法等方法,提高文本中舆情语义挖掘的准确 性。
[0004] 经过对现有技术的文献检索发现,中国专利公开号为:CN101661513B,专利名称 为:网络热点和舆情的检测方法,该技术方案提供了网络信息处理领域中的一种网络热点 和舆情的检测方法,可W应用到微博舆情的检测和分析中。通过捜集一定时间范围内的微 博正文信息和评论信息,并对运些信息的文本内容进行分词处理、概念映射处理,消除语义 概念的不确定性,最终提取能够反映文本内容的特征。再利用运些内容特征数据进行聚类, 形成若干个包含不等数量的信息文档集合,根据各个集合包含信息文档的数目来判定是否 为网络中的热点事件,在对热点事件的信息文档集合进行褒贬倾向的分析,从而掌握网民 对该事件的舆情观点,W此来检测微博舆情。
[0005] 现有对微博监控和分析的方法关注自动化分析处理和舆情信息的判定,忽视了舆 情在整个在线社会网络传播趋势的分析,无法向网络舆情管控人员提供舆情传播到了何种 程度,即无法判定某事件的舆情扩散程度。本发明从社会网络整体角度来检测和分析微博 舆情传播,提出一种预测微博舆情传播程度的方法,通过监测哨兵节点的信息来判断舆情 扩散情况。

【发明内容】

[0006] 本发明的目的在于解决上述问题,提供一种微博舆情传播范围预测的方法,通过 微博预测方法利用实际统计数据建立非线性模型,根据舆情事件的性质来监控哨兵节点的 状态来确定微博舆情的覆盖情况,并向网络舆情管理者提供精确的舆情传播量化数据。
[0007] 本发明解决上述问题所采用的技术方案是:
[000引一种微博舆情传播范围预测的方法,按照下列顺序依次进行:
[0009] 1)构建微博系统的传播网络模型:将每个微博用户视为一个节点,根据微博的粉 丝、关注和好友关系建立节点之间的连边,形成一个复杂的在线社会网络模型;舆情传播范 围即舆情消息覆盖率;
[0010] 2)在微博传播网络中选择判断舆情覆盖范围的哨兵节点;
[0011] 3)利用哨兵监测节点建立微博舆情传播范围的预测模型;
[0012] 在实际微博网络中对事件舆情进行实证统计分析,并确定预测模型中的关键参 数。
[0013] 优选的,1)中所述的舆情消息覆盖率为已获知消息的节点集合与全部节点集合的 比值,
[0014]
[0015] 式中巧表示节点数,庐为全部节点数,注意全部节点指微博网络中有效用户范围 内的节点总数;
[0016] 消息传播过程是时间序列了={*1,*2,-,,^八1+1^-},监测时刻*1^的信息覆盖率 为Ok,即
[0017] 优选的,3)中的预测模型为微博网络哨兵节点预测信息覆盖率的问题转变为由Vk G;cF)合并到的事件来预测Ok,研究节点子集Vk与覆盖率0之间的规律,建立预测模型,通 过探测属于Vk的哨兵节点的信息实现对信息覆盖率Ok的评估;在哨兵节点中选择一个节点 传播影响力。
[0018] 优选的,所述的哨兵节点包括意见领袖节点、社区中活跃节点、不活跃节点。
[0019] 优选的,所述的节点传播影响力为节点的度与间接连通节点平均距离的乘积,
[0020] I(i)表示节点i的影响力,outdegree(i)为节点的出度,dij表示与节点i间接连通 的节点j之间的距离,count(i)表示节点i间接连通的其他所有节点的个数;最后建立先用 统计方法建立节点影响力与信息覆盖率之间的关系模型
[0021] 0(I)=f(I),
[0022] W〇(I) = f(I),作为预测依据,探测若干节点是否传播到某条信息,W此来评估信 息覆盖率,节点j的传播影响力为。,则代入后得出〇(。),简写为化表示用探测节点j获取到 的信息覆盖率;
[0023] 选S曲线作为回归分析的基础模型,
[0024] 本发明的有益效果是:
[0025] 本发明在500-1000个微博节点的社会网络中进行实证统计实验,并W此获取预测 模型的重要参数。然后再自行编写网络微博抓取程序来分析,并统计5000-10000个节点的 社会网络数据,用此规模的微博网络验证预测方法的准确性,实验结果显示预测的准确性 约为83.2%。
【附图说明】
[0026] 图1是本发明影响力小节点作为源点的统计信息图;
[0027] 图2是本发明影响力大节点作为源点的统计信息图;
[0028] 图3是本发明中等影响力节点作为源点的统计信息图;
【具体实施方式】
[0029] 下面结合附图与【具体实施方式】对本发明作进一步详细描述:
[0030] 如图1、图2及图3所示,本发明所述的一种微博舆情传播范围预测的方法,实证的 范围是选取某大学工科四个学院的校选课学生587人,设及3个年
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1