一种网络舆情的监控方法

文档序号:8528161阅读:517来源:国知局
一种网络舆情的监控方法
【技术领域】
[0001 ] 本发明涉及网络舆情监控领域,尤其涉及一种网络舆情的监控方法。
【背景技术】
[0002]随着网络大力普及,人们越来越习惯在网络表达自己的观点,并且由于网络的庞大性和隐匿性,导致观点的表达更加真实、大胆,网络舆情逐渐引起人们的广泛关注。网络舆情具有一定地域特点,网络的热点话题也是社会中的热点话题,寻找网络舆情和社会舆情的联系,将舆情在网络上的传播和其在地理位置上的传播联系起来,是网络舆情的一个研究趋势。
[0003]但目前在舆情监控应用领域中,存在数据来源的局限性;当前舆情监控系统大多局限在某种或者某类特定的网络形态,导致舆情监控不够全面;并且现有技术仅停留在web2.0时代,无法从大量社交工具中获取信息源,无法获得舆情事件最开始的节点在哪里,哪个地方的传播是转折点,传播的路径等。

【发明内容】

[0004]本发明针对现有技术中,目前在舆情监控应用领域中,存在数据来源的局限性;当前舆情监控系统大多局限在某种或者某类特定的网络形态,导致舆情监控不够全面;并且现有技术仅停留在web2.0时代,无法从大量社交工具中获取信息源,无法获得舆情事件最开始的节点在哪里,哪个地方的传播是转折点,传播的路径等缺陷,提供了一种网络舆情的监控方法。
[0005]本发明就上述技术问题提供的技术方案如下:
[0006]本发明提供了一种网络舆情的监控方法,所述网络舆情的监控方法包括以下步骤:
[0007]S1、生成采集脚本,并根据所述采集脚本对网页页面文本源代码进行分析并进行链接抓取;
[0008]S2、在抓取完链接后把获得的链接存入链接池,对所述链接池进行行进行出式的处理;
[0009]S3、定期通过采集集群对链接池中的数据进行数据采集并将采集到的数据存入数据库中的页面快照;
[0010]S4、搜索服务器根据用户需求的关键词对存储的页面快照进行并发式定期搜索获得搜索结果;根据搜索结果完成网络舆情的监控。
[0011]在本发明所述的网络舆情的监控方法中,所述步骤SI中所述采集脚本包括针对各大资讯网站、微博、论坛的Php采集脚本,或全局性的适应各种类型页面的PhP采集脚本。
[0012]在本发明所述的网络舆情的监控方法中,所述步骤S3中所述采集集群分布在不同的Iinux服务器上,每台Iinux服务器上分别运行多个不相同的php采集进程,以对链接池中的数据进行数据采集。
[0013]在本发明所述的网络舆情的监控方法中,所述步骤S3包括:
[0014]采集集群对页面源代码进行图片与链接地址的转换然并提出关键字,并将所述关键字存入数据库中,并在指定的时间更新页面的数据。
[0015]根据权利要求4所述的网络舆情的监控方法,其特征在于,所述搜索服务器为Sphinx搜索服务器。
[0016]在本发明所述的网络舆情的监控方法中,所述步骤S4中根据搜索结果完成网络舆情的监控包括,对检索到包含了用户需求的关键词的内容根据预定规则进行存档,或即时通过短信、邮件等方式发送至客户。
[0017]在本发明所述的网络舆情的监控方法中,所述对检索到包含了用户需求的关键词的内容根据预定规则进行存档包括对检索到包含了用户需求的关键词的内容根据时间先后顺序或内容的传播路径进行存档。
[0018]本发明提供的网络舆情的监控方法,克服了目前在舆情监控应用领域中,存在数据来源的局限性;当前舆情监控系统大多局限在某种或者某类特定的网络形态,导致舆情监控不够全面;并且现有技术仅停留在web2.0时代,无法从大量社交工具中获取信息源,无法获得舆情事件最开始的节点在哪里,哪个地方的传播是转折点,传播的路径的缺陷,可以获知舆情事件最开始的节点在哪里,哪个地方的传播是转折点,传播的路径等,形成一套完整的舆情监控和追溯系统,特定的政府部门可以通过本网络舆情的监控方法净化互联网信息,营造一个健康绿色良好的上网环境;另外可以及时发现指定网络热点,从中挖掘潜在商业价值,便于商业利用。
【附图说明】
[0019]下面将结合附图及实施例对本发明作进一步说明,附图中:
[0020]图1为本发明实施例的网络舆情的监控方法的流程图。
【具体实施方式】
[0021]为了便于本领域普通技术人员理解和实施本发明,下面结合附图和具体实施例对本发明作更为详细的说明。
[0022]本发明针对目前在舆情监控应用领域中,存在数据来源的局限性;当前舆情监控系统大多局限在某种或者某类特定的网络形态,导致舆情监控不够全面;并且现有技术仅停留在web2.0时代,无法从大量社交工具中获取信息源,无法获得舆情事件最开始的节点在哪里,哪个地方的传播是转折点,传播的路径的缺陷,公开了一种网络舆情的监控方法。
[0023]如图1所示,本发明实施例的网络舆情的监控方法的流程图。在本发明实施例提供的一种网络舆情的监控方法,舆情是指将在互联网上各种信息发布平台上的布信息通Php脚本采集到并存入mysql数据库并进行即时的信息分析,然后通过关键字检索引擎Sphinx进行舆情的即时通知。所述网络舆情的监控方法包括以下步骤:
[0024]S1、生成采集脚本,并根据所述采集脚本对网页页面文本源代码进行分析并进行链接抓取;
[0025]S2、在抓取完链接后把获得的链接存入链接池,对所述链接池进行行进行出式的处理;
[0026]S3、定期通过采集集群对链接池中的数据进行数据采集并将采集到的数据存入数据库中的页面快照;
[0027]S4、搜索服务器根据用户需求的关键词对存储的页面快照进行并发式定期搜索获得搜索结果;根据搜索结果完成网络舆情的监控。
[0028]优选地,本发明实施例提供的网络舆情的监控方法中,所述步骤SI中所述采集脚本包括针对各大资讯网站、微博、论坛的Php采集脚本,或全局性的适应各种类型页面的php采集脚本。
[0029]优选地,本发明实施例提供的网络舆情的监控方法中,所述步骤S3中所述采集
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1