一种基于定点网站的舆情监测系统及方法

文档序号:6386030阅读:450来源:国知局
专利名称:一种基于定点网站的舆情监测系统及方法
技术领域
本发明涉及网络信息处理技术领域,具体涉及一种基于定点网站的舆情监测方法和系统。
背景技术
网络舆情监控是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的一个过程。网络舆情监控的背景随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元。如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。对相关政府部门来说,如何加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。“网络舆情监测系统”是征对在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿集合而进行的计算机监测的系统统称。“网络舆情”是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速,对社会影响巨大,加强互联网信息监管的同时,组织力量开展信息汇集整理和分析,对于及时应对网络突发的公共事件和全面掌握社情民意很有意义。舆情监控系统的一般工作流程如下1.信息采集:互联网信息(新闻、论坛等)的实时监测、采集、内容提取、下载及排重。2.信息处理:对抓取的内容进行自动分类聚类、关键词过滤、主题检测、专题聚焦
坐寸o3.信息服务:将采集并分析整理后的信息直接为用户或为用户辅助编辑提供信息服务。现在存在几个比较大的网民普遍浏览的网站,影响度非常高,信息传播速度和覆盖率都很大,因此需要一种基于定点网站的舆情监控系统,来给需要舆情监控的用户进行舆情的监控,尽快处理舆情危机。
现有舆情监控系统大都是基于搜索引擎的,覆盖的面积相当大,而且搜索引擎基本上是以信息热度排序的,当搜索引擎搜索到目标信息出现在搜索引擎的前几页时,此事件的关注度和传播度已经相当大了,所以基于搜索引擎的舆情监控系统的舆情监控速度较慢,用户进行舆情监控的目的便达不到了。

发明内容
本发明的目的是提供一种能够快速准确的报告用户需要信息出现的时间,网页类另IJ,信息热度等关键信息的基于定点网站的舆情监控系统。为达到上述目的,本发明采用的技术方案是:一种基于定点网站的舆情监测系统,其特征在于:包括一个配置定点网站入口的采集服务器,还包括一个信息索引模块;所述采集服务器下载定点网站下满足用户需要的目标网页并探测网页链接的状态,由信息索引模块对下载后的目标网页建立方便用户查询的索引文件。所述信息索引模块内置于所述采集服务器中或内置于另一信息索引服务器中。所述采集服务器采集目标信息的第一规则是:将采集点按网站的信息入口层次深入到定点网站的各层主页,并对主页按用户指定的关键词进行搜索筛查目标信息。所述采集服务器对目标信息根据规则进行筛选下载内容,并列表存储,所述内容包括:标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。
所述信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。所述的采集服务器采集目标信息的第二规则是:根据网站的影响力层次关系建立网站采集模型,以计算信息的热度,并对用户指定的关键词进行搜索。所述的采集服务器对目标信息根据规则进行筛选下载内容,所述内容包括:标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。所述的所述信息索引模块对内容与关键词进行建立--对应的索引文件,并将索
引文件存储至采集服务器或索引服务器中。具有上述的一种基于定点网站的舆情监测系统的舆情监测方法,其特征在于:包括如下步骤:(I)、用于设置定点网站的入口,在监测入口输入关键词;(2)、采集服务器对根据用户的关键词所查询到的目标信息进行下载,并将目标信息的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块;(3)、信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。所述方法还能够监测目标信息的连接出现和消失在主页上的时间点,还能够帮助用户继续查询目标信息热度和状态。本发明的一种基于定点网站的舆情监控系统能够快速准确的报告用户需要信息出现的时间,网页类别,信息热度等关键信息的。


图1、本发明的一种基于定点网站的舆情监测系统示意图;图2、本发明的一种基于定点网站的舆情监测方法的流程图。
具体实施例方式下面结合附图对本发明的一种基于定点网站的舆情监测系统及方法进行详细描述:如图1所示的本发明的一种基于定点网站的舆情监测系统,包括一个配置定点网站入口 Kl的采集服务器K2,还包括一个信息索引模块K3。信息索引模块K3可以设置在采集服务器K2中,也可以设置在另一信息索引服务器中。采集服务器K2下载定点网站下的用户需要的目标信息,由信息索引模块K3对下载后的目标信息建立方便用户查询的索引文件。用户在定点网站的入口处首先设置所要监控的定点网站地址,然后输入关键词,由采集服务器对用户输入的关键词进行检索查询。服务器中内置了信息查询的规则:即将采集点深入到定点网站的底层列表页,对用户指定的关键词进行搜索。所述采集服务器对目标信息根据规则进行筛选下载内容,并列表存储,所述内容包括:标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。规则有,标题长度、关键词、主词和谓词的组合。由信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。用户需要的时候可以查询索引文件,对目标信息进行进一步的监控,如:目标信息的评论数增加速度,以及目标信息是否出现在上层网站列表中,以及对评论内容的监控。这样就能够知道目标信息的热度情况,进而对目标信息进行监控,同时遇到影响度大的信息可以马上进行公关处理,避免信息给用户造成舆论压力。如图2所示的本发明的一种基于定点网站的舆情监测系统的舆情监测方法,其特征在于:包括如下步骤:(I)、用于设置定点网站的入口,在监测入口输入关键词;图2所示的St印1-St印2所示。(2)、采集服务器对根据用户的关键词根据规则进行下载,并将目标信息的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块;图2所不的Step3。(3)、信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中,图2所示的Step4-Step5。上述方法还能够监测目标信息出现在主页上的时间点,还能够帮助用户继续查询目标信息热度。如图1所示的本发明的一种基于定点网站的舆情监测系统,包括一个配置定点网站入口的采集服务器,还包括一个信息索引模块。信息索引模块可以设置在采集服务器中,也可以设置在另一信息索引服务器中。采集服务器下载定点网站下的用户需要的目标信息,由信息索引模块对下载后的目标信息建立方便用户查询的索引文件。用户在定点网站的入口处首先设置所要监控的定点网站地址,然后输入关键词,由采集服务器对用户输入的关键词进行检索查询。服务器中内置了信息查询的规则:根据网站的影响力层次关系建立采集模型,对用户指定的关键词进行搜索。网站的影响力层次即分为门户网站,地方网站,或者网站页面层次,即主页,栏目主页,频道主页,分类主页,列表页。所述采集服务器对目标信息根据规则进行筛选下载内容,并列表存储,所述内容包括:标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。由信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。用户需要的时候可以查询索引文件,对目标信息进行进一步的监控,如:目标信息的评论数增加速度,以及目标信息是否出现在上层网站列表中,以及对评论内容的监控。这样就能够知道目标信息的热度情况,进而对目标信息进行监控,同时遇到影响度大的信息可以马上进行公关处理,避免信息给用户造成舆论压力。如图2所示的本发明的一种基于定点网站的舆情监测系统的舆情监测方法,其特征在于:包括如下步骤:(I)、用于设置定点网站的入口,在监测入口输入关键词;图2所示的St印1-St印2所示。(2)、采集服务器对根据用户的关键词根据规则进行下载,并将目标信息的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块;图2所不的Step3。(3)、信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中,图2所示的Step4-Step5。上述方法还能够监测目标信息出现在主页上的时间点,还能够帮助用户继续查询目标信息热度。实施例:以“三鹿奶粉”事件为例,设置搜狐新闻为网站入口,选取第一种搜索规贝U,在搜狐主页下的最底层列表页输入“三鹿奶粉”,然后搜索信息视频,对搜索到的所有目的信息由搜索模块进行取地址操作,将目标信息的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。对信息的标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块与信息的地址存储至数据库中,建立一个一一对应的数据文件。用户在对目标信息进行查询的时候,需要在索引文件的数据库口出输入用户要查询的词语,如“患婴”,即能搜索出本条信息,以及本条信息的出现网站,出现时间,信息正文,评论数和评论你内容。在索引文件中设置信息的后续跟踪程序,每经过一个时间段,重新对目标信息进行提取,观测目标信息的出现网页进行进一步的监控,查询目标信息是否移动至搜索引擎主页中,以及评论数的增加情况。实施例二:以“三鹿奶粉”事件为例,设置搜狐新闻为网站入口,选取第二一种搜索规则,在搜狐主页下的网站层次模型中输入“三鹿奶粉”,然后搜索信息视频,对搜索到的所有目的信息由搜索模块进行取地址操作,将目标信息的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。对信息的标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块与信息的地址存储至数据库中,建立一个一一对应的数据文件。用户在对目标信息进行查询的时候,需要在索引文件的数据库口出输入用户要查询的词语,如“患婴”,即能搜索出本条信息,以及本条信息的出现网站,出现时间,信息正文,评论数和评论你内容。在索引文件中设置信息的后续跟踪程序,每经过一个时间段,重新对目标信息进行提取,观测目标信息的出现网页进行进一步的监控,查询目标信息是否移动至搜索引擎主页中,以及评论数的增加情况。如上所述,结合附图和实施例所给出的方案内容,可以衍生出类似的技术方案。但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种基于定点网站的舆情监测系统,其特征在于:包括一个配置定点网站入口的采集服务器,还包括一个信息索引模块;所述采集服务器下载定点网站下满足用户需要的目标网页并探测网页链接的状态,由信息索引模块对下载后的目标网页建立方便用户查询的索引文件。
2.根据权利要求1所述的一种基于定点网站的舆情监控系统,其特征在于:所述信息索引模块内置于所述采集服务器中或内置于另一信息索引服务器中。
3.根据权利要求2所述的一种基于定点网站的舆情监测系统,其特征在于:所述采集服务器采集目标信息的第一规则是:将采集点按网站的信息入口层次深入到定点网站的各层主页,并对主页按用户指定的关键词进行搜索筛查目标信息。
4.根据权利要求3所述的一种基于定点网站的舆情监测系统,其特征在于:所述采集服务器对目标信息根据规则进行筛选下载内容,并列表存储,所述内容包括:标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。
5.根据权利要求4所述的一种基于定点网站的舆情监测系统,其特征在于:所述信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。
6.根据权利要求2所述的一种基于定点网站的舆情监测系统,其特征在于:所述的采集服务器采集目标信息的第二规则是:根据网站的影响力层次关系建立网站采集模型,以计算信息的热度,并对用户指定的关键词进行搜索。
7.根据权利要求6所述的一种基于定点网站的舆情监测系统,其特征在于:所述的采集服务器对目标信息根据规则进行筛选下载内容,所述内容包括:标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块。
8.根据权利要求7所述的一种基于定点网站的舆情监测系统,其特征在于:所述的所述信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。
9.具有如权利要求1-8所述的一种基于定点网站的舆情监测系统的舆情监测方法,其特征在于:包括如下步骤: (1)、用于设置定点网站的入口,在监测入口输入关键词; (2)、采集服务器对根据用户的关键词所查询到的目标信息进行下载,并将目标信息的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块; (3)、信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。
10.根据权利要求9所述的一种基于定点网站的舆情监测方法,其特征在于:所述方法还能够监测目标信息的连接出现和消失在主页上的时间点,还能够帮助用户继续查询目标信息热度和状态。
全文摘要
本发明公开了一种基于定点网站的舆情监测系统及方法,舆情监测系统包括一个配置定点网站入口的采集服务器,还包括一个信息索引模块;舆情监测方法包括如下步骤(1)、用于设置定点网站的入口,在监测入口输入关键词;(2)、采集服务器对根据用户的关键词所查询到的目标网页进行下载,并将目标网页的内容进行列表存储,信息内容包括标题,信息时间,信息的来源,信息正文,评论内容及评论数,并传输至信息索引模块;(3)、信息索引模块对内容与关键词进行建立一一对应的索引文件,并将索引文件存储至采集服务器或索引服务器中。能够快速准确的查询显示信息出现的时间,网页类别,信息热度等关键信息的。
文档编号G06F17/30GK103177076SQ201210587638
公开日2013年6月26日 申请日期2012年12月28日 优先权日2012年12月28日
发明者杨小豹, 赵树合, 刘润鹏, 杨晓龙 申请人:中联竞成(北京)科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1