一种基于大数据的舆情聆听系统的制作方法

文档序号:25597657发布日期:2021-06-22 17:17阅读:来源:国知局

技术特征:

1.一种基于大数据的舆情聆听系统,包括服务器、数据库、智能网络爬虫系统、互联网网点和用户端,其特征在于:所述服务器的输入端通过因特网或无线网络与用户端双向连接,所述服务器的输出端通过因特网与互联网网点双向连接,所述服务器与互联网网点的连接处设置有防火墙,所述互联网网点的输出端通过智能网络爬虫系统与数据库的输入端连接,所述数据库与服务器双向连接,所述智能网络爬虫系统的内部设置有采集模块和分析聆听模块。

2.根据权利要求1所述的一种基于大数据的舆情聆听系统,其特征在于:所述互联网网点包括微博、博客、社区论坛网址、信息资讯网址、政府机构网址、新闻资讯网址、媒体网站、视频网站、搜索引擎以及社交网站。

3.根据权利要求2所述的一种基于大数据的舆情聆听系统,其特征在于:所述微博包括新浪微博、腾讯微博、网易微博、搜狐微博等,所述博客包括新浪博客、腾讯博客、网易博客、博客网等,所述社区论坛网址包括天涯论坛、新浪论坛、网易论坛、搜狐社区等,所述信息资讯网址包括行业资讯网、地方信息网等,所述政府机构网址包括中国政府网、首都之窗等,所述新闻资讯网址包括网易、人民网、新浪网等,所述媒体网站包括人民日报,中国日报等,所述视频网站包括youtube、优酷、腾讯视频、爱奇艺等,所述搜索引擎包括谷歌、百度、搜狗等,所述社交网站包括facebook、豆瓣、qq、微信等。

4.根据权利要求1所述的一种基于大数据的舆情聆听系统,其特征在于:所述采集模块包括智能提取、关键词检索、全文索引、智能去重和分类存储。

5.根据权利要求4所述的一种基于大数据的舆情聆听系统,其特征在于:所述智能提取包括标题、文章或评论、作者、日期、来源提取。

6.根据权利要求4所述的一种基于大数据的舆情聆听系统,其特征在于:所述智能去重包括url去重、标题去重和正文去重。

7.根据权利要求1所述的一种基于大数据的舆情聆听系统,其特征在于:所述分析聆听模块包括ip地址查重、智能初步分析和人工二次分析。

8.根据权利要求7所述的一种基于大数据的舆情聆听系统,其特征在于:所述智能初步分析的信息包括网址,点击数,回复数,转发数等。


技术总结
本发明公开了一种基于大数据的舆情聆听系统,涉及互联网信息处理技术领域,为解决现有舆情聆听系统对于数据采集方面不够全面,监测结果易受恶意用户灌水评论产生偏差,掩盖民众自然形成的正常舆情,导致网络舆情监控失去可靠性的问题。所述服务器的输入端通过因特网或无线网络与用户端双向连接,所述服务器的输出端通过因特网与互联网网点双向连接,所述服务器与互联网网点的连接处设置有防火墙,所述互联网网点的输出端通过智能网络爬虫系统与数据库的输入端连接,所述数据库与服务器双向连接,所述智能网络爬虫系统的内部设置有采集模块和分析聆听模块。

技术研发人员:张林
受保护的技术使用者:安徽舆鹰信息技术有限公司
技术研发日:2021.04.09
技术公布日:2021.06.22
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1