1.一种基于社交网络平台的舆情分析方法,其特征在于:所述该基于社交网络平台的舆情分析方法,具体步骤如下:
S1:通过搜索引擎后台的搜索日志,记录网民IP地址、搜索时间、搜索词和被点击的结果网页URL地址数据,通过统计分析用户的搜索词及搜索频率,获得数据集;
S2:对步骤S1中获取的数据集中的自然语义文本处理为计算机可处理的结构化数据,并过滤掉重复的内容;
S3:经过预处理后的数据实施基于词向量的聚类分析,采用优化后的均值聚类,进行聚类后将每类数据合为一个文档集合;
S4:依据步骤S3中的文档集合,抽取其中出现频率较高的搜索词和被点击的结果网页URL地址数据信息,得到相关热度的舆情结果。
2.根据权利要求1所述的一种基于社交网络平台的舆情分析方法,其特征在于:所述步骤S2中,对数据集的处理方法为:
S21:过滤具有针对性的对话互动信息,尽可能的消除噪声数据;
S22:将数据集中的内嵌外部链接URL中的信息抽取并添加到社交平台信息中;
S23:去除数据集中的分词、停用词和非法字符,初步得到干扰度较少的数据集信息。
3.一种基于社交网络平台的舆情分析系统,其特征在于:所述该基于社交网络平台的舆情分析系统包括信息采集层、调度层、舆情分析单元、舆情数据存储和舆情信息服务。
4.根据权利要求3所述的一种基于社交网络平台的舆情分析系统,其特征在于:所述信息采集层对互联网信息中的论坛、新闻、网页、博客、贴吧和社区的信息进行实时的监测和采集。
5.根据权利要求3所述的一种基于社交网络平台的舆情分析系统,其特征在于:所述调度层实现采集任务的下发和采集数据的去重,采集的范围和频率参数通过采集任务调度进行配置。
6.根据权利要求3所述的一种基于社交网络平台的舆情分析系统,其特征在于:所述舆情分析单元对采集的信息内容进行关键热词、趋势分析、舆情管理、负面信息、专题检测、连接分析、热点发现、文本聚类和情感分析。
7.根据权利要求3所述的一种基于社交网络平台的舆情分析系统,其特征在于:所述舆情数据存储内置存储器,在存储器中可存储网页快照和附件存储。
8.根据权利要求3所述的一种基于社交网络平台的舆情分析系统,其特征在于:所述舆情信息服务具有舆情预警和舆情简报功能,并提供专题服务。
9.根据权利要求8所述的一种基于社交网络平台的舆情分析系统,其特征在于:所述舆情预警设定了在指定时间内实例的负面信息达到相应数目的预警等级,具有对预警条件增删改查功能,并能够根据预警条件鉴定各实例的预警等级,舆情简报以简报的形式呈现每日每周重点舆情,且简报有多种设计格式供选择和编辑。