舆情监测分析方法与流程

文档序号:11155018阅读:来源:国知局

技术特征:

1.舆情监测分析方法,其特征在于,包括以下步骤:

步骤1、通过分布式网络爬虫技术实时抓取各电商网站商品及评论信息,利用模板提取其中的结构化数据进行存储;

步骤2、针对所存储的结构化数据,自动对其进行分类、聚类、生成摘要及名称识别,并进行正负性质预判;

步骤3、输出并根据需求呈现结构化数据。

2.如权利要求1所述的舆情监测分析方法,其特征在于,步骤2中,所述正负性质预判是指对评论信息进行文本情感分析。

3.如权利要求2所述的舆情监测分析方法,其特征在于,所述对评论信息进行文本情感分析的方法为:

步骤201、针对不同的商品类型建立不同的文本情感分析模型;

步骤202、判断该评论信息所属商品的类型,选择该商品类型对应的文本情感分析模型进行分析。

4.如权利要求3所述的舆情监测分析方法,其特征在于,步骤201中,所述针对不同的商品类型建立不同的文本情感分析模型中,其文本情感分析模型的建立方法为:获取已有的多个针对某一商品类型的评论信息作为训练集,在训练集的评论信息中进行中文分词操作,得到多个候选词,获取每个候选词对应的情感倾向,将候选词作为特征建立文本情感分析模型。

5.如权利要求4所述的舆情监测分析方法,其特征在于,所述获取每个候选词对应的情感倾向的方式为:判断候选词与一般情感基准词词典中各情感基准词之间的语义距离,确定候选词的情感倾向。

6.如权利要求4所述的舆情监测分析方法,其特征在于,所述获取每个候选词对应的情感倾向的方式为:人工建立标记情感语料库,将候选词与人工建立的标记情感语料库进行匹配,确定候选词的情感倾向。

7.如权利要求4所述的舆情监测分析方法,其特征在于,步骤202中,在分析时,还提取各评论信息中的候选词并进行统计排序,删除文本情感分析模型中低效和/或无效的特征。

8.如权利要求1或2或3或4或5或6或7所述的舆情监测分析方法,其特征在于,步骤2中,还对所存储的结构化数据进行清洗,所述清洗为对离群数据及明显不合理的数据进行剔除。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1