一种基于多维词句特征和情感分析的关键新词发现方法与流程

文档序号:14911482发布日期:2018-07-10 23:32阅读:来源:国知局
技术总结
本发明提供了一种基于多维词句特征和情感分析的关键新词发现方法,包括:步骤1,从电商平台抓取需求的评论;步骤2,对评论进行预处理;步骤3,采用NLPIR分词工具对评论进行分词;步骤4,利用多维词句特征对分词后的文本进行重复串的构造及过滤;步骤5,人工筛选训练样本的正确新词;步骤6,对新词进行字数组合以及词性组合的统计;步骤7,根据统计结果调整步骤4中过滤的阈值和加入词性组合过滤,得到测试样本的重复串集;步骤8,添加用户词典优化分词;步骤9,LTP对分词结果进行依存句法分析;步骤10,利用CRF++工具对依存关系中的支配词进行情感标记;步骤11,重复串本身是情感词或者其支配词是情感词的重复串为关键新词。本发明,在通过对大量某类电商产品的评论文本进行新词的挖掘,得到评论中起关键作用的新词,提高了分词的准确性,为文本挖掘分析工作提供了良好的基础。

技术研发人员:徐新胜;俞飞
受保护的技术使用者:中国计量大学
技术研发日:2018.04.12
技术公布日:2018.07.10

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1