热词词组提取方法和系统与流程

文档序号:13072826阅读:来源:国知局

技术特征:

技术总结
本发明涉及一种热词词组提取方法和系统,热词词组提取方法包括以下步骤:获取关键词的历史词频以及当前词频;根据所述历史词频、当前词频以及关键词所在当前文本的平均热度权重计算当前词频的词频加权变化率;将所述词频加权变化率达到第一阈值的关键词作为热词,从所述当前文本中提取所述热词的相关词,得到热词集,根据所述热词集获取频繁项集;递归合并频繁项集内的热词,得到热词词组。上述热词词组提取方法和系统,通过计算当前词频的词频加权变化率获取热词,并获取对应的频繁项集,对频繁项集进行递归合并处理,得到最终能够代表当前的热点事件的热词词组,运算简便高效,且得到的热词词组能更准确地描述热点事件。

技术研发人员:曹航瑞;张颖;林志聪;马幸晖;王家宾;银超
受保护的技术使用者:世纪龙信息网络有限责任公司
技术研发日:2017.08.10
技术公布日:2017.12.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1