一种基于标题高频切分的新闻热点短语提取方法与流程

文档序号:13421998阅读:来源:国知局

技术特征:

技术总结
本发明提供一种基于标题高频切分的新闻热点短语提取方法,包括以下步骤:对于每个热点话题类,提取新闻标题;对新闻标题进行分词,统计每个分词的词频,筛选出词频最大的前n个分词作为高频词集;使用高频词集寻找新闻标题的高频切分边界,并根据切分边界对新闻标题进行切分,得到候选短语;由此得到候选短语集;对候选短语集中的各个候选短语进行评价,筛选得到评价指数最高的候选短语,作为最佳短语。优点为:能够对每个热点话题提取出一个精简、准确描述话题内容的热点短语,对当前新闻热点话题内容的快速概括和有效展现提供了解决方案,提高了信息的展现和用户获取信息的效率。

技术研发人员:黄瑞章;刘于雷;梁山雪
受保护的技术使用者:贵州耕云科技有限公司
技术研发日:2017.08.25
技术公布日:2018.01.09
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1