一种有争议性新闻线索自动发现的方法及系统与流程

文档序号:18923171发布日期:2019-10-19 03:46阅读:来源:国知局
技术总结
本发明公开了一种有争议性新闻线索自动发现的方法及系统,该方法包括:步骤1,利用预设的初始文本对一文本集进行检索,获得多个检索文本;步骤2,对该多个检索文本进行聚类,对每一类的检索文本分别执行摘要提取算法,以获得该类的线索文本;步骤3,利用每类的该线索文本进行检索,获得每类的多个扩充文本;步骤4,利用每类的该多个扩充文本进行特征提取,基于一预设的打分模型对提取得到的每类的特征进行打分,分数高于一阈值的类所对应的线索文本为有争议的新闻线索。本发明可从大量文本中自动发现有争议新闻线索,实现了海量信息的深层信息挖掘,且可不断完善信息挖掘的准确度、有效性。

技术研发人员:曹娟;张勇东;张俊强;李锦涛
受保护的技术使用者:中国科学院计算技术研究所
技术研发日:2015.07.22
技术公布日:2019.10.18

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1