一种基于网页文本的学者观点抽取方法与流程

文档序号:18740716发布日期:2019-09-21 01:44阅读:来源:国知局
技术总结
本发明涉及一种基于网页文本的学者观点抽取方法,包括学者网页信息采集、文本数据预处理、观点抽取分析、观点摘要生成4个部分;学者信息抽取部分负责从互联网中获取给定学者相关的网页文本数据;文本数据预处理部分负责对原始网页文本数据进行清洗、语句分割、句法树分析、人名识别;观点抽取分析部分负责抽取出观点句,分析观点句的情感倾向和情感极性强度值。观点摘要生成部分负责将同一网页中的学者的所有观点语句进行总结,形成一个观点摘要段落。本发明综合利用了网络信息采集、数据挖掘、情感分析、自然语言处理等技术,从网络中自动提取出学者发表的观点及情感倾向,并生成观点摘要,有了解学者的社会活动和影响有重要意义。

技术研发人员:付培国;赵忠华;王禄恒;万欣欣;李欣;张小明
受保护的技术使用者:国家计算机网络与信息安全管理中心;北京航空航天大学
技术研发日:2019.03.21
技术公布日:2019.09.20

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1