一种基于中文语法规则的事件提取方法和系统与流程

文档序号:11707557阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种基于中文语法规则的事件提取方法和系统,包括存储模块、用于通过http请求获取网页内容,并将半结构化的网页文本数据存入存储模块的数据获取模块、用于将数据获取模块获取的半结构化的网页文本数据采用自然语言处理开源工具处理成特定的数学模型的文本预处理模块、用于对文本预处理模块处理过的文本通过构建中文语法树结合中文语法规则库,提取事件五要素并存入存储模块的语法解析事件提取模块以及用于与其他模块交互数据的接口模块。本发明能将非结构化的文本事件转化成结构化的事件信息,能用于新闻网页事件提取分析,事件提取结果能直接应用于事件舆情分析、事件热度分析等。

技术研发人员:徐琳;王犇;贺成龙;葛唯益;宗士强;姜晓夏;王羽
受保护的技术使用者:中国电子科技集团公司第二十八研究所
技术研发日:2017.02.14
技术公布日:2017.07.18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1