一种基于规则的通用文本信息抽取和信息生成方法与流程

文档序号:18267554发布日期:2019-07-27 09:18阅读:来源:国知局

技术特征:

技术总结
本发明提供了一种基于规则的通用文本信息抽取和信息生成方法,包括:初始化信息字典上下文、规则词包、规则引擎与模板引擎;对文本进行信息标注;定义信息抽取算法和编写规则脚本代码;生成规则依赖有向图;执行文本抽取规则并根据抽取准确度进行微调;定义信息生成元模板;自定义模板规则选取与文本生成。本发明实现了抽取规则模块化,提高了抽取规则的共享可能性,能够对复杂文本信息的结构进行很好的分析挖掘,极大地提高了抽取信息与外部信息生成文本的效率,特别适用于法律文书等需要大量信息文本进行信息抽取和生成的领域。本发明方法能够显著提高文本抽取效率和准确度、优化文本抽取复杂度以及提高信息文本生成效率。

技术研发人员:骆斌;卢坚;伏晓
受保护的技术使用者:南京大学
技术研发日:2019.02.28
技术公布日:2019.07.26
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1