面向中文领域的非分类关系抽取方法、装置、设备及介质与流程

文档序号:16468737发布日期:2019-01-02 22:56阅读:来源:国知局

技术特征:

技术总结
本发明公开一种面向中文领域的非分类关系抽取方法,包括:将包含相同语义信息的术语放到同一集合,得到集合对应的概念;根据术语之间的相似度及预设第一阈值构建语义图;抽取术语上下文信息;将语义图和上下文信息输入至网络表示学习方法CANE,得到术语的表示;根据术语的表示计算概念相似度,预设第二阈值,得到强关联概念对;对包含概念对的句子进行依存句法分析,得到概念对相对应的所有动词;删除很少语义信息的动词;将剩余动词中包含相同语义信息的放到同一集合,得到概念对相对应的动词集合;计算动词分数并累加,以得到动词集合总分数;将总分数靠前动词集合作为非分类关系的标注。实现了利用句法信息和语义信息能够得到更好的抽取结果。

技术研发人员:仇晶;柴瑜晗;方滨兴;顾钊铨;李树栋;田志宏;殷丽华
受保护的技术使用者:广州大学
技术研发日:2018.07.17
技术公布日:2019.01.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1