面向中文领域的非分类关系抽取方法、装置、设备及介质与流程

文档序号：16468737发布日期：2019-01-02 22:56阅读：来源：国知局

技术特征：

技术总结
本发明公开一种面向中文领域的非分类关系抽取方法，包括：将包含相同语义信息的术语放到同一集合，得到集合对应的概念；根据术语之间的相似度及预设第一阈值构建语义图；抽取术语上下文信息；将语义图和上下文信息输入至网络表示学习方法CANE，得到术语的表示；根据术语的表示计算概念相似度，预设第二阈值，得到强关联概念对；对包含概念对的句子进行依存句法分析，得到概念对相对应的所有动词；删除很少语义信息的动词；将剩余动词中包含相同语义信息的放到同一集合，得到概念对相对应的动词集合；计算动词分数并累加，以得到动词集合总分数；将总分数靠前动词集合作为非分类关系的标注。实现了利用句法信息和语义信息能够得到更好的抽取结果。

技术研发人员：仇晶;柴瑜晗;方滨兴;顾钊铨;李树栋;田志宏;殷丽华
受保护的技术使用者：广州大学
技术研发日：2018.07.17
技术公布日：2019.01.01

完整全部详细技术资料下载

当前第2页1 2