一种基于依存语义的中文无监督开放式实体关系抽取方法与流程

文档序号:12034576阅读:来源:国知局

技术特征:

技术总结
本发明涉及一种基于依存语义的中文无监督开放式实体关系抽取方法,该方法包括以下步骤:预处理输入文本:对输入文本进行中文分词、词性标注和依存句法分析;对输入文本进行命名实体识别;从识别出的实体中任意选出两个实体构成候选实体对;寻找候选实体对中的两个实体之间的依存路径;分析依存路径所映射的句法结构是否与依存语义范式集的范式匹配,若是,则根据被匹配的范式从输入文本的剩余部分中抽取出词或短语作为关系词,抽取的关系词与候选实体对构成关系三元组,若否则进行下一组候选实体对的范式匹配;输出关系三元组。与现有技术相比,本发明具有计算复杂度低、抽取效率高、克服距离位置限制和满足单句也能抽取等优点。

技术研发人员:向阳;贾圣宾;鄂世嘉;吕东东
受保护的技术使用者:同济大学
技术研发日:2017.04.27
技术公布日:2017.10.24
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1