一种基于改进WMD算法的实体对齐方法与流程

文档序号:17950777发布日期:2019-06-19 00:00阅读:来源:国知局

技术特征:

技术总结
本发明是一种基于改进WMD算法的实体对齐方法。本发明步骤如下:获取同名百科实体对,计算实体对之间的属性相似度;计算实体间的摘要文本相似度;通过属性相似度和摘要文本相似度综合判断完成实体对齐。属性相似度计算包括:规范实体之对间属性名不一致的情况,将实体对的属性值归一单位化,通过编辑距离算法计算实体对之间的属性相似度。摘要文本相似度计算包括:对摘要文本分词并除去停用词,使用TextRank算法计算每个词的词权重,通过预训练好的word2vec模型,将分词后的摘要文本转化为词的分布式低维实数向量表示,将词向量和计算好的单个词权重作为参数。本发明有效降低了单纯依赖属性相似度来进行实体消岐工作带来的误差。

技术研发人员:姜明;闻涛;张旻;汤景凡;滕海滨;何杰成
受保护的技术使用者:杭州电子科技大学
技术研发日:2019.01.11
技术公布日:2019.06.18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1