识别同义词的方法、装置和计算设备与流程

文档序号:12666840阅读:来源:国知局
技术总结
本发明公开了一种识别同义词的方法,在计算设备中执行,计算设备中存储有多个用户的多条查询记录,每条查询记录包括用户标识、查询时间和查询短语,该方法包括:根据已存储的预定时间内的多条查询记录确定多个会话,每个会话包括同一个用户标识的一个或多个查询短语;对于每一个会话,将该会话中的每一个查询短语划分为一个或多个词;根据预设的规则从每一个会话中提取候选同义词对;对于每一个候选同义词对:根据词向量模型来确定该候选同义词对中的两个词所对应的词向量,计算两个词向量的相似度,若相似度大于第一阈值,则将该候选同义词对中的两个词作为同义词。本发明还公开了能够实施上述方法的装置,和包括上述装置的计算设备。

技术研发人员:张平
受保护的技术使用者:北京齐尔布莱特科技有限公司
文档号码:201710002144
技术研发日:2017.01.03
技术公布日:2017.06.13

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1