一种基于多特征融合的短文本相似度计算方法与流程

文档序号:11775319阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种基于多特征融合的短文本相似度计算方法,该方法包括以下步骤:首先,设计HTI方法提取短文本的词频特征,其次,利用已有的word2vec的Skip_gram训练模型提取短文本的语法特征,然后,设计HSBM模型在语义维度上对词频和语法特征进行有机融合,最后,设计MFSM模型计算将融合结果向量化,并计算短文本之间的相似度。本发明从多个维度提取短文本的特征,因此能有效地提高短文本相似度计算精度。

技术研发人员:高曙;周润;王讷;龚磊
受保护的技术使用者:武汉理工大学
技术研发日:2017.05.11
技术公布日:2017.10.20
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1