技术特征:
技术总结
本发明公开了一种基于多特征融合的短文本相似度计算方法,该方法包括以下步骤:首先,设计HTI方法提取短文本的词频特征,其次,利用已有的word2vec的Skip_gram训练模型提取短文本的语法特征,然后,设计HSBM模型在语义维度上对词频和语法特征进行有机融合,最后,设计MFSM模型计算将融合结果向量化,并计算短文本之间的相似度。本发明从多个维度提取短文本的特征,因此能有效地提高短文本相似度计算精度。
技术研发人员:高曙;周润;王讷;龚磊
受保护的技术使用者:武汉理工大学
技术研发日:2017.05.11
技术公布日:2017.10.20