相似文本的确定方法、装置及设备与流程

文档序号:12887150阅读:来源:国知局

技术特征:

技术总结
本发明实施例公开了一种相似文本的确定方法、装置及设备。该方法包括:将第一目标文本和第二目标文本划分为相同数量的短文本,并筛选第一特征文本和筛选第二特征文本;基于第一特征文本与第二特征文本中字符长度较大的目标字符长度值和预设相似阈值,计算第一目标文本和第二目标文本之间允许不相同字符数;识别第一特征文本和第二特征文本之间不相同字符数;不相同字符数大于允许不相同字符数,确定第一目标文本和第二目标文本不相似;不相同字符数小于等于允许不相同字符数,确定第一目标文本和第二目标文本相似。本发明实施例能够不依赖中文分词库与中文分词算法,确定两个目标文本是否相似,减少内存的消耗和开销。

技术研发人员:徐云恒;熊胜;汤卫东;杨晶蕾;程幸生;江为强
受保护的技术使用者:中国移动通信集团湖北有限公司;中国移动通信集团公司
技术研发日:2017.05.15
技术公布日:2017.11.07
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1