一种中文文本相似度的检测方法及检测装置与流程

文档序号:12120894阅读:来源:国知局
技术总结
本发明公开一种中文文本相似度的检测方法及检测装置,所述检测方法包括:步骤一:对中文本中的各个高频字进行拆分,获得多个部件及各部件之间的关联频次;步骤二:根据所述多个部件及各部件之间的关联频次,绘制对应中文文本的部件关联图;步骤三:基于所述中文文本的部件关联图,计算待检测文本与参照文本的相似度。本发明中文文本相似度的检测方法通过中文本中的各个高频字进行拆分,构建部件关联图,进而根据部件关联图,确定待检测文本与参照文本的相似度;部件之间相互关联组成汉字,以部件关联图作为相似度检测依据可以有效提高文件相似度检测的检测精度。

技术研发人员:黄华军
受保护的技术使用者:中南林业科技大学
文档号码:201610939958
技术研发日:2016.10.25
技术公布日:2017.03.22

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1