文档分类方法及装置与流程

文档序号:12887202阅读:来源:国知局

技术特征:

技术总结
本发明提供了一种文档分类方法及装置,所述方法包括:获取预设篇数的样本文档,分别对所述样本文档中的样本词汇进行权重计算,以得到所述样本词汇对应的高频权重;获取目标文档,对所述目标文档中的目标词汇进行所述权重计算,以得到所述目标词汇对应的目标权重;将所述目标权重与所述高频权重进行对比计算,以得到所述目标文档的全文权重,并判断所述全文权重是否大于预设的权重阈值,若是则将所述目标文档归类至所述样本文档对应的文档领域,本发明无需进行数据模型的建立且可对所有领域的文档进行归类,通过简单的公式计算以判断是否将所述目标文档归类至所述样本文档对应的文档领域,且分类效率高。

技术研发人员:姚磊岳
受保护的技术使用者:江西科技学院
技术研发日:2017.06.09
技术公布日:2017.11.07
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1