一种文档聚类的方法和装置与流程

文档序号:14403263阅读:来源:国知局

技术特征:

技术总结
本发明实施例提供了一种文档聚类的方法和装置,上述方法包括:获取待聚类的各目标文档的对应的用户行为信息,根据用户行为信息,确定每一目标文档的目标用户,将样本文档的文档标识与样本用户的对应关系,以及预设的类别数目,输入至预设的聚类分析模型进行训练,可以输出每一目标文档属于每一类别的第一概率。利用本发明实施例的方法,可以根据文档标识与目标用户的对应关系对目标文档进行聚类,避免目标文档包含的词语较少,和分词的准确度低导致的文档聚类的准确度低的问题,进而提高文档聚类的准确度。

技术研发人员:王志华;宋华;李雪;查强
受保护的技术使用者:北京奇艺世纪科技有限公司
技术研发日:2017.12.28
技术公布日:2018.05.11
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1