一种新型大规模文档主题语义分析方法及系统与流程

文档序号:12665985阅读:来源:国知局
技术总结
本发明公开了一种新型大规模文档主题语义分析方法及系统,方法包括:检测已知文档集合中是否存在分类信息,若是,则执行有监督主体生成步骤,生成得到多个主题集合;反之,则执行无监督主体生成步骤,生成得到多个主题集合;根据得到的多个主题集合,将需要分析的文档分别计算与各主题集合的相关度,从而得到该文档在关于主题集合的主题分布情况。系统包括:主题集合生成单元和主题分析单元。本发明能从大规模文档数据当中自动、快速、灵活、有效地完成主题生成,并分析评估任意给定文档在生成主题上的主题分布,适用于快速生成主题的场合。

技术研发人员:赵淦森;杜嘉华;黄晓烽;王欣明;唐华;聂瑞华;汤庸;朱佳;史爱红
受保护的技术使用者:华南师范大学
文档号码:201610710249
技术研发日:2016.08.23
技术公布日:2017.06.13

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1