基于社团发现的主题模型构建方法与流程

文档序号:11407475阅读:来源:国知局

技术特征:

技术总结
本发明公开一种基于社团发现的主题模型构建的方法的技术方案,先后包括如下步骤:基于短文本数据提取蕴含的关系网络;采用社团发现算法将关系网络划分成多个社团;将各社团中提取的短文本进行扩充以得到具有词共现关系的长文档,并将得到的多个长文档构成长文档集合;针对长文档集合进行主题挖掘,得到基于社团发现的TMCD主题模型。该方法从数据中内在蕴含的社团关系的角度出发,以社团发现算法为基础进行短文本的自扩展,解决了数据稀疏性问题。

技术研发人员:张雷;赵鑫;宋岳;李宁
受保护的技术使用者:南京大学
技术研发日:2017.05.22
技术公布日:2017.09.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1