一种大数据聚类方法及装置与流程

文档序号:18642828发布日期:2019-09-11 23:45阅读:来源:国知局

技术特征:

技术总结
本发明涉及数据挖掘技术领域,公开了一种大数据聚类方法,包括以下步骤:S1、获取原始数据集;S2、采用分布式Canopy算法将所述原始数据集划分为多个全局Canopy中心集;S3、采用分布式K‑means聚类算法,以各所述全局Canopy中心集的全局Canopy中心作为所述分布式K‑means聚类算法的初始聚类中心,对所述原始数据集进行聚类处理。本发明提供的大数据聚类方法具有收敛速度快,聚类效果好的技术效果;同时,缓解了单服务器处理海量数据带来的硬件瓶颈问题,有利于对大规模数据进行快速、有效的数据挖掘。

技术研发人员:邹学玉;汪晶
受保护的技术使用者:长江大学
技术研发日:2019.05.28
技术公布日:2019.09.10
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1