一种互联网数据聚类方法及系统与流程

文档序号:12733702阅读:来源:国知局
技术总结
本发明属于聚类算法技术领域,尤其涉及一种互联网数据聚类方法及系统。所述互联网数据聚类方法包括以下步骤:步骤a:在原有的FG-k-means算法的目标函数距离计算项中添加惩罚系数,形成新的目标函数;步骤b:对新的目标函数的参数进行优化求解;步骤c:根据优化的参数结果计算样本与聚类中心的距离,根据样本与聚类中心的距离对样本进行聚类簇分配。本发明实施例的互联网数据聚类方法及系统在原有FG-k-means算法的目标函数距离计算项中加入惩罚系数,可以有效地控制原有FG-k-means算法存在的聚类簇样本数量无限增长的问题,同时能够使得各个聚类簇之间样本数量均衡可控,从而获得更高的聚类精度。

技术研发人员:赵鹤;李栋一;黄哲学;姜青山;陈会;高琴;朱敏;蔡业首
受保护的技术使用者:中国科学院深圳先进技术研究院
文档号码:201510956891
技术研发日:2015.12.17
技术公布日:2017.06.27

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1