一种基于MapReduce的差分隐私K均值聚类方法与流程

文档序号:13073018阅读:来源:国知局

技术特征:

技术总结
本发明一种基于MapReduce的差分隐私K均值聚类方法,首先使用改进的Canopy算法得到聚类个数K,其次使用差分隐私K均值聚类算法得到满足差分隐私保护的聚类中心点。1)在MapRedcue中实现改进Canopy算法,确定初始中心点;2)在MapReduce中实现差分隐私K均值算法得到最终结果。本发明在一定程度上对随机选取中心点的问题作出了改进,且在可以大数据环境下应用,在获得较好隐私保护的前提下,使聚类结果的可用性有较好的保障。本发明将差分隐私技术与经典的挖掘聚类方法相结合,基于Hadoop中的MapReduce并行框架上实行操作,在可用性上得到了改善,且最终聚类结果的准确性较好。

技术研发人员:尚涛;赵铮;杨英;马旭;关振宇;刘建伟
受保护的技术使用者:北京航空航天大学
技术研发日:2017.07.06
技术公布日:2017.12.01
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1