一种基于KNN的改进缺失数据填补算法的制作方法

文档序号:11134194阅读:来源:国知局
技术总结
本发明出一种基于KNN的改进缺失数据填补算法,包括步骤:(1)对传统的复相关系数倒数赋权法进行改进,并利用改进后的算法计算出每个属性对含缺失值属性的重要性,删除一些与关键属性关联较小的属性,对属性集进行精简操作,得到仅含精简属性集的数据样本集。(2)利用马氏距离综合考虑属性间的相关性和变异性的优点,结合灰色关联分析法对含不确定因素样本的有效预测,计算出缺失样本的K个近邻样本。(3)根据计算得到的K个距离值,依据熵权法对K个样本对应的属性赋熵权值,再结合属性值,计算出最终的填补值。本发明能够降低缺失数据算法的计算复杂度、提高邻近样本取值精确度以及提高数据填补值的估算精度。

技术研发人员:谢强;王振
受保护的技术使用者:南京航空航天大学
文档号码:201610892814
技术研发日:2016.10.12
技术公布日:2017.02.15

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1