数据处理的方法及装置与流程

文档序号:12667742阅读:来源:国知局
技术总结
本发明实施例公开了一种数据处理的方法及装置。该方法包括:获取数据样本;计算包括缺失值的数据样本的属性值与未包括缺失值的数据样本的属性值之间的相似度;根据所述相似度从所述未包括缺失值的数据样本中确定填充样本;根据所述缺失值在所述填充样本中对应的属性值确定填充值,并根据所述填充值更新所述包括缺失值的数据样本。本发明实施例通过采用上述技术方案,根据与缺失值所对应数据样本相似度较大的未包含缺失值的数据样本的属性值对缺失值进行填充,综合考虑缺失值的属性特点和分布特征,无需删除包含缺失值的数据样本,可以提高填充值的正确性与数据信息的有效性,提高缺失值的处理速度,减少处理缺失值所需的时间。

技术研发人员:徐骄
受保护的技术使用者:广州视源电子科技股份有限公司
文档号码:201710142066
技术研发日:2017.03.10
技术公布日:2017.06.13

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1