数据处理的方法和装置与流程

文档序号:12039176阅读:来源:国知局
技术总结
本发明公开了一种数据处理的方法和装置,属于数据处理技术领域。所述方法包括:根据主键对样本进行排序,所述主键包括特征序号和样本序号,所述主键对应的列值为样本的特征值;以所述主键和特征值为输入键值对,使用第一算法模型计算得到每个类别中的每个特征的统计量,并将特征序号和统计量作为输出键值对输出;使用第二算法模型对所述输出键值对进行计算,得到每个特征对类别的贡献值,根据所述贡献值进行特征选取。所述装置包括:排序模块、第一处理模块和第二处理模块。本发明极大地提高了数据的处理速度,降低了运算开销,通过两次算法模型计算,实现了快速特征选择。

技术研发人员:杨宜;邹永强;卢柯;陈峥;伍海君;于涛;李璐鑫;吴家旭;崔精兵;辛调琴;邹赞
受保护的技术使用者:腾讯科技(深圳)有限公司
文档号码:201310239700
技术研发日:2013.06.17
技术公布日:2016.12.28

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1