数据离散化的方法及装置与流程

文档序号：12366515阅读：来源：国知局

技术总结
本发明实施例公开了一种数据离散化方法，包括：接收输入的有序排列的样本集，获取预设的有序排列的初始离散格式；获取预设的类别集合，遍历所述获取到的类别集合中的类别值，获取所述样本集在遍历到的类别值下的在所述初始离散格式中的起始阈值到每个阈值的积分区间的第一样本数，生成积分矩阵；根据所述积分矩阵计算初始离散格式中各个阈值构成的取值区间的区分度；迭代查找区分度最大且不为预设的特征值的取值区间，将所述区分度最大的取值区间对应的阈值添加到目标离散格式中，并将所述区分度最大的取值区间中包含的各个子区间对应的区分度设为所述特征值，直至所有取值区间的区分度均为所述特征值，输出所述目标离散格式。本发明还公开了一种数据离散化装置。本发明中数据离散化方法及装置可以减少计算复杂度，提高执行效率。

技术研发人员：刘宏志;蒋杰;王巨宏;吴中海;张兴
受保护的技术使用者：北京大学;深圳市腾讯计算机系统有限公司
文档号码：201510271647
技术研发日：2015.05.25
技术公布日：2017.01.04

完整全部详细技术资料下载

当前第3页1 2 3