技术总结
本发明属于数据处理技术领域,提供了一种基于超大数据集的数据处理方法及装置。该方法包括:构建数组,检验超大数据集的数据,若符合指定的特定特征,则将该数据对应第一数组中字段位置的数值设置为第一数据标记值,否则,设置为第二数据标记值,形成数据集检验信息,根据预设比例值,将数据集检验信息进行划分,依次形成多个信息组,根据第一数据标记值,检验每个信息组,形成每个组的标记值检验结果,根据每个信息组位置,将每个信息组的标记值检验结果更新至第二数组。本发明基于超大数据集的数据处理方法及装置,能够对超大数据集进行数据处理,以使特定特征数据进行清晰、简要地显示、快速切换区域和定位,且运算效率高、结果可靠。
技术研发人员:张军;贾西贝
受保护的技术使用者:深圳市华傲数据技术有限公司
文档号码:201611243826
技术研发日:2016.12.29
技术公布日:2017.05.31