1.一种用于存储数据的方法,包括:
读取目标数据集合包括的多个子数据集合,其中,子数据集合由所述目标数据集合划分得到;
按照预先确定的第一格式,将所述多个子数据集合中的空集存储至第一存储空间;
确定所述多个子数据集合中的每个数据的哈希值,得到多个哈希值集合;
将所述多个哈希值集合中符合第一预设存储条件的哈希值集合中的各个哈希值以及哈希值的数目,按照预先确定的第二格式,存储至第二存储空间。
2.根据权利要求1所述的方法,其中,所述方法还包括:
针对所述多个哈希值集合中的每个哈希值集合,确定该哈希值集合对应的字节数组,其中,字节数组中元素的位置基于哈希值集合中的各个哈希值中的前预定数量个比特位上的数据来确定,字节数组中的元素基于哈希值集合中的哈希值所表征的二进制数据中的首个1的位置来确定,字节数组的长度是预先确定的。
3.根据权利要求2所述的方法,其中,所述方法还包括:
将所确定的字节数组中符合第二预设存储条件的字节数组中的非0元素以及非0元素在字节数组中的位置,按照预先确定的第三格式,存储至第三存储空间。
4.根据权利要求3所述的方法,其中,所述方法还包括:
将所确定的字节数组中符合第三预设存储条件的字节数组,按照预先确定的第四格式,存储至第四存储空间。
5.根据权利要求4所述的方法,其中,所述方法还包括:
基于第一存储空间、第二存储空间、第三存储空间以及第四存储空间所存储的数据,创建物化视图。
6.根据权利要求2-5之一所述的方法,其中,所述方法还包括:
根据所确定的字节数组中最大的字节数组,确定所述目标数据集合的基数。
7.一种用于存储数据的装置,包括:
读取单元,配置用于读取目标数据集合包括的多个子数据集合,其中,子数据集合由所述目标数据集合划分得到;
第一存储单元,配置用于按照预先确定的第一格式,将所述多个子数据集合中的空集存储至第一存储空间;
第一确定单元,配置用于确定所述多个子数据集合中的每个数据的哈希值,得到多个哈希值集合;
第二存储单元,配置用于将所述多个哈希值集合中符合第一预设存储条件的哈希值集合中的各个哈希值以及哈希值的数目,按照预先确定的第二格式,存储至第二存储空间。
8.根据权利要求7所述的装置,其中,所述装置还包括:
第二确定单元,配置用于针对所述多个哈希值集合中的每个哈希值集合,确定该哈希值集合对应的字节数组,其中,字节数组中元素的位置基于哈希值集合中的各个哈希值中的前预定数量个比特位上的数据来确定,字节数组中的元素基于哈希值集合中的哈希值所表征的二进制数据中的首个1的位置来确定,字节数组的长度是预先确定的。
9.根据权利要求8所述的装置,其中,所述装置还包括:
第三存储单元,配置用于将所确定的字节数组中符合第二预设存储条件的字节数组中的非0元素以及非0元素在字节数组中的位置,按照预先确定的第三格式,存储至第三存储空间。
10.根据权利要求9所述的装置,其中,所述装置还包括:
第四存储单元,配置用于将所确定的字节数组中符合第三预设存储条件的字节数组,按照预先确定的第四格式,存储至第四存储空间。
11.根据权利要求10所述的装置,其中,所述装置还包括:
创建单元,配置用于基于第一存储空间、第二存储空间、第三存储空间以及第四存储空间所存储的数据,创建物化视图。
12.根据权利要求8-11之一所述的装置,其中,所述装置还包括:
第三确定单元,配置用于根据所确定的字节数组中最大的字节数组,确定所述目标数据集合的基数。
13.一种服务器,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。