数据分组方法及装置与流程

文档序号:18969463发布日期:2019-10-28 23:48阅读:来源:国知局

技术特征:

1.一种数据分组方法,其特征在于,所述方法由数据库管理设备执行,所述方法包括:

获取目标数据的标识集合,所述目标数据是数据集合中包含相同的n种类型的数据属性的部分或者全部数据,n≥2,且n为整数;

获取所述数据集合对应所述n种数据属性中的每一种数据属性的标识集合组,所述数据属性的标识集合组包含所述数据属性的每一种属性值的标识集合,所述属性值的标识集合包含具有所述属性值的数据的标识;

对所述目标数据的标识集合以及所述每一种数据属性的标识集合组进行交集运算;根据所述交集运算的运算结果,获取按照所述n种数据属性对所述目标数据进行分组的分组结果;对于所述分组结果中的任一数据组,所述数据组中的各个数据具有属性值相同的所述n种数据属性。

2.根据权利要求1所述的方法,其特征在于,所述获取所述数据集合对应所述n种数据属性中的每一种数据属性的标识集合组之前,所述方法还包括:

按照所述数据集合中的各个数据各自对应所述数据属性的属性值,建立所述数据集合对应所述数据属性的倒排索引信息,所述倒排索引信息中包含所述每一种属性值以及所述每一种属性值对应的数据的标识;

根据所述倒排索引信息设置所述数据集合对应所述数据属性的标识集合组。

3.根据权利要求1所述的方法,其特征在于,所述对所述目标数据的标识集合以及所述每一种数据属性的标识集合组进行交集运算,包括:

在第1次运算时,将所述目标数据的标识集合与所述n种数据属性的第1种数据属性的标识集合组中的各个标识集合分别进行交集运算,获得第1次运算的运算结果;

在第i次运算时,将第i-1次运算的运算结果中的每一个集合与所述n种数据属性的第i种数据属性的标识集合组中的各个标识集合分别进行交集运算,获得第i次运算的运算结果,2≤i≤n,且i为整数。

4.根据权利要求1所述的方法,其特征在于,所述对所述目标数据的标识集合以及所述每一种数据属性的标识集合组进行交集运算,包括:

在第1次运算时,将所述目标数据的标识集合与所述n种数据属性的第1种数据属性的标识集合组中的各个标识集合分别进行交集运算,获得第1次运算的运算结果;

在第i次运算时,将所述目标数据的标识集合与所述n种数据属性的第i种数据属性的标识集合组中的各个标识集合分别进行交集运算,将运算得到的每一个集合与第i-1次运算的运算结果中的各个集合分别进行交集运算,获得第i次运算的运算结果,2≤i≤n,且i为整数。

5.根据权利要求3或4所述的方法,其特征在于,所述根据所述交集运算的运算,获取按照所述n种数据属性对所述目标数据进行分组的分组结果,包括:

对于第n次运算的运算结果中包含的每一个集合,将所述集合中的标识获取为所述分组结果中的一个数据组对应的数据的标识。

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

获取所述数据组对应的数据中,所述n种数据属性各自的属性值;

对应所述数据组输出获取到的所述n种数据属性各自的属性值。

7.一种数据分组装置,其特征在于,所述装置用于数据库管理设备中,所述装置包括:

第一集合获取模块,用于获取目标数据的标识集合,所述目标数据是数据集合中包含相同的n种类型的数据属性的部分或者全部数据,n≥2,且n为整数;

第二集合获取模块,用于获取所述数据集合对应所述n种数据属性中的每一种数据属性的标识集合组,所述数据属性的标识集合组包含所述数据属性的每一种属性值的标识集合,所述属性值的标识集合包含具有所述属性值的数据的标识;

运算模块,用于对所述目标数据的标识集合以及所述每一种数据属性的标识集合组进行交集运算;

结果获取模块,用于根据所述交集运算的运算结果,获取按照所述n种数据属性对所述目标数据进行分组的分组结果;对于所述分组结果中的任一数据组,所述数据组中的各个数据具有属性值相同的所述n种数据属性。

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

索引信息建立模块,用于在所述第二集合获取模块获取所述数据集合对应所述n种数据属性中的每一种数据属性的标识集合组之前,按照所述数据集合中的各个数据各自对应所述数据属性的属性值,建立所述数据集合对应所述数据属性的倒排索引信息,所述倒排索引信息中包含所述每一种属性值以及所述每一种属性值对应的数据的标识;

集合设置模块,用于根据所述倒排索引信息设置所述数据集合对应所述每一种数据属性的标识集合组。

9.根据权利要求7所述的装置,其特征在于,所述运算模块,用于

在第1次运算时,将所述目标数据的标识集合与所述n种数据属性的第1种数据属性的标识集合组中的各个标识集合分别进行交集运算,获得第1次运算的运算结果;

在第i次运算时,将第i-1次运算的运算结果中的每一个集合与所述n种数据属性的第i种数据属性的标识集合组中的各个标识集合分别进行交集运算,获得第i次运算的运算结果,2≤i≤n,且i为整数。

10.根据权利要求7所述的装置,其特征在于,所述运算模块,用于

在第1次运算时,将所述目标数据的标识集合与所述n种数据属性的第1种数据属性的标识集合组中的各个标识集合分别进行交集运算,获得第1次运算的运算结果;

在第i次运算时,将所述目标数据的标识集合与所述n种数据属性的第i种数据属性的标识集合组中的各个标识集合分别进行交集运算,将运算得到的每一个集合与第i-1次运算的运算结果中的各个集合分别进行交集运算,获得第i次运算的运算结果,2≤i≤n,且i为整数。

11.根据权利要求9或10所述的装置,其特征在于,

所述结果获取模块,用于对于第n次运算的运算结果中包含的每一个集合,将所述集合中的标识获取为所述分组结果中的一个数据组对应的数据的标识。

12.根据权利要求11所述的装置,其特征在于,所述装置还包括:

属性值获取模块,用于获取所述数据组对应的数据中,所述n种数据属性各自的属性值;

输出模块,用于对应所述数据组输出所述属性值获取模块获取到的所述n种数据属性各自对应的属性值。

13.一种管理设备,其特征在于,所述管理设备包括:处理器和存储器,所述存储器中存储有一个或者一个以上的程序,所述一个或者一个以上程序由处理器执行,以实现如权利要求1至6任一所述数据分组方法。

14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有指令,所述指令由处理器执行,以实现如权利要求1至6任一所述数据分组方法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1