分区分割方法、装置、服务器和存储介质与流程

文档序号:23003615发布日期:2020-11-20 11:52阅读:来源:国知局

技术特征:

1.一种分区分割方法,其特征在于,包括:

获取第一临界点集合,其中,所述临界点标识的行的行键前缀和所述临界点标识的行的上一行行键前缀具有差异;

获取所述临界点标识的行相对于分区中心的距离;

从所述第一临界点集合中获取所述距离满足预设距离范围的第二临界点集合;

根据所述第二临界点集合获取切分点,对分区进行分割。

2.根据权利要求1所述的分区分割方法,其特征在于,所述行键为复合结构;所述行键前缀为根据性能和业务确定的从行键拆分出来的前n个子部分;

所述临界点包括位置信息,其中,所述位置信息用于记录所述临界点标识的行的行键前缀和所述临界点标识的行的上一行的行键前缀产生差异的所述子部份的位置。

3.根据权利要求2所述的分区分割方法,其特征在于,所述根据所述第二临界点集合获取切分点之前,包括:

获取所述第二临界点集合中位置信息处于高位的临界点,作为新的第二临界点集合,其中,所述位置信息处于高位是指位置信息对应的位置最靠近所述行键前缀的首字符的位置;

所述根据所述第二临界点集合获取切分点,包括:

在所述新的第二临界点集合中获取切分点。

4.根据权利要求1至3中任一项所述的分区分割方法,其特征在于,所述获取第一临界点集合,包括:

遍历分区中的指定列族和行键,根据所述列族和所述行键获取所述第一临界点集合,其中,所述指定列族用于记录每条行记录的数据量。

5.根据权利要求4所述的分区分割方法,其特征在于,所述临界点还包括:首行到临界点标识的行的数据量,其中,所述首行到临界点标识的行的数据量为所述分区中的首行至所述临界点标识的行的所述行记录的数据量的累加总和;

所述遍历分区中的指定列族和行键,还包括:

累加所述列族中每条行记录的数据量得到分区行记录总数据量;

所述获取所述临界点标识的行相对于分区中心的距离,包括:

根据所述分区行记录总数据量和所述首行到临界点标识的行的数据量,得到所述临界点标识的行相对于分区中心的距离。

6.根据权利要求5所述的分区分割方法,其特征在于,所述根据所述第二临界点集合获取切分点,还包括:

获取所述第二临界点集合中相对于分区中心的距离最小的临界点;

根据所述临界点获取切分点。

7.根据权利要求1至3任一项所述的分区分割方法,其特征在于,还包括:

若所述第一临界点集合为空或者所述第二临界点集合为空,则采用预设分区分割方法获取切分点。

8.一种分区分割装置,其特征在于,包括:

第一临界点获取模块,用于获取第一临界点集合,其中,所述临界点标识的行的行键前缀和所述临界点标识的行的上一行行键前缀具有差异;

距离获取模块,用于获取所述临界点标识的行相对于分区中心的距离;

第二临界点获取模块,用于从所述第一临界点集合中获取所述距离满足预设距离范围的第二临界点集合;

切分模块,用于根据所述第二临界点集合获取切分点,对分区进行分割。

9.一种服务器,其特征在于,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的分区分割方法。

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的分区分割方法。


技术总结
本发明实施例涉及互联网技术应用领域,公开了一种分区分割方法、装置、服务器和存储介质。本发明中,包括:获取第一临界点集合,其中,所述临界点标识的行的行键前缀和所述临界点标识的行的上一行行键前缀具有差异;获取所述临界点标识的行相对于分区中心的距离;从所述第一临界点集合中获取所述距离满足预设距离范围的第二临界点集合;根据所述第二临界点集合选择切分点。能够减少因切分不均而出现region碎片,减少不断分裂出现空分区的情况,同时也尽可能保持了数据在分区层面的均衡负载,有利于集群的region管理。

技术研发人员:温少雄;谢韦华;杨高明;张炜
受保护的技术使用者:中移(杭州)信息技术有限公司;中国移动通信集团有限公司
技术研发日:2020.09.09
技术公布日:2020.11.20
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1