一种数据表的生命周期管理方法及装置与流程

文档序号:37313510发布日期:2024-03-13 21:05阅读:13来源:国知局
一种数据表的生命周期管理方法及装置与流程

本说明书涉及计算机,尤其涉及一种数据表的生命周期管理方法及装置。


背景技术:

1、随着时间的推移,数据服务平台中存储的数据表越来越多,而很多数据表可能长期无人访问,从而导致了存储资源的浪费。基于此,通常采用为数据库中的数据表设置生命周期的方法,定期对存储时间较长的数据表进行删除。

2、目前,开发人员在设置数据表的生命周期时长时,通常仅会关注数据表所需的存储资源。这会导致技术人员在设置生命周期时长时,倾向于设置较短的生命周期时长,以避免存储资源的浪费。但是,在生命周期时长设置过短的情况下,每次访问被删除的数据表都要重新构建数据表,而重新构建数据表所需的运算资源远高于存储资源,从而导致数据服务平台的消耗的资源总量较多。

3、因此,如何确定数据表消耗的资源总量符合优化目标的生命周期时长,以降低数据服务平台消耗的资源总量,则是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种数据表的生命周期管理方法、装置、存储介质及电子设备,以降低数据服务平台消耗的资源总量。

2、本说明书采用下述技术方案:

3、本说明书提供了一种数据表的生命周期管理方法,所述方法应用于数据服务平台,所述数据服务平台维护了对数据表包含的分区数据表进行存储所需的存储资源、以及对所述数据表包含的分区数据表进行数据重建所需的运算资源,所述方法包括:

4、将预设的多个生命周期时长依次确定为目标生命周期时长,并在将目标数据表的生命周期时长指定为所述目标生命周期时长的情况下,确定所述目标数据表包含的若干分区数据表中的历史分区数据表,并计算对所述历史分区数据表进行数据重建时所需的资源总量;其中,所述历史分区数据表为所述目标数据表的生命周期时长超时后,从所述目标数据表包含的分区数据表中删除的分区数据表;所述资源总量包括对所述目标数据表包含的分区数据表进行存储所需的存储资源的资源量,和对所述历史分区数据表进行数据重建所需的运算资源的资源量的累加值;

5、确定将所述目标数据表的生命周期时长分别指定为所述多个生命周期时长的情况下,计算出的对所述历史分区数据表进行数据重建时所需的资源总量符合优化目标的目标生命周期时长;

6、基于所述资源总量符合优化目标的目标生命周期时长对所述目标数据表的生命周期时长进行更新。

7、可选地,对所述历史分区数据表进行数据重建时所需的资源总量符合优化目标的目标生命周期时长,包括:对所述历史分区数据表进行数据重建时所需的资源总量最小的目标生命周期时长。

8、可选地,计算对所述历史分区数据表进行数据重建时所需的资源总量,包括:

9、获取针对所述目标数据表包含的各个分区数据表的访问概率;

10、根据所述目标数据表包含的各个分区数据表的访问概率,以及对所述各个分区数据表进行数据重建所需的运算资源,预估针对所述历史分区数据表进行数据重建时所需的运算资源;

11、将针对所述历史分区数据表进行数据重建时所需的运算资源,与在所述目标生命周期时长内存储所述各个分区数据表所需的存储资源进行相加,计算出针对所述历史分区数据表进行数据重建时所需的资源总量。

12、可选地,获取针对所述目标数据表包含的各个分区数据表的访问概率,包括:

13、获取与所述目标数据表包含的各个分区数据表对应的历史访问数据;

14、根据所述目标数据表中的各个分区数据表的历史访问数据,计算针对所述目标数据表中的各个分区数据表的访问概率。

15、可选地,所述目标数据表包含的分区数据表,为按照数据所属的时长周期,对所述目标数据表中包含的数据进行数据分区得到的分区数据表;与所述目标数据表包含的任一目标分区数据表对应的历史访问数据,包括针对该目标分区数据表对应的时长周期之前的历史时长周期对应的分区数据表的访问数据。

16、可选地,所述数据服务平台维护了针对数据表进行数据分区得到的若干分区数据表之间的数据依赖关系;

17、根据所述目标数据表包含的各个分区数据表的访问概率,以及对所述各个分区数据表进行数据重建所需的运算资源,预估针对所述历史分区数据表进行数据重建时所需的运算资源,包括:

18、从所述数据服务平台维护的所述数据依赖关系中,确定与所述目标数据表包含的各个分区数据表之间存在数据依赖关系的所述目标分区数据表,以及包含所述目标分区数据表的关联数据表;

19、获取所述数据服务平台维护的所述关联数据表的生命周期时长,并根据所述关联数据表的生命周期时长,以及对与所述目标数据表包含的各个分区数据表之间存在数据依赖关系的所述目标分区数据表进行数据重建所需的运算资源,计算针对所述目标数据表包含的各个分区数据表进行数据重建所需的运算资源;

20、根据所述目标数据表包含的各个分区数据表的访问概率,以及针对所述目标数据表包含的各个分区数据表进行数据重建所需的运算资源,预估针对所述历史分区数据表进行数据重建时所需的运算资源。

21、可选地,基于如下公式计算针对所述历史分区数据表进行数据重建时所需的资源总量:

22、

23、在公式中,y用于表示所述资源总量,x用于表示所述目标数据表的生命周期时长,c0用于表示生成所述目标数据表中的第一个分区数据表所需的运算资源,si用于表示对所述目标数据表中的第i个分区数据表进行存储所需的存储资源,pi用于表示针对所述目标数据表中的第i个分区数据表的访问概率,ci用于表示对第i个历史分区数据表进行数据重建时所需的运算资源。

24、可选地,所述方法还包括:

25、确定所述关联数据表的生命周期时长是否发生更新;如果是,根据所述关联数据表的更新后的生命周期时长,以及对与所述目标数据表包含的各个分区数据表之间存在数据依赖关系的所述目标分区数据表进行数据重建所需的运算资源,重新计算针对所述目标数据表包含的各个分区数据表进行数据重建所需的运算资源。

26、可选地,基于所述目标生命周期时长对所述目标数据表的生命周期时长进行更新,包括:

27、确定所述目标生命周期时长与所述目标数据表的当前生命周期时长之间的差值是否大于设定阈值;如果是,所述目标生命周期时长对所述目标数据表的生命周期时长进行更新。

28、本说明书提供了一种数据表的生命周期优化方法,所述方法应用于数据服务平台,所述数据服务平台维护了对数据表包含的分区数据表进行存储所需的存储资源、以及对所述数据表包含的分区数据表进行数据重建所需的运算资源,所述方法包括:

29、将预设的多个生命周期时长依次确定为目标生命周期时长,并在将目标数据表的生命周期时长指定为所述目标生命周期时长的情况下,确定所述目标数据表包含的若干分区数据表中的历史分区数据表,并计算对所述历史分区数据表进行数据重建时所需的资源总量;其中,所述历史分区数据表为所述目标数据表的生命周期时长超时后,从所述目标数据表包含的分区数据表中删除的分区数据表;所述资源总量包括对所述目标数据表包含的分区数据表进行存储所需的存储资源的资源量,和对所述历史分区数据表进行数据重建所需的运算资源的资源量的累加值;

30、确定将所述目标数据表的生命周期时长分别指定为所述多个生命周期时长的情况下,计算出的对所述历史分区数据表进行数据重建时所需的资源总量符合优化目标的目标生命周期时长。

31、本说明书提供了一种数据表的生命周期管理装置,所述装置应用于数据服务平台,所述数据服务平台维护了对数据表包含的分区数据表进行存储所需的存储资源、以及对所述数据表包含的分区数据表进行数据重建所需的运算资源,所述装置包括:

32、确定模块,用于将预设的多个生命周期时长依次确定为目标生命周期时长,并在将目标数据表的生命周期时长指定为所述目标生命周期时长的情况下,确定所述目标数据表包含的若干分区数据表中的历史分区数据表,并计算对所述历史分区数据表进行数据重建时所需的资源总量;其中,所述历史分区数据表为所述目标数据表的生命周期时长超时后,从所述目标数据表包含的分区数据表中删除的分区数据表;所述资源总量包括对所述目标数据表包含的分区数据表进行存储所需的存储资源的资源量,和对所述历史分区数据表进行数据重建所需的运算资源的资源量的累加值;

33、计算模块,用于确定将所述目标数据表的生命周期时长分别指定为所述多个生命周期时长的情况下,计算出的对所述历史分区数据表进行数据重建时所需的资源总量符合优化目标的目标生命周期时长;

34、更新模块,用于基于所述资源总量符合优化目标的目标生命周期时长对所述目标数据表的生命周期时长进行更新。

35、本说明书提供了一种数据表的生命周期优化装置,所述装置应用于数据服务平台,所述数据服务平台维护了对数据表包含的分区数据表进行存储所需的存储资源、以及对所述数据表包含的分区数据表进行数据重建所需的运算资源,所述装置包括:

36、确定模块,用于将预设的多个生命周期时长依次确定为目标生命周期时长,并在将目标数据表的生命周期时长指定为所述目标生命周期时长的情况下,确定所述目标数据表包含的若干分区数据表中的历史分区数据表,并计算对所述历史分区数据表进行数据重建时所需的资源总量;其中,所述历史分区数据表为所述目标数据表的生命周期时长超时后,从所述目标数据表包含的分区数据表中删除的分区数据表;所述资源总量包括对所述目标数据表包含的分区数据表进行存储所需的存储资源的资源量,和对所述历史分区数据表进行数据重建所需的运算资源的资源量的累加值;

37、计算模块,用于确定将所述目标数据表的生命周期时长分别指定为所述多个生命周期时长的情况下,计算出的对所述历史分区数据表进行数据重建时所需的资源总量符合优化目标的目标生命周期时长。

38、本说明书提供了一种电子设备,包括通信接口、处理器、存储器和总线,所述通信接口、所述处理器和所述存储器之间通过总线相互连接;

39、所述存储器中存储机器可读指令,所述处理器通过调用所述机器可读指令,执行上述数据表的生命周期管理方法。

40、本说明书提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可读指令,所述机器可读指令在被处理器调用和执行时,实现上述数据表的生命周期管理方法。

41、本说明书采用的上述至少一个技术方案能够达到以下有益效果:

42、在本说明书提供的数据表的生命周期管理方法中,本方法可以在确定将目标数据表的生命周期时长分别指定为多个生命周期时长的情况下,计算出的对历史分区数据表进行数据重建时所需的资源总量优化目标的目标生命周期时长,基于资源总量符合优化目标的目标生命周期时长对目标数据表的生命周期时长进行更新。从而,降低了数据服务平台消耗的资源总量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1