数据冷热分析方法、装置、设备及计算机可读存储介质与流程

文档序号:31793419发布日期:2022-10-14 16:34阅读:141来源:国知局
数据冷热分析方法、装置、设备及计算机可读存储介质与流程

1.本发明涉及数据存储技术领域,尤其涉及一种数据冷热分析方法、装置、设备及计算机可读存储介质。


背景技术:

2.随着it系统不断发展和信息化的日趋重要,系统内保存着大量、甚至海量的业务数据。随着时间的推移,旧数据访问频率会越来越低,仅存在少量查询,甚至完全不查询,此时数据通常称之为冷数据,相对于的访问频率高的数据被称为热数据。冷数据的数据量较大,很少被访问,如果不做处理会占据大量存储空间和计算资源。为此需要进行冷热数据的分离和处理过程。
3.现有冷热数据分离技术主要通过判断数据块的访问频率和io计数来实现冷热的识别,这种方式是从数据块的物理存储层面识别和分离了数据的冷热程度。但是,事实上数据之间不是完全独立的,大量的数据间是存在关联性的,这种将数据块看作是独立的单元进行数据冷热分离的方法无法对具有关联性的同类型数据进行整体性的冷热分离,从而导致对冷热数据进行分层存储的效率低。


技术实现要素:

4.本发明的主要目的在于提供一种数据冷热分析方法、装置、设备及计算机可读存储介质,旨在提出一种基于数据相关性的冷热数据分析方案,提高冷热数据识别的合理性,进而提高对冷热数据进行分层存储的效率。
5.为实现上述目的,本发明提供一种数据冷热分析方法,所述方法包括以下步骤:
6.对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,其中,一个所述数据逻辑对象集中包括具有访问相关性的一组所述数据逻辑对象;
7.记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息;
8.根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息;
9.根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析结果。
10.可选地,所述对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集的步骤包括:
11.对各数据访问操作待访问的主数据逻辑对象和与所述主数据逻辑对象对应的相关数据逻辑对象进行登记;
12.将同一所述数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集;
13.对于各所述数据访问操作中的任一第一数据访问操作,若确定存在一第二数据访
问操作所登记的所述相关数据逻辑对象与所述第一数据访问操作所登记的所述主数据逻辑对象相同,则将所述第一数据访问操作与所述第二数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集。
14.可选地,所述记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息的步骤包括:
15.记录各所述数据访问操作实际访问数据块时的访问信息,其中,所述访问信息包括所述数据块被访问的时间;
16.根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数,将所述第一访问次数作为所述数据块对应的第一访问时间信息;
17.所述根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息的步骤包括:
18.对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数,将所述第二访问次数作为所述数据逻辑对象集对应的第二访问时间信息。
19.可选地,所述根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数的步骤包括:
20.根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块分别在距离当前时刻不同远近程度的多个历史时间段内的第一访问次数;
21.所述对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数的步骤包括:
22.对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块在同一所述历史时间段内的所述第一访问次数进行分别累加,得到所述数据逻辑对象集分别在各所述历史时间段内的第二访问次数;
23.所述根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析结果的步骤包括:
24.将多个所述数据逻辑对象集在同一所述历史时间段内的所述第二访问次数进行比较,以计算所述数据逻辑对象集分别在各所述历史时间段内的访问次数占比;
25.根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到所述数据逻辑对象集对应的数据热度,根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果。
26.可选地,所述根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到所述数据逻辑对象集对应的数据热度的步骤包括:
27.将所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比按照各所述历史时间段对应的权重进行加权求和,得到所述数据逻辑对象集对应的数据热度,其中,距离当前时刻越远的所述历史时间段的权重越小。
28.可选地,所述根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果的步骤包括:
29.当所述数据逻辑对象集对应的所述数据热度小于第一预设阈值时,将所述数据逻
辑对象集确定为冷数据;
30.当所述数据逻辑对象集对应的所述数据热度大于或等于所述第一预设阈值时,将所述数据逻辑对象集确定为热数据。
31.可选地,所述根据第二访问时间信息计算所述数据逻辑对象集分别对应的第一数据冷热分析结果的步骤之后,还包括:
32.当所述第一数据冷热分析结果表征所述数据逻辑对象集为冷数据时,根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集中所述数据逻辑对象对应的第三访问时间信息;
33.根据所述第三访问时间信息分析得到所述数据逻辑对象集中所述数据逻辑对象对应的第二数据冷热分析结果;
34.将作为冷数据的所述数据逻辑对象集中各所述数据逻辑对象对应的各所述数据块迁移至预设低速存储设备,并当根据所述第二数据冷热分析结果确定所述数据逻辑对象集中存在属于热数据的目标数据逻辑对象时,将所述目标数据逻辑对象对应的所述数据块从所述预设低速存储设备中缓存至内存中。
35.为实现上述目的,本发明还提供一种数据冷热分析装置,所述数据冷热分析装置包括:
36.登记模块,用于对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,其中,一个所述数据逻辑对象集中包括具有访问相关性的一组所述数据逻辑对象;
37.记录模块,用于记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息;
38.统计模块,用于根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息;
39.分析模块,用于根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析结果。
40.为实现上述目的,本发明还提供一种数据冷热分析装置,所述数据冷热分析装置包括:
41.为实现上述目的,本发明还提供一种数据冷热分析设备,所述数据冷热分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据冷热分析程序,所述数据冷热分析程序被所述处理器执行时实现如上所述的数据冷热分析方法的步骤。
42.此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有数据冷热分析程序,所述数据冷热分析程序被处理器执行时实现如上所述的数据冷热分析方法的步骤。
43.本发明实施例中,通过对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,一个数据逻辑对象集中包括具有访问相关性的一组数据逻辑对象;记录各数据访问操作所实际访问的数据块对应的第一访问时间信息;根据数据逻辑对象集中数据逻辑对象所对应的各数据块的第一访问时间信息,统计得到数据逻辑对象集对应的第二访问时间信息;根据第二访问时间信息分析得到数据逻辑
对象集对应的第一数据冷热分析结果。本发明实施例实现了一种基于数据相关性的冷热数据分析方案,将具有访问相关性的一组数据逻辑对象作为一个整体的数据逻辑对象集,基于对实际访问数据块所记录的访问时间信息来统计数据逻辑对象集整体的访问时间信息,进而分析数据逻辑对象集整体的冷热性,而非仅从数据块的物理存储层面识别数据的冷热程度,提高了提高冷热数据识别的合理性,进而提高了对冷热数据进行分层存储的效率。
附图说明
44.图1为本发明实施例方案涉及的硬件运行环境的结构示意图;
45.图2为本发明数据冷热分析方法第一实施例的流程示意图;
46.图3为本发明数据冷热分析装置较佳实施例的功能模块示意图。
47.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
48.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
49.如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
50.需要说明的是,本发明实施例数据冷热分析设备可以是智能手机、个人计算机、服务器等设备,在此不做具体限制。所述工地的清洗区入口处设置至少一个第一摄像单元,所述清洗区出口处设置至少一个第二摄像单元。
51.如图1所示,该数据冷热分析设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
52.本领域技术人员可以理解,图1中示出的设备结构并不构成对数据冷热分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
53.如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据冷热分析程序。操作系统是管理和控制设备硬件和软件资源的程序,支持数据冷热分析程序以及其它软件或程序的运行。在图1所示的设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于与服务器建立通信连接;而处理器1001可以用于调用存储器1005中存储的数据冷热分析程序,并执行以下操作:
54.对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,其中,一个所述数据逻辑对象集中包括具有访问相关性的一组所述数据逻辑对象;
55.记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息;
56.根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息;
57.根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析
结果。
58.进一步地,所述对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集的操作包括:
59.对各数据访问操作待访问的主数据逻辑对象和与所述主数据逻辑对象对应的相关数据逻辑对象进行登记;
60.将同一所述数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集;
61.对于各所述数据访问操作中的任一第一数据访问操作,若确定存在一第二数据访问操作所登记的所述相关数据逻辑对象与所述第一数据访问操作所登记的所述主数据逻辑对象相同,则将所述第一数据访问操作与所述第二数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集。
62.进一步地,所述记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息的操作包括:
63.记录各所述数据访问操作实际访问数据块时的访问信息,其中,所述访问信息包括所述数据块被访问的时间;
64.根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数,将所述第一访问次数作为所述数据块对应的第一访问时间信息;
65.所述根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息的操作包括:
66.对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数,将所述第二访问次数作为所述数据逻辑对象集对应的第二访问时间信息。
67.进一步地,所述根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数的操作包括:
68.根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块分别在距离当前时刻不同远近程度的多个历史时间段内的第一访问次数;
69.所述对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数的操作包括:
70.对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块在同一所述历史时间段内的所述第一访问次数进行分别累加,得到所述数据逻辑对象集分别在各所述历史时间段内的第二访问次数;
71.所述根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析结果的操作包括:
72.将多个所述数据逻辑对象集在同一所述历史时间段内的所述第二访问次数进行比较,以计算所述数据逻辑对象集分别在各所述历史时间段内的访问次数占比;
73.根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到所述数据逻辑对象集对应的数据热度,根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果。
74.进一步地,所述根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到所述数据逻辑对象集对应的数据热度的操作包括:
75.将所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比按照各所述历史时间段对应的权重进行加权求和,得到所述数据逻辑对象集对应的数据热度,其中,距离当前时刻越远的所述历史时间段的权重越小。
76.进一步地,所述根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果的操作包括:
77.当所述数据逻辑对象集对应的所述数据热度小于第一预设阈值时,将所述数据逻辑对象集确定为冷数据;
78.当所述数据逻辑对象集对应的所述数据热度大于或等于所述第一预设阈值时,将所述数据逻辑对象集确定为热数据。
79.进一步地,所述根据第二访问时间信息计算所述数据逻辑对象集分别对应的第一数据冷热分析结果的操作之后,处理器1001还可以用于调用存储器1005中存储的数据冷热分析程序,执行以下操作:
80.当所述第一数据冷热分析结果表征所述数据逻辑对象集为冷数据时,根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集中所述数据逻辑对象对应的第三访问时间信息;
81.根据所述第三访问时间信息分析得到所述数据逻辑对象集中所述数据逻辑对象对应的第二数据冷热分析结果;
82.将作为冷数据的所述数据逻辑对象集中各所述数据逻辑对象对应的各所述数据块迁移至预设低速存储设备,并当根据所述第二数据冷热分析结果确定所述数据逻辑对象集中存在属于热数据的目标数据逻辑对象时,将所述目标数据逻辑对象对应的所述数据块从所述预设低速存储设备中缓存至内存中。
83.基于上述的结构,提出数据冷热分析方法的各个实施例。
84.参照图2,图2为本发明数据冷热分析方法第一实施例的流程示意图。
85.本发明实施例提供了数据冷热分析方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。在本实施例中,数据冷热分析方法的执行主体可以是智能手机、个人电脑、服务器等设备,在本实施例中并不做限制。为便于表述,以下省略执行主体进行各实施例的阐述。在本实施例中,所述数据冷热分析方法包括以下步骤:
86.步骤s10,对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,其中,一个所述数据逻辑对象集中包括具有访问相关性的一组所述数据逻辑对象;
87.数据访问操作是指对所存储的数据进行访问的操作,一般由业务系统触发,例如,阅读系统触发的用户历史阅读记录的读取操作就是一个数据访问操作。数据逻辑对象是与数据块相对应的概念。数据块对应了一物理存储空间中的一片实际的存储地址,而数据逻辑对象则是逻辑层面的,是抽象的。一个数据逻辑对象是指数据访问操作访问数据时的独立单元,具体指代什么与业务系统的业务逻辑相关,例如阅读系统中数据访问操作所访问的一个数据逻辑对象可以是某用户id对应的一条阅读记录。一个数据逻辑对象对应了物理
存储空间中的至少一个数据块。
88.在本实施例中,在访问数据之前,先对数据访问操作将要访问的数据逻辑对象(也即待访问的数据逻辑对象)进行登记(或者也可以称为注册),以下将所登记下来的信息称为数据逻辑对象信息。在具体实施方式中,对一个数据访问操作所登记的数据逻辑对象信息可以包括该数据访问操作待访问的数据逻辑对象的名称,或者还可以包括访问操作类型等。在具体实施方式中,可以采用表格的形式登记,例如可以采用表格中的一行或多行登记一个数据访问操作对应的数据逻辑对象信息。一个数据访问操作待访问的数据逻辑对象可能有多个,例如包括主数据逻辑对象和相关数据逻辑对象。同一数据访问操作所访问的数据逻辑对象之间可认为具有访问相关性,或者,不同数据访问操作访问相同的数据逻辑对象时,不同数据访问操作所访问的各个数据逻辑对象之间也可认为具有访问相关性。因此,在本实施例中,根据所登记的数据逻辑对象信息,可以将具有访问相关性的数据逻辑对象划分到一个数据逻辑对象集中。例如,一个数据访问操作待访问的数据逻辑对象有dataobjecta和dataobjectb,则可以将dataobjecta和dataobjectb这两个数据逻辑对象划分至同一数据逻辑对象集。
89.进一步地,在一实施方式中,所述步骤s10包括:
90.步骤s101,对各数据访问操作待访问的主数据逻辑对象和与所述主数据逻辑对象对应的相关数据逻辑对象进行登记;
91.在本实施方式中,数据访问操作待访问的数据逻辑对象可以包括主数据逻辑对象和与该主数据逻辑对象对应的相关数据逻辑对象。主数据逻辑对象与相关数据逻辑对象之间具有访问相关性,例如,可能是在访问主数据逻辑对象的同时附带地访问相关数据逻辑对象,也可能是在访问主数据逻辑对象后一段时间会访问相关数据逻辑对象,还可能是在访问主数据逻辑对象后大概率会访问相关数据逻辑对象,具体属于哪种情况可以根据业务系统的业务处理逻辑来确定,在本实施方式中并不做限制。
92.可以对各数据访问操作待访问的主数据逻辑对象和与该主数据逻辑对象对应的相关数据逻辑对象进行登记。
93.步骤s102,将同一所述数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集;
94.在划分数据逻辑对象集时,可以将同一数据访问操作所登记的主数据逻辑对象和相关数据逻辑对象划分至同一数据逻辑对象集。例如,一个数据访问操作待访问的主数据逻辑对象是dataobjecta,相关数据逻辑对象是dataobjectb,则可以将dataobjecta和dataobjectb这两个数据逻辑对象划分至同一数据逻辑对象集。
95.步骤s103,对于各所述数据访问操作中的任一第一数据访问操作,若确定存在一第二数据访问操作所登记的所述相关数据逻辑对象与所述第一数据访问操作所登记的所述主数据逻辑对象相同,则将所述第一数据访问操作与所述第二数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集。
96.对于各个数据访问操作中的任意一个数据访问操作(以下称为第一数据访问操作以示区分),若在各个数据访问操作中存在另一个数据访问操作(以下称为第二数据访问操作),该第二数据访问操作所登记的相关数据逻辑对象与该第一数据访问操作所登记的主数据逻辑对象相同,则可以将该第一数据访问操作和该第二数据访问操作所登记的所有的
主数据逻辑对象和相关数据逻辑对象划分至同一个数据逻辑对象集。
97.例如,如下表格示例性地示出了以一种表格方式登记的数据逻辑对象信息。
[0098][0099]
其中,一共有3个数据访问操作,编号为daid_xxx1、daid_xxx2和daid_xxx3。
[0100]
数据访问操作daid_xxx1的主数据逻辑对象dataobjecta和数据访问操作daid_xxx2的相关数据逻辑对象dataobjecta相同,故将数据访问操作daid_xxx1和数据访问操作daid_xxx2中的数据逻辑对象dataobjecta、dataobjectb、dataobjectc、dataobjectd和dataobjecte划分至同一数据逻辑对象集,可以将该数据逻辑对象集记为loigc_dataobject_dxxx1_dxxx2。数据访问操作daid_xxx3与其他数据访问操作独立,将该操作访问的三个逻辑对象dataobjectf、dataobjectg、dataobjecth划分至同一数据逻辑对象集,可以将该数据逻辑对象集记为loigc_dataobject_dxxx3。
[0101]
步骤s20,记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息;
[0102]
数据访问操作所实际访问的是与数据逻辑对象对应的数据块。在本实施例中,在数据块被访问时,记录数据块对应的访问时间信息(以下称为第一访问时间信息以示区分)。第一访问时间信息是与数据块被访问的时间相关的信息,但在本实施例中,对其具体包含哪些信息并不做限制。例如,在一实施方式中,可以是对数据块被各数据访问操作访问的次数进行计数得到的访问次数,还可以是根据访问次数所计算得到数据块在一段时间内被访问的频率等。
[0103]
步骤s30,根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息;
[0104]
数据块与数据逻辑对象之间存在对应关系,故对于每个数据逻辑对象,可以确定该数据逻辑对象集中的数据逻辑对象所对应的数据块有哪些,根据这些数据块对应的第一访问时间信息,可以统计得到该数据逻辑对象集对应的第二访问时间信息。根据第一访问时间信息统计得到第二访问时间信息具体可以是将各个第一访问时间信息进行累计,进而得到第二访问时间信息。其中,在具体实施方式中,根据第一访问时间信息所包含的信息内容的不同,该累计操作具体的操作方法也不同;例如,当第一访问时间信息为数据块的访问
次数时,可以将各个数据块的访问次数相加得到数据逻辑对象集的访问次数,将该访问次数作为第二访问时间信息;又如,当第一访问时间信息为数据块的访问频率时,可以将各个数据块的访问频率相加或求平均,得到该数据逻辑对象集的访问频率。
[0105]
步骤s40,根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析结果。
[0106]
对每个数据逻辑对象集进行分析的过程是相同的,故以下以一个数据逻辑对象集为例进行说明。
[0107]
在得到数据逻辑对象集对应的第二访问时间信息后,可以根据第二访问时间信息分析得到该数据逻辑对象集对应的数据冷热分析结果(以下称为第一数据冷热分析结果以示区分)。其中,第一数据冷热分析结果具体可以是用于表示数据逻辑对象集是冷数据还是热数据的结果,或者在其它实施方式中,第一数据冷热分析结果也可以是用于表示数据逻辑对象集属于哪一等级热度的数据的结果。在本实施例中并不限制数据冷热分析结果的具体形式。
[0108]
根据第二访问时间信息分析得到第一数据冷热分析结果的具体分析方法在本实施例中并不做限制,且第二访问时间信息所包含的信息内容不同时,所采用的分析方法也对应不同。例如,在一实施方式中,当第二访问时间信息为数据逻辑对象集的访问频率时,可以将该访问频率与一个阈值进行比较,若大于阈值,则确定该数据逻辑对象集为热数据,若不大于阈值,则确定该数据逻辑对象集为冷数据。
[0109]
需要说明的是,第一访问时间信息是与数据块被访问的时间相关的信息,能够反映数据块被访问的频率,第二访问时间信息是根据第一访问时间信息统计得到的,故第二访问时间信息能够表征数据逻辑对象集作为一个整体被访问的频率,根据第二访问时间信息能够分析得到数据逻辑对象集的冷热分析结果。
[0110]
在确定数据逻辑对象集的第一数据冷热分析结果后,可以根据第一数据冷热分析结果对数据逻辑对象集进行相应的数据分层存储处理,例如,当第一数据冷热数据分析结果为数据逻辑对象集是冷数据时,将数据逻辑对象集中的数据逻辑对象所对应的数据块迁移至低速存储设备,该低速存储设备可以是比当前存储数据块的存储设备更低速的设备。
[0111]
在本实施例中,通过对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,一个数据逻辑对象集中包括具有访问相关性的一组数据逻辑对象;记录各数据访问操作所实际访问的数据块对应的第一访问时间信息;根据数据逻辑对象集中数据逻辑对象所对应的各数据块的第一访问时间信息,统计得到数据逻辑对象集对应的第二访问时间信息;根据第二访问时间信息分析得到数据逻辑对象集对应的第一数据冷热分析结果。本实施例实现了一种基于数据相关性的冷热数据分析方案,将具有访问相关性的一组数据逻辑对象作为一个整体的数据逻辑对象集,基于对实际访问数据块所记录的访问时间信息来统计数据逻辑对象集整体的访问时间信息,进而分析数据逻辑对象集整体的冷热性,而非仅从数据块的物理存储层面识别数据的冷热程度,提高了提高冷热数据识别的合理性,进而提高了对冷热数据进行分层存储的效率。
[0112]
基于上述第一实施例,提出本发明冷热数据分析方法第二实施例,在本实施例中,所述步骤s20包括:
[0113]
步骤s201,记录各所述数据访问操作实际访问数据块时的访问信息,其中,所述访
问信息包括所述数据块被访问的时间;
[0114]
在本实施例中,可以记录各数据访问操作实际访问数据块时的访问信息,该访问信息可以包括数据块被访问的时间。在其他实施方式中,访问信息还可以包括数据块被访问的访问操作类型,也即是读还是写。
[0115]
步骤s202,根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数,将所述第一访问次数作为所述数据块对应的第一访问时间信息;
[0116]
根据数据块各次被访问时所记录的访问信息,可以统计该数据块的访问次数(以下称为第一访问次数以示区分),将第一访问次数作为该数据块对应的第一访问时间信息。在具体实施方式中,第一访问次数可以是指业务系统被启动至今数据块被访问的总共的次数,或者,第一访问次数也可以是在分为业务系统被启动至今的不同时间段内数据块被访问的次数,或者,第一访问次数还可以是分为业务系统被启动至今数据块以读操作类型被访问的次数和写操作类型被访问的次数,具体可以根据需要设置,在本实施例中并不做限制。例如,当业务系统中写和读两种操作类型对评估数据的热度影响相同时,可以不做分别统计,反之当影响不同时,可以分别统计。又如,当业务系统中不同时段的访问对评估数据的热度影响相同时,可以不分时段只统计一个总数,反之当影响不同时,可以分别统计。
[0117]
所述步骤s30包括:
[0118]
步骤s301,对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数,将所述第二访问次数作为所述数据逻辑对象集对应的第二访问时间信息。
[0119]
当第一访问时间信息是数据块的第一访问次数时,可以对数据逻辑对象集中数据逻辑对象所对应的各个数据块的第一访问次数进行累加,得到该数据逻辑对象集对应的访问次数(以下称为第二访问次数以示区分),将第二访问次数作为数据逻辑对象集对应的第二访问时间信息。需要说明的是,当第一访问次数包括多个不同的计数时,例如包括读操作类型对应的访问次数和写操作类型对应的访问次数时,可以将各个数据块相同的计数进行累加,得到数据逻辑对象的多个不同的计数,也即,例如将各个数据块的读操作类型对应的访问次数累加得到数据逻辑对象集的读操作类型对应的访问次数,将各个数据块的写操作类型对应的访问次数累加得到数据逻辑对象集的写操作类型对应的访问次数。
[0120]
进一步地,当第二访问时间信息是数据逻辑对象集对应的第二访问次数时,根据第二访问次数分析数据逻辑对象集的第一数据冷热分析结果的方式也有很对种,在本实施例中并不做限制。例如,在一实施方式中,当第一访问次数表示数据块在业务系统启动至今被访问的总次数时,第二访问次数表示数据逻辑对象集在业务系统启动至今被访问的总次数,可以将数据逻辑对象集的第二访问次数与一个阈值进行比较,当大于该阈值时确定该数据逻辑对象集为热数据,当小于或等于该阈值时,确定该数据逻辑对象集为冷数据。
[0121]
进一步地,在一实施方式中,所述步骤s202中根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数的步骤包括:
[0122]
步骤s2021,根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块分别在距离当前时刻不同远近程度的多个历史时间段内的第一访问次数;
[0123]
在本实施方式中,业务系统的业务逻辑一般是在最近被访问次数较多的数据属于热数据,在时间较久前被访问的次数即使较多也不能够算作为热数据,基于这一具体情况,
可以根据数据块各次被访问时所记录的访问信息统计数据块分别在距离当前时刻不同远近程度的多个历史时间段内的访问次数,也即,分时间段分别统计访问次数。
[0124]
距离当前时刻的历史时间段是指以当前时刻为基准计算的一定时长的历史的时间段,例如,最近1个小时和最近1日是不同远近程度的两个历史时间段,其中,最近1个小时是近的,最近1日是远的。历史时间段的个数在本实施方式中并不做限制,具体可以根据需要设置。各个历史时间段所跨的时长可以是相同的,也可以是不同的。但是考虑到业务系统的业务逻辑一般是越远的时间发生的访问操作越不影响数据的热度评估,所以可以将各个历史时间段所跨的时长由远到近非线性递减。例如,可以设置最近1年、最近6个月、最近3个月、最近1个月、最近1周、最近1日、最近1个小时这几个历史时间段,其中,需要说明的是,各个历史时间段之间没有重叠的时间段,例如,最近1年指的是距离当前时刻一年内6个月以上的这一时间段,其他历史时间段也同理。
[0125]
需要说明的是,在具体实施方式中,在分不同时间段分别统计访问次数的同时,也可以分不同的操作类型分别统计,也即,统计数据块在各个历史时间段内分别以读操作类型被访问的访问次数和以写操作类型被访问的访问次数。
[0126]
需要说明的是,当前时刻是指需要对数据进行冷热分析的时刻。在具体实施方式中,可以每隔一段时间对所存储的数据进行依次冷热分析,但在统计数据块的访问次数时,可以是实时或每隔一段时间统计依次,以统计时刻为当前时刻,当需要对数据进行冷热分析时,获取迄今为止所统计得到的结果。例如,在对数据块的访问次数进行实时统计时,当检测到数据块被访问时,在最近1个小时这一历史时间段内的访问次数上加1,在1个小时之后,在最近1日这一历史时间段内的访问次数上加1,同时在最近1个小时这一历史时间段年内的访问次数上减1。需要说明的是,在具体实施方式中,为避免浪费计算资源,对数据块的访问次数进行统计可以每隔一段时间统计依次,例如每隔一个小时。
[0127]
所述步骤s301中对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数的步骤包括:
[0128]
步骤s3011,对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块在同一所述历史时间段内的所述第一访问次数进行分别累加,得到所述数据逻辑对象集分别在各所述历史时间段内的第二访问次数;
[0129]
相应地,对于数据逻辑对象集,可以将数据逻辑对象集中的数据逻辑对象所对应的各个数据块在同一历史时间段内的第一访问次数进行分别累加,得到数据逻辑对象集分别在各个历史时间段内的第二访问次数。例如,假设数据逻辑对象集中的数据逻辑对象所对应的数据块有3个,历史时间段设置为6个,则将3个数据块在第一个历史时间段内的访问次数相加,得到数据逻辑对象集在第一个历史时间段内的访问次数,将3个数据块在第二个历史时间段内的访问次数相加,得到数据逻辑对象集在第二个历史时间段内的访问次数,依次类推,得到数据逻辑对象集分别在6个历史时间段内的访问次数。
[0130]
在得到数据逻辑对象集分别在各个历史时间段内的第二访问次数后,根据第二访问次数分析得到数据逻辑对象集的冷热数据分析结果的方式有很多种,在此并不限制。例如,在一实施方式中,可以是将数据逻辑对象集在各个历史时间段内的第二访问次数进行加权平均,各个历史时间段所对应的加权权重可以预先设置,较远的历史时间段的权重设
置得较低,较近的历史时间段的权重设置得较高,以符合越远时间发生的访问操作越不影响数据热度的实际业务逻辑;将加权平均得到的结果与一阈值进行比较,若大于该阈值则确定数据逻辑对象集为热数据,若小于或等于该阈值则确定数据逻辑对象集为冷数据。
[0131]
进一步地,在一实施方式中,所述步骤s40包括:
[0132]
步骤s401,将多个所述数据逻辑对象集在同一所述历史时间段内的所述第二访问次数进行比较,以计算所述数据逻辑对象集分别在各所述历史时间段内的访问次数占比;
[0133]
考虑到在业务系统的业务逻辑中,数据的访问次数的相对多少一般更能够体现数据的冷热情况,在本实施方式中,可以将多个数据逻辑对象集在同一历史时间段内的第二访问次数进行比较,计算每个数据逻辑对象集在该历史时间段内的第二访问次数占各个数据逻辑对象集在该历史时间段内的第二访问次数的总数的占比(以下称为访问次数占比)。对于一个数据逻辑对象集而言,每个历史时间段都计算得到一个访问次数占比。
[0134]
步骤s402,根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到所述数据逻辑对象集对应的数据热度,根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果。
[0135]
根据数据逻辑对象集在各个历史时间段内的访问次数占比计算得到数据逻辑对象集对应的数据热度。具体计算方式在本实施方式中并不限制,具体可以根据业务系统的具体业务逻辑来设置,例如,可以将各个历史时间段内的访问次数占比相加或平均,得到数据逻辑对象集对应的数据热度。数据热度越高表示数据逻辑对象集越热。
[0136]
在本实施方式中并不限制具体根据数据热度确定数据逻辑对象集对应的第一数据冷热分析结果的方式,例如,可以将数据热度映射到一个热度等级,采用热度等级作为数据逻辑对象集的第一数据冷热分析结果。
[0137]
进一步地,在一实施方式中,所述步骤s402中根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到所述数据逻辑对象集对应的数据热度的步骤包括:
[0138]
步骤s4021,将所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比按照各所述历史时间段对应的权重进行加权求和,得到所述数据逻辑对象集对应的数据热度,其中,距离当前时刻越远的所述历史时间段的权重越小。
[0139]
考虑到业务系统的业务逻辑一般是越远时间发生的访问操作越不影响数据热度,可以设置各个历史时间段对应的权重,且将距离当前时刻越远的历史时间段的权重设置得越小,对数据逻辑对象集在各个历史时间段内的访问次数占比按照对应历史时间段的权重进行加权求和,得到的结果作为数据逻辑对象集的数据热度。
[0140]
通过分别统计数据逻辑对象集在距离当前时刻不同远近程度的多个历史时间段内的访问次数,并计算数据逻辑对象集在各个历史时间段内的访问次数占比,将各个历史时间段内的访问次数占比按照对应历史时间段的权重进行加权求和得到数据逻辑对象集的数据热度,并将距离当前时刻越远的历史时间段的权重设置得越小,使得数据逻辑对象集的数据热度的计算更加符合业务系统的实际业务逻辑,进而使得分析得到的数据冷热分析结果更加合理。
[0141]
进一步地,在一实施方式中,所述步骤s402中根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果的步骤包括:
[0142]
步骤s4022,当所述数据逻辑对象集对应的所述数据热度小于第一预设阈值时,将所述数据逻辑对象集确定为冷数据;
[0143]
步骤s4023,当所述数据逻辑对象集对应的所述数据热度大于或等于所述第一预设阈值时,将所述数据逻辑对象集确定为热数据。
[0144]
在本实施方式中,可以将数据逻辑对象集与第一预设阈值进行比较来确定数据逻辑对象集是热数据还是冷数据。第一预设阈值可以根据需要进行设置,在本实施方式中并不做限制。
[0145]
进一步地,基于上述第一和/或第二实施例,提出本发明数据冷热分析方法第三实施例,在本实施例中,所述步骤s40之后,还包括:
[0146]
步骤s50,当所述第一数据冷热分析结果表征所述数据逻辑对象集为冷数据时,根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集中所述数据逻辑对象对应的第三访问时间信息;
[0147]
当数据逻辑对象集的第一数据冷热分析结果是该数据逻辑对象集为冷数据时,可以将该数据逻辑对象集中数据逻辑对象所对应的数据块迁移至低速存储设备,在此基础上,可以进一步分析对该数据逻辑对象集中的数据逻辑对象进行冷热分析,以确定该整体访问量地而被作为冷数据的该数据逻辑对象集中是否存在局部热数据,当存在局部热数据时,可以采用缓存的方式来提高该局部热数据被访问时的访问效率。
[0148]
具体地,可以根据数据逻辑对象集中数据逻辑对象所对应的数据块的第一访问时间信息,统计该数据逻辑对象集中数据逻辑对象对应的访问时间信息(以下称为第三访问时间信息)。根据第一访问时间信息统计第三访问时间信息的具体实施方式可以参照根据第一访问时间信息统计第二访问时间信息的具体实施方式,在此不做赘述。
[0149]
步骤s60,根据所述第三访问时间信息分析得到所述数据逻辑对象集中所述数据逻辑对象对应的第二数据冷热分析结果;
[0150]
根据第三访问时间信息分析得到数据逻辑对象集中数据逻辑对象对应的数据冷热分析结果(以下称为第二数据冷热分析结果)的具体实施方式,可以参照根据第二访问时间信息分析得到数据逻辑对象集的第一数据冷热分析结果的具体实施方式,在此不做赘述。
[0151]
步骤s70,将作为冷数据的所述数据逻辑对象集中各所述数据逻辑对象对应的各所述数据块迁移至预设低速存储设备,并当根据所述第二数据冷热分析结果确定所述数据逻辑对象集中存在属于热数据的目标数据逻辑对象时,将所述目标数据逻辑对象对应的所述数据块从所述预设低速存储设备中缓存至内存中。
[0152]
将作为冷数据的数据逻辑对象集中各个数据逻辑对象对应的各个数据块迁移至预设低速存储设备。其中,预设低速存储设备可以是本地存储设备,也可以是远程存储设备,低速是相对于存储当前数据块的存储设备而言的。
[0153]
当根据第二数据冷热分析结果确定数据逻辑对象集中存在属于热数据的数据逻辑对象(以下称为目标数据逻辑对象以示区分)时,说明目标数据逻辑对象为该数据逻辑对象集中的局部热数据,可以将该目标数据逻辑对象对应的数据块从预设低速存储设备中缓存至内存中,以提高对该目标数据逻辑对象的访问效率。
[0154]
进一步地,在一实施方式中,当内存中缓存的目标数据逻辑对象在预设时长内未
被访问时,可以从内存中删除该目标数据逻辑对象对应的数据。
[0155]
可以理解的是,由于作为冷数据的数据逻辑对象集已经作为一个整体迁移至了低速存储设备,所以当其中的局部热数据实际上没有被访问而被作为冷数据时,可以无需再执行将该局部热数据迁移至低速存储设备的操作,只需要删除缓存在内存中的该局部热数据即可,从而能够实现提高冷数据迁移效率的效果,也即能够提高对冷热数据进行分层存储的效率。
[0156]
以下以一个例子示例性地说明数据逻辑对象集和数据逻辑对象的冷热分析过程。
[0157]
记录的数据块的访问次数如下表所示:
[0158]
数据块地址读操作类型的访问次数写操作类型的访问次数db0001r{a}{b}{c}{d}{e}{f}{g}w{a}{b}{c}{d}{e}{f}{g}db0002r{a}{b}{c}{d}{e}{f}{g}w{a}{b}{c}{d}{e}{f}{g}
……
r{a}{b}{c}{d}{e}{f}{g}w{a}{b}{c}{d}{e}{f}{g}
[0159]
以上{a}{b}{c}{d}{e}{f}{g}分别为最近1年、最近6月、最近3月、最近1月、最近1周、最近1日、最近1个小时的访问次数。
[0160]
根据数据块的访问次数,统计获得每个数据逻辑对象的访问次数:
[0161]
数据逻辑对象读操作类型的访问次数写操作类型的访问次数dataobjectar{a}{b}{c}{d}{e}{f}{g}w{a}{b}{c}{d}{e}{f}{g}dataobjectbr{a}{b}{c}{d}{e}{f}{g}w{a}{b}{c}{d}{e}{f}{g}
……
r{a}{b}{c}{d}{e}{f}{g}w{a}{b}{c}{d}{e}{f}{g}
[0162]
根据数据块的访问次数,统计获得每个数据逻辑对象集的访问次数:
[0163][0164]
为保证统计的客观性,避免受局部和不均衡访问导致的统计偏差,对不同历史时间段设置不同权重:
[0165]
时间段abcdefg权重1248162445
[0166]
计算数据逻辑对象集的数据访问占比,在此按照数据逻辑对象集的(访问次数/各个数据逻辑对象集的总访问次数)*100来计算占比,也即,在具体实施方式中,访问次数占比不一定是采用百分比形式。
[0167][0168]
计算数据逻辑对象集的数据热度:
[0169]
数据逻辑对象集读写数据热度loigc_dataobject_dxxx342.4516.7459.19loigc_dataobject_dxxx1_dxxx2303
[0170]
计算数据逻辑对象的数据热度:
[0171][0172]
由以上数据可以获知,数据逻辑对象集层面数据热度:
[0173]
loigc_dataobject_dxxx1_dxxx小于loigc_dataobject_dxxx3
[0174]
可认为loigc_dataobject_dxxx1_dxxx2处于冷数据状态。除了采用相对比较来区分冷热度的方式,也可以将数据热度低于指定阈值的数据逻辑对象集归类到冷数据。
[0175]
数据逻辑对象集内部数据热度:
[0176]
dataobjectd》dataobjectc》dataobjectb》dataobjecta
[0177]
可认为dataobjecta、dataobjectb、dataobjectc处于冷数据状态、dataobjectd处于局部热数据状态。
[0178]
可将逻辑数据对象dataobjecta、dataobjectb、dataobjectc、dataobjectd加入冷数据迁移队列,待后续迁移处理。dataobjectd是属于整体冷数据中的局部相对热数据,将dataobjectd加入缓存队列,待后续数据缓存处理。读取冷数据迁移队列,将队列中的冷数据迁移至低速存储设备,读取缓冲队列中的数据缓存至内存中。
[0179]
此外,本发明实施例还提出一种数据冷热分析装置,参照图3,所述数据冷热分析装置包括:
[0180]
登记模块10,用于对各数据访问操作待访问的数据逻辑对象进行登记,根据所登记的数据逻辑对象信息确定数据逻辑对象集,其中,一个所述数据逻辑对象集中包括具有访问相关性的一组所述数据逻辑对象;
[0181]
记录模块20,用于记录各所述数据访问操作所实际访问的数据块对应的第一访问时间信息;
[0182]
统计模块30,用于根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集对应的第二访问时间信息;
[0183]
分析模块40,用于根据第二访问时间信息分析得到所述数据逻辑对象集对应的第一数据冷热分析结果。
[0184]
进一步地,所述登记模块10还用于:
[0185]
对各数据访问操作待访问的主数据逻辑对象和与所述主数据逻辑对象对应的相关数据逻辑对象进行登记;
[0186]
将同一所述数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集;
[0187]
对于各所述数据访问操作中的任一第一数据访问操作,若确定存在一第二数据访问操作所登记的所述相关数据逻辑对象与所述第一数据访问操作所登记的所述主数据逻辑对象相同,则将所述第一数据访问操作与所述第二数据访问操作所登记的所述主数据逻辑对象和所述相关数据逻辑对象划分至同一数据逻辑对象集。
[0188]
进一步地,所述记录模块20还用于:
[0189]
记录各所述数据访问操作实际访问数据块时的访问信息,其中,所述访问信息包括所述数据块被访问的时间;
[0190]
根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块的第一访问次数,将所述第一访问次数作为所述数据块对应的第一访问时间信息;
[0191]
所述统计模块30还用于:
[0192]
对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问次数进行累加,得到所述数据逻辑对象集对应的第二访问次数,将所述第二访问次数作为所述数据逻辑对象集对应的第二访问时间信息。
[0193]
进一步地,所述记录模块20还用于:
[0194]
根据所述数据块各次被访问时所记录的所述访问信息统计所述数据块分别在距离当前时刻不同远近程度的多个历史时间段内的第一访问次数;
[0195]
所述统计模块30还用于:
[0196]
对所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块在同一所述历史时间段内的所述第一访问次数进行分别累加,得到所述数据逻辑对象集分别在各所述历史时间段内的第二访问次数;
[0197]
所述分析模块40还用于:
[0198]
将多个所述数据逻辑对象集在同一所述历史时间段内的所述第二访问次数进行比较,以计算所述数据逻辑对象集分别在各所述历史时间段内的访问次数占比;
[0199]
根据所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比计算得到
所述数据逻辑对象集对应的数据热度,根据所述数据热度确定所述数据逻辑对象集对应的第一数据冷热分析结果。
[0200]
进一步地,所述分析模块40还用于:
[0201]
将所述数据逻辑对象集在各所述历史时间段内的所述访问次数占比按照各所述历史时间段对应的权重进行加权求和,得到所述数据逻辑对象集对应的数据热度,其中,距离当前时刻越远的所述历史时间段的权重越小。
[0202]
进一步地,所述分析模块40还用于:
[0203]
当所述数据逻辑对象集对应的所述数据热度小于第一预设阈值时,将所述数据逻辑对象集确定为冷数据;
[0204]
当所述数据逻辑对象集对应的所述数据热度大于或等于所述第一预设阈值时,将所述数据逻辑对象集确定为热数据。
[0205]
进一步地,所述统计模块30还用于:
[0206]
当所述第一数据冷热分析结果表征所述数据逻辑对象集为冷数据时,根据所述数据逻辑对象集中所述数据逻辑对象所对应的各所述数据块的所述第一访问时间信息,统计得到所述数据逻辑对象集中所述数据逻辑对象对应的第三访问时间信息;
[0207]
所述分析模块40还用于:
[0208]
根据所述第三访问时间信息分析得到所述数据逻辑对象集中所述数据逻辑对象对应的第二数据冷热分析结果;
[0209]
所述数据冷热分析装置还包括:
[0210]
迁移模块,用于将作为冷数据的所述数据逻辑对象集中各所述数据逻辑对象对应的各所述数据块迁移至预设低速存储设备,并当根据所述第二数据冷热分析结果确定所述数据逻辑对象集中存在属于热数据的目标数据逻辑对象时,将所述目标数据逻辑对象对应的所述数据块从所述预设低速存储设备中缓存至内存中。
[0211]
本发明数据冷热分析装置的具体实施方式的拓展内容与上述数据冷热分析方法各实施例基本相同,在此不做赘述。
[0212]
此外,本发明实施例还提出一种计算机可读存储介质,所述存储介质上存储有数据冷热分析程序,所述数据冷热分析程序被处理器执行时实现如下所述的数据冷热分析方法的步骤。
[0213]
本发明数据冷热分析设备、系统和计算机可读存储介质各实施例,均可参照本发明数据冷热分析方法各个实施例,此处不再赘述。
[0214]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0215]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0216]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做
出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0217]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1