识别冷热数据的方法、装置、设备及介质与流程

文档序号:38035662发布日期:2024-05-17 13:20阅读:11来源:国知局
识别冷热数据的方法、装置、设备及介质与流程

本发明涉及存储设备的,尤其涉及一种识别冷热数据的方法、装置、设备及介质。


背景技术:

1、冷热数据通常用于描述数据的访问频率或者数据的使用情况,具体地,热数据指的是经常被访问或者使用的数据,冷数据指的是不经常被访问或者使用的数据。

2、在一些相关技术中,大多数是通过设置阈值来划分冷热数据,该方法难以设置适用于所有场景的阈值,对于高于或低于阈值的数据就无法继续划分。

3、或一些相关的技术中,采用了机器学习算法(如k-means),但没有针对一维数据进行优化,而是对一维数据进行升维,把简单的问题复杂化,在时间复杂度和空间复杂度上没有进一步优化,因此其实际实现代价过高。


技术实现思路

1、为了克服现有技术方案的不足,本发明实施例提供了一种识别冷热数据的方法、装置、设备及介质。

2、本发明解决其技术问题所采用的技术方案是:

3、第一方面,本发明实施例提供了一种识别冷热数据的方法,所述方法应用于存储设备的控制器中,所述控制器与主机端建立通讯连接,所述方法包括:

4、接收所述主机端发送的多个写入请求指令;

5、更新逻辑地址分区中对应于每一所述写入请求指令的数据频率信息,以得到统计结果;

6、将所述统计结果中的每一所述数据频率信息根据预置的排序条件进行排列后,统计各所述数据频率信息的重复数量并进行排列,以得到重数序列;

7、对所述重数序列进行第一次划分处理,以得到多个子序列;

8、计算多个所述子序列的转折点和内聚度量的总和,以得到计算结果;

9、对所述计算结果进行第二次划分处理,以得到作为分类结果的多个逻辑地址分区。

10、作为本发明一种优选的技术方案,所述更新逻辑地址分区中对应于每一所述写入请求指令的数据频率信息,以得到统计结果之后,还包括:

11、在所述统计结果中的每一所述数据频率信息中的频率统计值进行加一。

12、作为本发明一种优选的技术方案,所述在所述统计结果中的每一所述数据频率信息中的频率统计值进行加一之后,还包括:

13、判断所述频率统计值是否满足预设的周期条件;

14、若所述频率统计值满足所述周期条件,则对所述统计结果中的每一所述数据频率信息进行衰减;

15、若所述频率统计值不满足所述周期条件,则执行所述将所述统计结果中的每一所述数据频率信息按照频率的次数量进行排列的步骤。

16、作为本发明一种优选的技术方案,所述对所述计算结果进行第二次划分处理,以得到作为分类结果的多个逻辑地址分区,包括:

17、按照预置的迭代规则对所述计算结果进行划分处理,以得到作为所述分类结果的多个逻辑地址分区。

18、作为本发明一种优选的技术方案,所述按照预置的迭代规则对计算结果进行划分处理之后,还包括:

19、判断所述计算结果中的内聚度量是否满足终止迭代条件;

20、若所述计算结果中的内聚度量满足所述终止迭代条件,则以各所述逻辑地址分区作为分类结果;

21、若所述计算结果中的内聚度量不满足所述终止迭代条件,则执行所述计算多个所述子序列的转折点和内聚度量的总和,以得到计算结果的步骤。

22、作为本发明一种优选的技术方案,所述将所述统计结果中的每一所述数据频率信息根据预置的排序条件进行排列,以得到重数序列,包括:

23、计算每一所述数据频率信息的重复数量;

24、根据每一所述数据频率信息的重复数量由高至低对其进行排序,以得到重数序列。

25、第二方面,本发明实施例还提供一种识别冷热数据的装置,所述装置设置于存储设备的控制器中,所述控制器与主机端建立通讯连接,所述装置包括:

26、接收模块,用于接收所述主机端发送的多个写入请求指令;

27、更新模块,用于更新逻辑地址分区中对应于每一所述写入请求指令的数据频率信息,以得到统计结果;

28、排列模块,用于将所述统计结果中的每一所述数据频率信息根据预置的排序条件进行排列后,统计各所述数据频率信息的重复数量并进行排列,以得到重数序列;

29、第一划分模块,用于对所述重数序列进行第一次划分处理,以得到多个子序列;

30、计算模块,用于计算多个所述子序列的转折点和内聚度量的总和,以得到计算结果;

31、第二划分模块,用于对所述计算结果进行第二次划分处理,以得到作为分类结果的多个逻辑地址分区。

32、作为本发明一种优选的技术方案,所述更新模块还包括附加模块,用于在所述统计结果中的每一所述数据频率信息中的频率统计值进行加一。

33、第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线;其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;

34、存储器,用于存放计算机程序;

35、处理器,用于执行存储器上所存放的程序时,实现前述中任一项所述的识别冷热数据的方法的步骤。

36、第四方面,本发明实施例再提供了一种计算机可读存储的介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现前述中任一项所述的识别冷热数据的方法的步骤

37、与现有技术相比,本发明的有益效果是:

38、通过将统计结果中的每一数据频率信息根据预置的排序条件进行排列,以得到重数序列,对重数序列进行第一次划分处理,以得到多个子序列,计算多个子序列的转折点和内聚度量的总和,以得到计算结果,对计算结果进行第二次划分处理,以得到用于作为分类结果的多个逻辑地址分区,以便后续主机通过查找请求指令所属的逻辑地址分区,可在分类结果中查找其所属类别,从而便于识别写各冷热数据。



技术特征:

1.一种识别冷热数据的方法,其特征在于,所述方法应用于存储设备的控制器中,所述控制器与主机端建立通讯连接,所述方法包括:

2.根据权利要求1所述的识别冷热数据的方法,其特征在于,所述更新逻辑地址分区中对应于每一所述写入请求指令的数据频率信息,以得到统计结果之后,还包括:

3.根据权利要求2所述的识别冷热数据的方法,其特征在于,所述在所述统计结果中的每一所述数据频率信息中的频率统计值进行加一之后,还包括:

4.根据权利要求1所述的识别冷热数据的方法,其特征在于,所述对所述计算结果进行第二次划分处理,以得到作为分类结果的多个逻辑地址分区,包括:

5.根据权利要求4所述的识别冷热数据的方法,其特征在于,所述按照预置的迭代规则对计算结果进行划分处理之后,还包括:

6.根据权利要求1所述的识别冷热数据的方法,其特征在于,所述统计各所述数据频率信息的重复数量并进行排列,以得到重数序列,包括:

7.一种识别冷热数据的装置,其特征在于,所述装置设置于存储设备的控制器中,所述控制器与主机端建立通讯连接,所述装置包括:

8.根据权利要求7所述的识别冷热数据的装置,其特征在于,所述更新模块还包括附加模块,用于在所述统计结果中的每一所述数据频率信息中的频率统计值进行加一。

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、通信接口、存储器和通信总线;其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;

10.一种计算机可读存储的介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的识别冷热数据的方法的步骤。


技术总结
本发明公开了一种识别冷热数据的方法、装置、设备及介质,其中方法包括接收主机端发送的多个写入请求指令;更新逻辑地址分区中对应于每一写入请求指令的数据频率信息,以得到统计结果;将统计结果中的每一数据频率信息根据预置的排序条件进行排列后,统计各数据频率信息的重复数量并进行排列,以得到重数序列;对重数序列进行第一次划分处理,以得到多个子序列;计算多个子序列的转折点和内聚度量的总和,以得到计算结果;对计算结果进行第二次划分处理,以得到作为分类结果的多个逻辑地址分区。后续主机可通过查找请求指令所属的逻辑地址分区,可在分类结果中查找其所属类别,从而便于识别写各冷热数据。

技术研发人员:朱韬锦,徐泽明,刘欢,陈建雄,李敏秋,张睦
受保护的技术使用者:深圳忆联信息系统有限公司
技术研发日:
技术公布日:2024/5/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1